[发明专利]学习语境感知预测关键短语的系统和方法在审
申请号: | 201980088654.5 | 申请日: | 2019-12-11 |
公开(公告)号: | CN113302634A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | V·A·阿尔度洛夫;A·加马拉马达卡;T-C·卢 | 申请(专利权)人: | 赫尔实验室有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 张亚静;王小东 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 学习 语境 感知 预测 关键 短语 系统 方法 | ||
描述了一种学习和预测关键短语的系统。该系统基于历史预测问题的数据集、所述历史预测问题针对关注量的相关联的时间序列数据以及相关联的关键字集合来学习。该系统学习在给定相关联的关键字集合和预测关注量的最优关键字集合的情况下要采取的最优动作策略。在给定新的预测问题的情况下,系统从新的预测问题中提取初始关键字集合,所述初始关键字集合被扰动以生成最优预测关键短语集合。提取最优预测关键短语集合的关键短语时间序列数据,以用于生成针对关注值的将来值的预测。预测可以用于诸如在线广告之类的各种目的。
政府权利
本发明是在MATRICS(具有智能人群溯源的机器辅助分析分类(Machine-aidedAnalytic Triage with Intelligent Crowd Sourcing))第2017-17061500006号美国政府合同的支持下完成的。政府具有本发明的某些权利。
相关申请的交叉引用
本申请要求于2019年2月11日提交的美国临时申请No.62/804,016的权益,并且是该申请No.62/804,016的非临时专利申请,其全部内容通过引用并入本文。
本申请还是于2019年3月7日提交的美国临时申请No.62/815,304的非临时专利申请,其全部内容通过引用并入本文。
发明背景
(1)技术领域
本发明涉及一种学习关键短语的系统,并且更具体地,涉及一种在时间序列预测(time-series forecasting)中选择最优预测符(optimal predictor)的系统。
(2)相关技术的描述
时间序列预测是分析师和决策制定者利用可用信息来了解关注值的技术。例如,金融政策制定者必须结合并能够准确地预测资源的价值,以便分配关税和税款,同时避免损害长期经济。结果,这样的政策制定者需要构建准确的预测模型来预测关注值。研究人员已经尝试设计用于生成这种预测的各种技术。作为示例,贝叶斯结构时间序列(BSTS)模型已经显示出利用来自搜索引擎和社交媒体的关键短语趋势数据来有效地预测经济指标(indicator),诸如失业(参见并入的参考文献列表,参考文献1至4)、疾病传播(参见参考文献5至6)和民事动乱的发生(参见参考文献7至8)。虽然这种研究表明模型可以用关键短语来预测经济指标,但是发现传统上这些关键短语需要专家领域知识,并且它们通常不能在具有类似或相关主题的后续预测问题中直接重复使用。
此外,当前时间序列预测模型专注于使用大特征集合,其会被输入模型大小任意约束(参见参考文献1至3)。它们依赖于极大关键短语集和一次性(1-shot)相关测试,这有时会产生虚假预测符。这些模型寻求对历史数据的模型拟合最大化,但是它们的预测能力没有扩展到相同类型的将来数据,或者扩展到语境相似的数据。结果,需要人为干预和主观决策来对特定模型所使用的关键短语进行过滤。
即使可以使用现有模型使搜索自动化,但通常不可能产生非常大的特征集合的计数(例如,英语语言中的每一个两个字的短语),并且因此初始特征选择步骤必须相对积极。相关地,通过搜索界面进行交互意味着没有简单的方式来检索对象,例如在文档语料库中出现至少20次的所有字的集合,或者用于计算术语频率-逆文档频率(tf-idf)的输入(参见参考文献9)。
过去的工作通常专注于预测与美国有关的经济序列,这仅是出于经济和社会媒体数据的可用性的原因。然而,最近的工作已经表明,即使对于相当小的经济体,居民的在线搜索(即,Google Trends数据)也可以成功地用于宏观经济预测(参见参考文献3)。
因此,持续需要一种在预测中学习最优预测符的系统,该系统客观地优化了语境内的预测符选择策略,以更有效地构建可推广模型并选择用于准确预测的指标。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赫尔实验室有限公司,未经赫尔实验室有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980088654.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:蓄电元件和蓄电元件的制造方法
- 下一篇:图像形成装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理