[发明专利]机器阅读理解以及减少候选数据集规模的方法、装置有效

申请号：	201810812763.4	申请日：	2018-07-23
公开（公告）号：	CN109255012B	公开（公告）日：	2021-04-30
发明（设计）人：	杨志明;时迎成	申请（专利权）人：	深思考人工智能机器人科技（北京）有限公司
主分类号：	G06F16/33	分类号：	G06F16/33
代理公司：	北京德琦知识产权代理有限公司 11018	代理人：	谢安昆;宋志强
地址：	100085 北京市海淀区上***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	公开了机器阅读理解的实现方法，根据问题类型过滤第一数据集合得到过滤后的第二数据集合；将问题与第二数据集合中的数据i进行语义匹配，得数据i的语义匹配得分；将问题与所述数据i进行最大覆盖度计算得到数据i的特征匹配得分；加权所述数据i的语义匹配得分和特征匹配得分得到问题与数据i的匹配得分；对数据i按照多文档投票算法计算数据i的投票得分，根据数据i的匹配得分和投票得分，计算出数据i的最终得分；按照最终得分的降序选择序列中前n个数据，作为候选数据集；将所述候选数据集输入基线模型，基于基线模型对输入数据集进行答案预测，得到所述问题的候选答案集。本申请实现了对数据集合的排序，对问题抽取出有效地答案。
搜索关键词：	机器阅读理解以及减少候选数据规模方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种机器阅读理解的实现方法，其特征在于，该方法包括，根据问题类型过滤第一数据集合，得到过滤后的第二数据集合；将问题与第二数据集合中的数据i进行语义匹配，得数据i的语义匹配得分；将问题与所述数据i进行最大覆盖度计算，得到数据i的特征匹配得分；加权所述数据i的语义匹配得分和特征匹配得分，得到问题与数据i的匹配得分；对数据i按照多文档投票算法计算数据i的投票得分；根据数据i的匹配得分和投票得分，计算出数据i的最终得分；按照所计算得到的最终得分的降序，对所述第二数据集合中的数据进行排序，选择序列中前n个数据，作为候选数据集；将所述候选数据集作为基线模型的输入数据集，基于基线模型对输入数据集进行答案预测，得到所述问题的候选答案集，其中，i为不大于第二数据集合中数据总数的自然数，n为基线模型的输入数据集合中的数据个数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深思考人工智能机器人科技（北京）有限公司，未经深思考人工智能机器人科技（北京）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810812763.4/，转载请声明来源钻瓜专利网。

上一篇：一种基于人工智能的搜索提示方法及电子设备
下一篇：理赔决策方法、装置、计算机设备和存储介质

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]机器阅读理解以及减少候选数据集规模的方法、装置有效

专利文献下载