[发明专利]阅读理解方法及装置有效
申请号: | 201910429805.0 | 申请日: | 2019-05-22 |
公开(公告)号: | CN110210021B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 李弘宇;刘璟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/205 | 分类号: | G06F40/205;G06F40/279;G06K9/62 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 阅读 理解 方法 装置 | ||
本发明提出一种阅读理解方法及装置,其中,该方法包括:通过获取预设的目标问题和待阅读的文本;根据预设的阅读理解模型对所述待阅读的文本进行理解分析,生成所述目标问题的答案类型概率、答案文本以及对应的置信度;根据所述答案类型概率、所述答案文本以及对应的置信度确定与所述目标问题对应的目标答案。从而基于预设的阅读理解模型对目标问题和待阅读文本很好地理解出高质量的长答案文本或短答案文本,都不同的实际情形均能表现良好,不再局限于现有的专用模型只对一种答案类型的答案的理解效果好,且相比现有的通用模型提高了对不同答案类型的答案的理解效果。
技术领域
本发明涉及人工智能领域,尤其涉及一种阅读理解方法及装置。
背景技术
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理、问答系统和专家系统等。
目前,将待回答的问题和相关的阅读材料输入到训练完毕的阅读理解模型进行人工智能式阅读理解已经越来越广泛。现有的阅读理解模型分主要有专用模型和通用模型:
专用模型是采用同一答案类型的阅读材料训练得到的,但专用模型的局限性在于只能对一种答案类型的理解效果比较好。例如采用海量的长答案类型的样本得到的长答案模型,采用海量的短答案类型的样本训练得到的短答案模型,由于长答案模型和短答案模型有着不同的模型参数和训练数据,长答案模型对长答案的理解效果比较好,而对短答案的理解效果不好,短答案模型只能对短答案的理解效果比较好,而对长答案的理解效果不好。
通用模型尽管是采用不同答案类型的样本联合训练得到的,但通用模型的结构参数并没有针对不同答案类型的答案进行分别设置,而是共用一套模型参数,造成对长答案的理解效果比不上长答案模型,对短答案的理解效果比不上短答案模型,模型的阅读效果不佳。
因此,如何更好地进行阅读理解成为亟待解决的技术问题。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种阅读理解方法。
本发明的第二个目的在于提出一种阅读理解装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种计算机可读存储介质。
为达上述目的,本发明第一方面实施例提出了一种阅读理解方法,包括:
获取预设的目标问题和待阅读的文本;
根据预设的阅读理解模型对所述待阅读的文本进行理解分析,生成所述目标问题的答案类型概率、答案文本以及对应的置信度;
根据所述答案类型概率、所述答案文本以及对应的置信度确定与所述目标问题对应的目标答案。
在一种可能的实现方式中,所述根据所述答案文本类型概率、所述答案文本以及对应的置信度确定与所述目标问题对应的目标答案包括:
获取长答案类型概率和长答案文本的置信度的第一乘积、短答案类型概率和短答案文本的置信度的第二乘积;判断所述第一乘积是否大于所述第二乘积;
若是,则将所述长答案文本确定为与所述目标问题对应的目标答案;
若否,则将所述短答案文本确定为与所述目标问题对应的目标答案。
在一种可能的实现方式中,在所述获取预设的目标问题和待阅读的文本之前,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910429805.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通讯地址标准化的系统及其方法
- 下一篇:标题识别方法及装置