[发明专利]问答系统优化方法、装置、计算机设备及存储介质在审
申请号: | 201910699484.6 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110569419A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 王科强;骆迅;顾婷婷;倪渊 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/31;G06F16/35 |
代理公司: | 11015 北京英特普罗知识产权代理有限公司 | 代理人: | 林彦之 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 媒体平台 内容相关 自然语言处理技术 计算机设备 存储介质 匹配内容 搜索结果 问答系统 响应消息 直接反馈 信息库 匹配 搜索 关联 优化 | ||
本发明公开了问答系统优化方法、装置、计算机设备及存储介质,属于自然语言处理技术领域。本发明通过判断问答请求中的关键字是否与媒体平台中的内容相关,从而识别用户输入的问答请求是否与该媒体平台的内容相关,对于不相关的问答请求可直接反馈无匹配内容的响应消息;对于相关的问答请求则进一步地在与媒体平台关联的信息库中搜索相应的数据,以准确的获取与该问答请求匹配的搜索结果,从而提升回答内容的准确性及用户的体验效果。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及问答系统优化方法、装置、计算机设备及存储介质。
背景技术
目前门户网站,譬如学校、医院、政府机构的官方网站,拥有着大量该机构相关信息,用户(学生、病人、公民)可以通过网站的导航或者搜索内容自己需要的关键信息。通过导航用户需要一个一个进行点击并查看以筛选信息的有用性。另外,如果门户网站的导航条目较为混乱,那么需要用户消耗大量的时间进行鉴别。而门户网站的搜索功能,一般只能对关键字进行搜索,由于大多数门户网站的数据量较少,发布的信息一般比较单一。如果用户使用的关键词不适合,尽管语义上是合适的,门户网站搜索引擎也很难返回符合用户意愿的结果。用户需要通过使用不同的关键词(同义词)进行多次尝试,才有可能得到想要的结果,搜索性能差查全率低。
发明内容
针对现有的官方门户网站搜索性能差的问题,现提供一种优化搜索性能提升搜索准确率的问答系统优化方法、装置、计算机设备及存储介质。
为实现上述目的,本发明提供一种问答系统优化方法,应用于媒体平台中,包括:
S1.获取问答请求;
S2.提取所述问答请求中的关键字,判断所述关键字是否与所述媒体平台中的内容相关,若是,执行步骤S3;若否,执行步骤S4;
S3.对所述关键字进行识别,根据识别结果搜索与所述媒体平台关联的信息库,并输出搜索结果;
S4.输出所述问答请求与所述媒体平台的内容不匹配的回答消息。
优选的,所述媒体平台包括门户网站平台,和/或微信公众号平台。
优选的,在所述步骤S2中判断所述关键字是否与所述媒体平台中的内容相关,包括:
采用语料分类模型对所述关键字进行分类,获取所述关键字的类别信息,将所述类别信息与所述媒体平台关联的类型数据进行匹配,获取所述类别信息与所述类型数据的匹配度,判断所述匹配度是否大于预设阈值,若是,执行步骤S3;若否,执行步骤S4。
优选的,所述语料分类模型为从互联网爬取数据进行语料分类训练获得的模型。
优选的,所述信息库采用倒排索引文件,所述倒排索引文件的索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。
优选的,所述步骤S3,对所述关键字进行识别,根据识别结果搜索与所述媒体平台关联的信息库,并输出搜索结果,包括:
对所述关键字进行识别,将所述识别结果与所述倒排索引文件中的属性值进行匹配,依据所述识别结果与属性值的相关度,获取相关度最高的属性值对应的记录地址,将所述记录地址中的内容作为所述搜索结果输出;
其中,所述记录地址为网页地址,或文本文件的存储地址。
优选的,所述步骤S3,对所述关键字进行识别,根据识别结果搜索与所述媒体平台关联的信息库,并输出搜索结果,包括:
采用语义匹配模型对所述关键字进行识别,获取与所述关键字关联的搜索词,将所述关键字及所述搜索词与所述信息库进行匹配,输出匹配度最高的数据信息;
所述搜索词为所述关键字的同义词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910699484.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:学历信息验证方法以及装置
- 下一篇:一种基于化工行业的搜索方法