[发明专利]一种文本语义相似度评估方法、系统、介质和设备有效
申请号: | 201910782086.0 | 申请日: | 2019-08-23 |
公开(公告)号: | CN110688452B | 公开(公告)日: | 2022-09-13 |
发明(设计)人: | 孙健;汤宇腾;彭德光;白梨;唐贤伦 | 申请(专利权)人: | 重庆兆光科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 重庆渝之知识产权代理有限公司 50249 | 代理人: | 陆蕾 |
地址: | 400000 重庆市璧山区璧泉街道*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种文本语义相似度评估方法、系统、介质和设备,包括获取文本数据,创建文本数据集,并通过无监督学习方式构建语义向量模型;根据所述语义向量模型对所述文本数据集中的文本进行排序;专业人员根据专业知识校准文本排序结果,并根据校准结果创建训练样本集;将所述训练样本集作为神经网络的输入,训练文本语义相似模型;将用户的询问语句输入所述语义相似模型,获取文本检索结果;在大量词频相似或语义具有专业知识情境下,本发明能有效提高文本检索的效率和准确性。 | ||
搜索关键词: | 一种 文本 语义 相似 评估 方法 系统 介质 设备 | ||
【主权项】:
1.一种文本语义相似度评估方法,其特征在于,包括:/n获取文本数据,创建文本数据集,并通过无监督学习方式构建语义向量模型;/n根据所述语义向量模型对所述文本数据集中的文本进行排序;/n专业人员根据专业知识校准文本排序结果,并根据校准结果创建训练样本集;/n将所述训练样本集作为神经网络的输入,训练文本语义相似模型;/n将用户的询问语句输入所述语义相似模型,获取文本检索结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆兆光科技股份有限公司,未经重庆兆光科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910782086.0/,转载请声明来源钻瓜专利网。