[发明专利]基于文本及语义的相似度计算方法、服务器及存储介质在审
申请号: | 201910496311.4 | 申请日: | 2019-06-10 |
公开(公告)号: | CN110222154A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 徐乐乐 | 申请(专利权)人: | 武汉斗鱼鱼乐网络科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 武汉河山金堂专利事务所(普通合伙) 42212 | 代理人: | 胡清堂;陈懿 |
地址: | 430000 湖北省武汉市东湖新技术开发区软*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于文本及语义的相似度计算方法、服务器及存储介质,属于自然语言处理领域。该方法包括:选取任意两个向量化表示的语句文本,通过计算两个文本在向量空间上的投影距离,得到两个文本的语义相似度,再根据两个文本的文本重合部分在两个语句文本构成的全局文本中的占比,计算文本相似度,分别设定文本及语义相似度的权重,综合计算文本及语义相似度评分。通过该技术方案,可以兼顾会话文本的语义及文本相似度,为计算机会话提供多样化的内容表达,有效避免单一重复的回复。 | ||
搜索关键词: | 文本 语义相似度 语义 文本相似度 相似度计算 存储介质 语句 服务器 自然语言处理 会话提供 内容表达 全局文本 投影距离 向量空间 综合计算 向量化 会话 重合 权重 回复 计算机 重复 | ||
【主权项】:
1.一种基于文本及语义的相似度计算方法,其特征在于,包括:从语料库中选取任意两个向量化表示的语句文本;通过计算两个语句文本在向量空间上的投影距离,得到所述两个语句文本的语义相似度;根据所述两个语句文本的文本重合部分在两个语句文本构成的全局文本中的占比,计算所述两个语句文本的文本相似度;分别设定所述两个语句文本的文本相似度和语义相似度的权重,综合计算所述两个语句文本的文本及语义相似度评分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼鱼乐网络科技有限公司,未经武汉斗鱼鱼乐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910496311.4/,转载请声明来源钻瓜专利网。