[发明专利]一种基于seq2seq模型的语义相似度计算方法在审
申请号: | 201911173879.9 | 申请日: | 2019-11-26 |
公开(公告)号: | CN110826341A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 何鹏;谢铁 | 申请(专利权)人: | 杭州微洱网络科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/242 |
代理公司: | 杭州信义达专利代理事务所(普通合伙) 33305 | 代理人: | 陈继算 |
地址: | 310012 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于seq2seq模型的语义相似度计算方法,涉及语义识别技术领域;包括以下步骤:S1、构建训练数据;S2、文本预处理:去除一些对判断句子语义无关的特殊字符,对于文本中的链接、地名等信息进行归一化,映射为统一的字符;S3、构建基于字粒度的字典,将文本映射为对应字典中的索引值,并输入Seq2seq模型进行训练;S4、使用seq2seq模型的encoder部分进行用户提问句子的特征向量提取;S5、通过计算特征向量间的相似度,从而匹配到与用户提问最相关的问法,将该问法对应的回复作为提问的回答。本发明不需要像孪生网络那样构建大量的正负样例,只需相同问法下的示例两两构建pair进行训练,训练需要的数据量相对较少。 | ||
搜索关键词: | 一种 基于 seq2seq 模型 语义 相似 计算方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微洱网络科技有限公司,未经杭州微洱网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911173879.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种驱动多路晶闸管的触发控制器
- 下一篇:一种纱网收卷筒