[发明专利]一种中文相似问题生成系统与方法有效
申请号: | 201811360413.5 | 申请日: | 2018-11-15 |
公开(公告)号: | CN109460462B | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 韩冰 | 申请(专利权)人: | 中通天鸿(北京)通信科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/30 |
代理公司: | 北京卓爱普专利代理事务所(特殊普通合伙) 11920 | 代理人: | 王玉松 |
地址: | 101149 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 相似 问题 生成 系统 方法 | ||
1.一种中文相似问题生成方法,其特征在于,所述生成方法包括:
S1:中文语义知识库构建步骤,将关键词与常见问题建立第一映射、常见问题与销售标记建立第二映射,将经过销售标记的常见问题与问题答案建立第三映射,所述销售标记基于训练或规则生成;
S2:关键词提取步骤,若干商家端通过语音交互服务器向与各自商家所属的若干用户端建立语音信道,用户通过语音信道向对应的商家端提出自然语言问题,语音交互服务器识别到用户提出的问题后,经过语音转文字处理、自然语言关键词提取处理后,获得用于在所述中文语义知识库中匹配的关键词;
S3:常见问题匹配步骤,将步骤S2中提取的关键词在中文语义知识库中基于第一算法匹配到常见问题,判断常见问题是否具备销售标记属性,如果为带有销售标记属性的常见问题,则进入步骤S4,如果为不带有销售标记属性的常见问题,则进入步骤S5并将该常见问题放入待标记销售标记列表;
S4:第一相似问题答案生成步骤,将匹配到的常见问题基于第二算法生成基于关联度和相似度排序的若干第一相似问题答案;
S5:第二相似问题答案生成步骤,将匹配到的常见问题基于第三算法生成基于相似度排序的若干第二相似问题答案;
S6:商家端将经过语音交互服务器语音合成处理后的所述第一相似问题答案或所述第二相似问题答案发送至客户端,实现商家端和用户端的自动语音交互。
2.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S1的中文语义知识库中关键词与常见问题之间、经过销售标记的常见问题与问题答案之间均采用多种的映射关系,常见问题与销售标记之间采用一一对应的映射关系。
3.根据权利要求1所述的中文相似问题生成方法,其特征在于,骤S1中,所述规则包括但不限于根据商家的销售专家知识,当数据量超出10000条时基于训练生成,所述训练方法包括已知的机器学习算法。
4.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S4中,匹配出的带有销售标记的常见问题的数量为至少2个。
5.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S4包括如下步骤:
S41:对于带有销售标记属性的常见问题,在中文语义知识库中通过第二算法基于相似度生成若干第一相似问题答案,所述第二算法包括但不限于基于Word2Vec计算常见问题与问题答案之间的相似度;
S42:计算带有销售标记属性的常见问题的关联度,基于关联度值对生成的第一相似问题答案进行排序,所述关联度基于训练或规则计算。
6.根据权利要求5所述的中文相似问题生成方法,其特征在于,步骤S42中基于规则计算包括但不限于基于商家的销售专家知识对中文语义知识库中的各销售标记赋予关联度,基于训练的计算包括对中文语义知识库中每个销售标记进行关联度赋值,计算模型对赋予了关联度的销售标记进行训练,所述计算模型是基于人工智能深度学习技术建立的。
7.根据权利要求1所述的中文相似问题生成方法,其特征在于,步骤S3中的第一算法包括但不限于递归神经网络算法;步骤S5中的第三算法包括但不限于自然语言处理算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中通天鸿(北京)通信科技股份有限公司,未经中通天鸿(北京)通信科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811360413.5/1.html,转载请声明来源钻瓜专利网。