[发明专利]一种基于谐音字的答非所问对话生成方法和系统有效

专利信息
申请号: 202110204002.2 申请日: 2021-02-24
公开(公告)号: CN112818090B 公开(公告)日: 2023-10-03
发明(设计)人: 梁循;吴佳辰;王伟 申请(专利权)人: 中国人民大学
主分类号: G06F16/33 分类号: G06F16/33
代理公司: 北京纪凯知识产权代理有限公司 11245 代理人: 赵悦
地址: 100872 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 谐音 答非所问 对话 生成 方法 系统
【说明书】:

发明属于人工智能对话技术领域,一种基于谐音字的答非所问对话生成方法和系统,包括以下步骤:S1将提出的问题进行分词和语义处理;S2获得经过分词和语义处理后的问题的关键词;S3根据预建立的谐音字数据库,对关键词进行谐音字替换,并生成新的问题;S4将新的问题带入预建立的对话回复模型,生成最终的回复。其通过对语音对话中的关键词进行谐音替换,以模拟用户听错了的情况,进行答非所问的回答,从而暗示对话的另一方自己对话题并不感兴趣,达到结束对话的目的。

技术领域

本发明涉及一种基于谐音字的答非所问对话生成方法和系统,属于人工智能对话技术领域。

背景技术

聊天机器人是一种用来模拟人类对话的系统,根据机器人的功能可以分为任务型聊天机器人和闲聊型聊天机器人。任务型机器人实现特定域的目标,已经在越来越多的领域发挥着作用,例如:客服机器人或咨询机器人可以对用户提问的关键词进行反应,对一些存储在数据库中的简单问答做出快速的回复,节省了人力资源成本,提高了用户体验;而闲聊型机器人面向开放领域,可以对任何的对话做出反应,因此这种机器人实现更加困难,所需要的知识规模更大。

聊天机器人的对话通常基于模板、检索或生成模型等方法实现。早期的聊天机器人的对话参考人工构建的规则或者模板实现,精度比较高但灵活性不足。基于检索的聊天机器人通过句子相似度或者类似搜索引擎的方法从大型数据库中寻找答案。基于生成模型的方法主要采用了端到端的框架,利用神经网络学习输入语句和输出语句的关系,使系统自动生成回复,但是这种方法对语料库质量依赖度高,容易生成无意义的安全回答。

但是Siri等聊天机器人只能处理一般场景的对话,对于一些特殊的场景聊天机器人就无法给出适当的回答。例如,在社交软件中,有一些话题用户并不感兴趣,但又不方便直接说,而对方又一直喋喋不休地说,故需要采用一些答非所问或转移话题的方法暗示对方,自己并不想继续这个话题了。这时就需要在手机或电脑中内嵌一个聊天机器人以托管这一类用户不想处理的对话。然而,目前的聊天机器人只能进行简单的对话,对于此种场景比较复杂,技巧性比较强的对话就无能为力了。

发明内容

针对上述问题,本发明的目的是提供一种基于谐音字的答非所问对话生成方法和系统,其通过对语音对话中的关键词进行谐音替换,以模拟用户听错了的情况,进行答非所问的回答,从而暗示对话的另一方自己对话题并不感兴趣,达到结束对话的目的。

为实现上述目的,本发明采取以下技术方案:一种基于谐音字的答非所问对话生成方法,包括以下步骤:S1将提出的问题进行分词和语义处理;S2获得经过分词和语义处理后的问题的关键词;S3根据预建立的谐音字数据库,对关键词进行谐音字替换,并生成新的问题;S4将新的问题带入预建立的对话回复模型,生成最终的回复。

进一步,步骤S1分词和语义处理的具体过程包括:首先将语音形式的问题转换为文本形式,对文本形式的问题进行分词、词性标注和命名实体识别,并进行语义理解。

进一步,步骤S2中统计问题的关键词的具体方法包括:统计经过分词和语义处理后的问题中各个词出现的频率TF和逆文本频率IDF指数,从而生成各个词的TF-IDF值,其中TF-IDF值最大的词为问题的关键词。

进一步,步骤S3中谐音字数据库的预建立过程包括:首先制定包括同音字和近音字的谐音字规则;随后获取常用字的拼音,根据谐音字规则,获取与常用字对应的谐音字的拼音,按照拼音获取相应的谐音字字集;最后,去除谐音字字集中的非常用字,生成谐音字数据库。

进一步,步骤S3中谐音字替换方法包括:S3.1根据谐音字数据库,生成关键词的谐音字替代集合;S3.2把谐音字替代集合中的候选词依次带回原问题中,生成新的问题;S3.3判断新的问题是否超过预设长度,若否则进入步骤S4,若是则认为回复失败。

进一步,步骤S4中预建立的对话回复模型为seq2seq生成模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民大学,未经中国人民大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110204002.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top