[发明专利]对话系统以及用于其的计算机程序在审
申请号: | 201780043642.1 | 申请日: | 2017-07-26 |
公开(公告)号: | CN109478188A | 公开(公告)日: | 2019-03-15 |
发明(设计)人: | 阿部宪幸;大西可奈子;鸟泽健太郎;卡纳萨·库恩卡莱;吴钟勋;饭田龙;木俵丰 | 申请(专利权)人: | 国立研究开发法人情报通信研究机构 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F17/27;G06F17/28 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴秋明 |
地址: | 日本国*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话系统 提问 回答取得部 提问生成 应答系统 修饰 计算机程序 发声 正对 输出 话题 对话 | ||
提供不管话题如何都能与用户进行自然的对话的对话系统。对话系统(30)包含:提问生成部(120),其接受来自用户的输入句(100),使用修饰被修饰关系来生成利用了输入句(100)中所含的表达的提问;回答取得部(122),其将由提问生成部(120)生成的提问输入到提问‑应答系统(104),从提问‑应答系统(104)取得针对该提问的回答;和发声生成部(124),其基于回答取得部(122)取得的回答来生成正对输入句(100)的输出句(106)。
技术领域
本发明涉及在与用户之间进行对话的对话系统,特别涉及能进行自然的对话的对话系统。
背景技术
关于计算机与用户进行对话的系统,到目前为止进行过许多尝试。最简单的是预先准备决定了对话的规则的脚本,计算机按照该脚本进行发声。在脚本中包含被任意的单词置换的变量,通过对用户的发声进行声音识别,来从那里提取某些单词来置换该变量,从而进行应答。如稍后会知道的那样,这样的对话系统由于脚本的数量受到限制,因此应答的模式(pattern)也受到制约。由于对话中会产生的情况的数量是无限的,因此不能在这样的系统中进行自然的对话。
另外,还有对众多对话数据中的句的修饰被修饰关系进行解析,利用其结果的方案。例如对某句进行解析的结果,从“由于今天买了游戏机,因此玩MARCOCARGO”(“MARCOCARGO”设为游戏的名字)这句提取“(今天)买了游戏机”和“玩MARCOCARGO”的组合,作为模式存储。对话时,若在用户发声中出现“今天买了游戏机”这样的表达,就提取与该表达建立对应的“玩MARCOCARGO”这样的表达,进行词尾变换,例如生成“能打MARCOCARGO呢”这样的系统发声。
进一步,在其他的解决方案中,从用户的发声提取关键词,进行关键词检索并将其结果用在系统发声的生成中。例如若用户发声“今天买游戏机”,则以“游戏机”和“买”为关键词对WEB进行检索,收集多个文书,提取其中与关键词接近地出现的单词(例如“MARCOCARGO”)。将单词嵌套在预先准备的模板来生成系统发声。
但这些都有不能正确理解用户发声或WEB上的句的修饰被修饰的意义上的关系(原因、结果、并列等)的问题。由此,有时会生成不合适的系统发声。例如以“去秋叶原卖游戏机,吃拉面。”这样的发声为例。从发声提取“买游戏机”这样的表达和“吃拉面”这样的表达,将两者姑且建立关系。但对话时,若针对“今天买游戏机”这样的用户发声仅基于该关系生成“能吃拉面了”这样的系统发声,通常就不能理解,不能维持自然的对话。
在使用关键词检索的情况下,由于检索结果的文书所包含的单词的词汇过多,因此在检索结果中不需要的信息多,难以提取本来想要的信息。另外,由于利用基于用户发声中所含的关键词的检索结果,因此不能控制系统侧的发声意图(例如是否希望给用户提供信息,是否希望说出感想,是否希望共鸣等)。
在后述的专利文献1中给出了用于解决这样的问题的提案。专利文献1记载的声音对话系统包含:声音识别装置,其识别用户的发声;意图理解部,其为了理解该发声的意图,理解希望知道特定的领域中的怎样的信息,使用预先学习完毕的意图理解模型以及问题解决知识来理解发声的意图;和对话管理部,其为了生成与该意图对应的应答句,从信息源取得用于应答的信息。在专利文献1中,作为该信息源而能举出因特网上的特定的WEB网站和保存了与各种电影相关的人们的感想的感想数据库,并对应于发声者的意图而选择任意一方。例如若用户的发声是希望知道电影的导演,就在WEB网站上检索该电影的导演。若用户的发声是希望知道电影的感想,就检索感想数据库来取出与该电影相关的他人的感想。
专利文献1记载的声音对话系统进一步包含记述了在被输入各种意图时应进行怎样的交互的对话的流程的对话剧本。
该系统进一步包含:使用对话管理部从信息源取得的信息生成针对发声者的发声的应答句的应答句生成部;将应答句生成部生成的应答句进行声音合成来生成声音信号的声音合成部;和将该声音信号变换成声音的扬声器。
现有技术文献
专利文献
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国立研究开发法人情报通信研究机构,未经国立研究开发法人情报通信研究机构许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780043642.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:动态装载匹配引擎方法和系统
- 下一篇:自然语言查询的近似模板匹配