[发明专利]用于自然语言处理的方法和设备在审
申请号: | 202010424480.X | 申请日: | 2020-05-19 |
公开(公告)号: | CN112905735A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 金美淑;柳尚贤;朴贞训;全在勋;韩奎范 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 黄晓燕;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 自然语言 处理 方法 设备 | ||
公开了一种用于自然语言处理的方法和设备。所述方法包括:确定用户的输入句子与选择的第一数据库查询句子之间的第一相似度,基于确定第一相似度不满足第一阈值,确定比输入句子的全部少的输入句子的部分与选择的第二数据库查询句子之间的第二相似度,和响应于第二相似度满足第二阈值,输出与第二数据库查询句子相应的回复句子作为对输入句子的回复。
本申请要求于2019年11月19日在韩国知识产权局提交的第10-2019-0148984号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
下面的描述涉及用于自然语言处理的方法和设备。
背景技术
聊天机器人系统是用于生成与用户输入的句子相应的回复句子的系统。聊天机器人系统可包括基于检索模型的聊天机器人系统和基于生成(生成式)模型的聊天机器人系统。由于基于检索模型的聊天机器人系统基于存储在数据库中的数据,因此难以输出适合于数据库中尚未包括的输入句子或短语的回复句子。基于生成模型的聊天机器人系统生成各种回复。然而,因为基于生成模型的聊天机器人系统可能生成语法错误的回复或在不同时间对相同的查询输入生成不同的回复,所以基于生成模型的聊天机器人系统通常是不一致的。
发明内容
提供本发明内容以简化的形式介绍在以下具体实施方式中进一步描述的构思的选择。本发明内容不意在确定要求权利的主题的关键特征或必要特征,也不意在用于帮助确定要求权利的主题的范围。
在一个总体方面,一种处理器实现的方法包括:确定用户的输入句子与选择的第一数据库查询句子之间的第一相似度,和基于确定第一相似度不满足第一阈值,确定比输入句子的全部少的输入句子的部分与选择的第二数据库查询句子之间的第二相似度,和响应于第二相似度满足第二阈值,输出与第二数据库查询句子相应的回复句子作为对输入句子的回复。
所述方法还可包括:将输入句子编码为第一特征向量,其中,确定第一相似度的步骤可包括:确定第一特征向量与第一数据库查询句子之间的相似度,第一数据库查询句子是存储在数据库中的多个查询句子特征向量之中的存储在数据库中的第一查询句子特征向量。
所述方法还可包括:基于确定第一相似度不满足第一阈值,将输入句子的所述部分编码为第二特征向量,其中,确定第二相似度的步骤可包括:确定第二特征向量与第二数据库查询句子之间的相似度,第二数据库查询句子是存储在数据库中的第二查询句子特征向量。
输出与第二数据库查询句子相应的回复句子的步骤可包括:对第二查询句子特征向量进行解码以获得回复句子。
输入句子的所述部分可以是包括在输入句子中的多个成分中的一个成分。
输入句子的所述部分可以是包括在输入句子中的作为所述一个成分的动词。
输入句子的所述部分可以是基于多种任务的类型中的与输入句子相应的任务的类型而选择的句子成分。
所述多种任务的类型可包括:聊天机器人类型和检索类型。
用于确定输入句子的所述部分的输入句子的分配可基于对输入句子执行的词素分析。
所述方法还包括:基于第一相似度满足第一阈值,输出与第一查询句子相应的回复句子作为对输入句子的回复。
所述方法还包括:当第二相似度不满足第二阈值时,使用生成模型生成与输入句子相应的回复句子,并且输出生成的回复句子。
用户的输入句子可从用户说出的语音或用户输入的文本数据获取。
在一个总体方面,非暂时性计算机可读存储介质存储指令,所述指令在由一个或多个处理器执行时,使所述一个或多个处理器执行在此描述的所有处理中的一个或多个或它们的任意组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010424480.X/2.html,转载请声明来源钻瓜专利网。