[发明专利]同义句的获取方法及装置、设备及存储介质在审
申请号: | 201910122455.3 | 申请日: | 2019-02-19 |
公开(公告)号: | CN111597800A | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 刘剑;甘露;卜建辉;吴伟佳 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F16/33;G06F16/36 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同义 获取 方法 装置 设备 存储 介质 | ||
本发明实施例公开了一种同义句的获取方法及装置、设备及存储介质。所述方法包括:获取待处理语句;将待处理语句输入翻译模型,得到待处理语句的同义句,其中,翻译模型由用户输入的搜索内容以及用户选取的搜索结果的标题所组成的训练样本对训练而获得。本发明实施例的技术方案解决了现有技术中同义句的确定过程较为繁琐,且浪费了大量的人力的技术缺陷,实现了在不通过人工挖掘同义词对的基础上,简便、准确及快捷地获取语句的同义句。
技术领域
本发明实施例涉及自然语言处理技术,尤其涉及一种同义句的获取方法及装置、设备及存储介质。
背景技术
自然语言处理是研究人与计算机交互的语言问题的一门学科,处理自然语言的关键是要让计算机“理解”自然语言。问答系统应用了自然语言处理技术,其是信息检索技术的一种高级形式,它能用准确、简洁的自然语言回答用户的自然语言问题。
问答系统在接收到用户输入的问题之后,一般会先获取该问题的同义句,然后再根据该问题及其同义句,到数据库中搜索匹配的答案。现有技术中,同义句一般是通过同义词替换以及语言模型获取的。首先,需要通过人工挖掘大量的同义词对,然后根据同义词对,将问题中的一个或多个词语替换为对应的同义词,再使用语言模型获取同义词替换后的各语句的置信度,最后根据置信度确定问题的同义句。
发明人在实现本发明的过程中,发现现有技术存在如下缺陷:同义句的确定过程较为繁琐,且浪费了大量的人力。
发明内容
有鉴于此,本发明实施例提供了一种同义句的获取方法及装置、设备及存储介质,以实现在不通过人工挖掘同义词对的基础上,简便、准确及快捷地获取语句的同义句。
第一方面,本发明实施例提供了一种同义句的获取方法,包括:
获取待处理语句;
将所述待处理语句输入翻译模型,得到所述待处理语句的同义句,其中,所述翻译模型由用户输入的搜索内容以及所述用户选取的搜索结果的标题所组成的训练样本对训练而获得。
第二方面,本发明实施例提供了一种同义句的获取装置,包括:
语句获取模块,用于获取待处理语句;
同义句获取模块,用于将所述待处理语句输入翻译模型,得到所述待处理语句的同义句,其中,所述翻译模型由用户输入的搜索内容以及所述用户选取的搜索结果的标题所组成的训练样本对训练而获得。
第三方面,本发明实施例提供了一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明任意实施例所述的同义句的获取方法。
第四方面,本发明实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本发明任意实施例所述的同义句的获取方法。
本发明实施例提供了一种同义句的获取方法及装置、设备及存储介质,通过使用由用户输入的搜索内容以及用户选取的搜索结果的标题所组成的训练样本对训练翻译模型进行训练,并使用训练得到的翻译模型获取语句的同义句,解决了现有技术中同义句的确定过程较为繁琐,且浪费了大量的人力的技术缺陷,实现了在不通过人工挖掘同义词对的基础上,简便、准确及快捷地获取语句的同义句。
附图说明
图1是本发明实施例一提供的一种同义句的获取方法的流程图;
图2是本发明实施例二提供的一种同义句的获取装置的结构图;
图3是本发明实施例三提供的一种设备的结构图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910122455.3/2.html,转载请声明来源钻瓜专利网。