[发明专利]一种成语同义词列表的生成方法及装置有效
申请号: | 201910950701.4 | 申请日: | 2019-10-08 |
公开(公告)号: | CN110688838B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 刘晓楠;李长亮;汪美玲;郭昱 | 申请(专利权)人: | 北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F16/36;G06F16/338;G06F16/38;G06F18/22 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 王治东 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 成语 同义词 列表 生成 方法 装置 | ||
本申请提供一种成语同义词列表的生成方法及装置,其中所述方法包括:获取用户输入的问题语句,从所述用户输入的问题语句中识别出目标成语;在预设的成语知识图谱中获取与所述目标成语具有相同特征标签的至少一个候选成语,并生成所述至少一个候选成语对应的成语推荐列表;将所述目标成语对应的词嵌入向量分别与所述成语推荐列表中的每个所述候选成语对应的词嵌入向量进行相似度计算,得到每个所述候选成语与所述目标成语对应的相似度数值;根据每个所述候选成语与所述目标成语对应的相似度数值对所述成语推荐列表中的候选成语进行筛选,得到仅包含有与所述目标成语为同义词的候选成语的成语推荐列表。
技术领域
本说明书涉及计算机技术领域,特别涉及一种成语同义词列表的生成方法、装置、计算设备及计算机可读存储介质。
背景技术
现有的网络成语词典,主要提供了成语的读音、释义、出处、近义词以及反义词等信息,通常采用关系型数据库组织和存储,在此基础上可为用户提供的有关同义词的使用方式为:首先搜索特定成语,进而查看成语的相关信息,然后通过打开返回信息提供的近义词链接,用户对相关近义词成语和特定成语的解释进行对比,判断两者是否为同义词。同时,目前中文同义词技术应用主要在信息检索、对外汉语教学以及专业词汇等领域,有关成语领域的多为人工标注的包含部分同义词关系的近义词关系。
一般用户在写作时需要对特定成语的同义词进行查找的情况下,必须要切换到第三方的搜索或字典等工具,然而,目前此类工具主要支持针对输入的成语返回相关成语信息,只能提供有关该成语意思相近的近义词链接,并未提供与该成语的语义相同的同义词信息,需要用户打开这些成语信息中部分包含近义词的链接,对于原成语和近义词的释义进行对比,判断两者是否为同义词关系,这就要求用户对工具返回的成语进行较多的甄别和筛选,从而极大破坏了用户关于文档写作思路的连续性,提高了用户获取所需信息的难度,降低了用户获取所需信息的准确性。
发明内容
有鉴于此,本说明书实施例提供了一种成语同义词列表的生成方法、装置、计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。
根据本说明书实施例的第一方面,提供了一种成语同义词列表的生成方法,包括:
获取用户输入的问题语句,从所述用户输入的问题语句中识别出目标成语;
在预设的成语知识图谱中获取与所述目标成语具有相同特征标签的至少一个候选成语,并生成所述至少一个候选成语对应的成语推荐列表;
将所述目标成语对应的词嵌入向量分别与所述成语推荐列表中的每个所述候选成语对应的词嵌入向量进行相似度计算,得到每个所述候选成语与所述目标成语对应的相似度数值;
根据每个所述候选成语与所述目标成语对应的相似度数值对所述成语推荐列表中的候选成语进行筛选,得到仅包含有与所述目标成语为同义词的候选成语的成语推荐列表;
根据本说明书实施例的第二方面,提供了一种成语同义词列表的生成装置,包括:
成语识别模块,被配置为获取用户输入的问题语句,从所述用户输入的问题语句中识别出目标成语;
列表生成模块,被配置为在预设的成语知识图谱中获取与所述目标成语具有相同特征标签的至少一个候选成语,并生成所述至少一个候选成语对应的成语推荐列表;
相似度计算模块,被配置为将所述目标成语对应的词嵌入向量分别与所述成语推荐列表中的每个所述候选成语对应的词嵌入向量进行相似度计算,得到每个所述候选成语与所述目标成语对应的相似度数值;
列表筛选模块,被配置为根据每个所述候选成语与所述目标成语对应的相似度数值对所述成语推荐列表中的候选成语进行筛选,得到仅包含有与所述目标成语为同义词的候选成语的成语推荐列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司,未经北京金山数字娱乐科技有限公司;成都金山数字娱乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910950701.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理的方法及装置
- 下一篇:一种基于试卷的英语作文自动评阅的方法