[发明专利]别名生成方法、装置和设备在审
申请号: | 202010059841.5 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111310472A | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 张浩宇;吴飞;方四安;徐承 | 申请(专利权)人: | 合肥讯飞数码科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/247 |
代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民;金海 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 别名 生成 方法 装置 设备 | ||
1.一种别名生成方法,其特征在于,包括:
利用预设的序列标注策略对命名实体的原始名称进行解析,得到所述原始名称的构词成分;
将所述构词成分与所述原始名称融合,并作为预先构建的具有编解码结构的别名生成模型的输入;
对所述别名生成模型的解码结果进行扩展,生成所述命名实体的多个别名。
2.根据权利要求1所述的别名生成方法,其特征在于,所述别名生成模型的解码结果包括:
基于预设的先验字符集解码得到的简称类别名和/或自定义类别名;其中所述自定义类别名含有所述原始名称之外的字符。
3.根据权利要求2所述的别名生成方法,其特征在于,所述先验字符集用于在所述别名生成模型的解码过程中,提升所述先验字符集内所含字符的输出概率。
4.根据权利要求1所述的别名生成方法,其特征在于,所述对所述别名生成模型的解码结果进行扩展包括:在所述别名生成模型的测试阶段,利用集束搜索扩展解码结果的数量。
5.根据权利要求1所述的别名生成方法,其特征在于,所述方法还包括:
利用所述序列标注策略对生成的多个别名进行合理性校验;
校验后筛选出最终的别名结果。
6.根据权利要求1~5任一项所述的别名生成方法,其特征在于,所述序列标注策略包括:
基于对实体名称构成要素分析所训练出的用于解析所述构词成分的序列标注模型。
7.一种别名生成装置,其特征在于,包括:
构词成分解析模块,用于利用预设的序列标注策略对命名实体的原始名称进行解析,得到所述原始名称的构词成分;
模型输入处理模块,用于将所述构词成分与所述原始名称融合,并作为预先构建的具有编解码结构的别名生成模型的输入;
模型输出处理模块,用于对所述别名生成模型的解码结果进行扩展,生成所述命名实体的多个别名。
8.根据权利要求7所述的别名生成装置,其特征在于,所述构词成分解析模块具体包括基于对实体名称构成要素分析所训练出的用于解析所述构词成分的序列标注模型。
9.一种别名生成设备,其特征在于,包括:
一个或多个处理器、存储器以及一个或多个计算机程序,其中所述一个或多个计算机程序被存储在所述存储器中,所述一个或多个计算机程序包括指令,当所述指令被所述设备执行时,使得所述设备执行如权利要求1~6任一项所述的别名生成方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品在终端设备上运行时,使所述终端设备执行权利要求1~6任一项所述的别名生成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010059841.5/1.html,转载请声明来源钻瓜专利网。