[发明专利]语料库的词语生成方法、系统、计算机设备和存储介质在审
申请号: | 201910979249.4 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110909539A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 饶琪;金戈;黄超;郁冰;金子文;徐亮 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30;G06F16/9532 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 刘延喜 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请涉及数据处理技术领域,本申请涉及一种语料库的词语生成方法、计算机设备和存储介质,所述方法包括:对语料库的目标词语进行语义分词并得到目标分词,获取目标分词的词向量,以及调取预设的同义词库中基础分词的词向量;根据目标分词的词向量和基础分词的词向量,计算目标分词分别与各基础分词之间的相似度;根据相似度从基础分词中确定与目标词语近义表达的候选同义词;将候选同义词与目标分词进行关联存储,将候选同义词添加进目标词语所在的语料库中。上述方法,对语料库中的分词查找近义表达的候选同义词,并将候选同义词与该分词进行关联存储,扩展了语料库,增大语料库可匹配分词的范围,提高使用语料库进行匹配的准确性。 | ||
搜索关键词: | 语料库 词语 生成 方法 系统 计算机 设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910979249.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种空调环境的仿真方法及装置
- 下一篇:一种钻井设备运行状态采集监测装置