[发明专利]业务词库的构建方法、装置、服务器及可读存储介质在审
申请号: | 201910002448.X | 申请日: | 2019-01-02 |
公开(公告)号: | CN110008464A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 周书恒;祝慧佳;赵智源;郭亚 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/335 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书实施例公开了一种业务词库的构建方法,通对业务文本进行新词发现,获取到一个或多个候选短语,以及在每检测到一个候选短语不在所述业务词库中时,若判定出该候选短语为新词,则将该候选短语添加到所述业务词库中,如此,随着业务文本不断更新,会源源不断发现新词并添加到所述业务词库中,从而促使业务词库会持续更新,由于新词是在业务文本中发现的,而业务文本与业务词库对应,从而使得发现的新词也与所述业务词库对应,从而能够提高业务词库的构建质量。 | ||
搜索关键词: | 词库 候选短语 业务文本 构建 可读存储介质 新词发现 发现 更新 服务器 判定 检测 | ||
【主权项】:
1.一种业务词库的构建方法,包括:对业务文本进行新词发现,获取到一个或多个候选短语;检测获取到的每个候选短语是否在业务词库中;在每检测到一个候选短语不在所述业务词库中时,获取针对该候选短语是否为新词的评测数据;根据该候选短语对应的评测数据,判定该该候选短语是否为新词;在判定出该候选短语为新词时,将该候选短语添加到所述业务词库中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910002448.X/,转载请声明来源钻瓜专利网。
- 上一篇:用于事件抽取的方法、装置和计算机可读介质
- 下一篇:句子语义距离的度量方法