[发明专利]构建人名语料识别模型的方法及装置有效
申请号: | 201510141915.9 | 申请日: | 2015-03-27 |
公开(公告)号: | CN106156051B | 公开(公告)日: | 2019-08-13 |
发明(设计)人: | 周连强;王倩 | 申请(专利权)人: | 深圳市腾讯计算机系统有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种构建人名语料识别模型的方法及装置,属于信息技术领域。方法包括:根据至少两种不同的人名语料训练模型,对每个建模中文语料进行标注;当根据标注结果对建模中文语料的预测结果的一致性达到预设指标时,将建模中文语料添加到语料训练列表中;提取语料训练列表中每个建模中文语料的语料特征;根据建模中文语料的语料特征,构建人名语料识别模型。本发明借助多种不同的人名语料训练模型,对每个建模中文语料进行标注,基于标注结果,构建人名语料识别模型。在该过程中,无需用户进行人工标注,降低了语料标注成本,且在构建人名语料训练模型时,综合了多种人名语料训练模型的标注结果,提高了所构建的人名语料识别模型的识别精度。 | ||
搜索关键词: | 构建 人名 语料 识别 模型 方法 装置 | ||
【主权项】:
1.一种构建人名语料识别模型的方法,其特征在于,所述方法包括:获取多个待识别的建模中文语料;根据至少两种不同的人名语料训练模型,对每个建模中文语料进行标注;根据对任一建模中文语料标注得到的至少两种标注结果,预测所述建模中文语料中是否包含人名语料;当所述至少两种不同的人名语料训练模型对所述建模中文语料的预测结果的一致性达到预设指标时,将所述建模中文语料添加到语料训练列表中;提取所述语料训练列表中每个建模中文语料的语料特征;根据所述建模中文语料的语料特征,构建人名语料识别模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯计算机系统有限公司,未经深圳市腾讯计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510141915.9/,转载请声明来源钻瓜专利网。
- 上一篇:车辆燃油系统故障模拟装置以及模拟方法
- 下一篇:终端数据升级方法及装置