[发明专利]一种模型训练的方法、实体抽取的方法、装置及存储介质在审
申请号: | 202110645541.X | 申请日: | 2021-06-10 |
公开(公告)号: | CN113420558A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 操涛涛;陈立力;周明伟 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/216 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 赵凯莉 |
地址: | 310053 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种模型训练的方法、实体抽取的方法、装置及存储介质,用以解决现有技术中存在的公安文本中的实体抽取的准确度不高的技术问题,该模型训练方法包括:对历史公安文本集中的每个历史公安文本进行分词及词性标注;统计标注后的历史公安文本集中各分词结果中的词汇,在每种词性中出现的频率以及在每种词性相邻位置出现的频率,得到对应的词频概率和用词概率;生成每个词汇的词向量,并与对应的词频概率和用词概率组合,形成对应词汇的特征向量;将所有特征向量分为训练集和测试集,用训练集对条件随机场模型进行训练,用测试集对训练后的条件随机场模型进行测试,直至测试结果的准确率达到设定阈值停止训练获得训练好的条件随机场模型。 | ||
搜索关键词: | 一种 模型 训练 方法 实体 抽取 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110645541.X/,转载请声明来源钻瓜专利网。