[发明专利]一种中文专词抽取方法、系统、电子设备及存储介质在审
申请号: | 202111257220.9 | 申请日: | 2021-10-27 |
公开(公告)号: | CN114004231A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 王梦婷 | 申请(专利权)人: | 浙江诺诺网络科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/289;G06F40/237;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘珂 |
地址: | 310000 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种中文专词抽取方法,所述中文专词抽取方法包括:获取中文文档数据,并对中文文档数据进行预处理和专词标注得到训练语料数据集;拼接嵌入层特征、词汇层特征和句子层特征得到中文文档数据的词汇特征表示;根据词汇特征表示构建BiLSTM模型和文档图;利用BiLSTM模型和文档图构建专词抽取框架模型;将训练语料数据集输入专词抽取框架模型进行训练;若接收到未知中文文档数据,则利用训练后的专词抽取框架模型抽取未知中文文档数据中的中文专词。本申请能够降低中文专词的抽取误差,提高实体识别精准度。本申请还公开了一种中文专词抽取系统、一种存储介质及一种电子设备,具有以上有益效果。 | ||
搜索关键词: | 一种 中文 抽取 方法 系统 电子设备 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江诺诺网络科技有限公司,未经浙江诺诺网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111257220.9/,转载请声明来源钻瓜专利网。