[发明专利]基于领域自适应的文本信息提取方法、装置、系统及介质有效
申请号: | 201810431979.6 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108664589B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 陈文亮;卢奇;张民 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F40/295 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 215104 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于领域自适应的文本信息提取方法,包括:对输入文本进行预处理,得到文本向量;根据第二领域与第一领域间的共有特征提取参数提取文本向量的共有特征,根据第一领域内的私有特征提取参数提取文本向量的私有特征;对进行领域模糊后的共有特征进行领域分类;根据分类结果以及第一领域的领域信息对共有特征提取参数进行分析修正;根据私有特征对文本向量进行相邻词语预测;根据预测结果以及文本中的相邻词语对私有特征提取参数进行分析修正。该方法可提升社交媒体等领域的文本分析提取能力。本申请还公开了基于领域自适应的文本信息提取装置、系统及可读存储介质,具有上述有益效果。 | ||
搜索关键词: | 基于 领域 自适应 文本 信息 提取 方法 装置 系统 介质 | ||
【主权项】:
1.一种基于领域自适应的文本信息提取方法,其特征在于,包括:对进行领域模糊后的前一次提取的共有特征进行领域分类;根据分类结果以及领域信息对共有特征提取参数进行分析修正;根据前一次提取的私有特征对前一次处理得到的文本向量进行相邻词语预测;根据预测结果以及所述文本中的相邻词语对私有特征提取参数进行分析修正;对当前输入文本进行预处理,得到文本向量;其中,所述当前输入文本属于第一领域;根据第二领域与所述第一领域间的修正后的共有特征提取参数提取所述文本向量的共有特征,根据所述第一领域内的修正后的私有特征提取参数提取所述文本向量的私有特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810431979.6/,转载请声明来源钻瓜专利网。
- 上一篇:布匹纬斜在线检测与控制的自动化方法
- 下一篇:一种枸杞数据识别方法