[发明专利]一种面向国防领域防务智库的文本情感分析方法在审

专利信息
申请号: 202011318544.4 申请日: 2020-11-23
公开(公告)号: CN112464646A 公开(公告)日: 2021-03-09
发明(设计)人: 董文轩;晏裕生;江洋;李斌;李兴亚;苏慧超;孙孟阳;姚晗 申请(专利权)人: 中国船舶工业综合技术经济研究院
主分类号: G06F40/216 分类号: G06F40/216;G06F40/242;G06F40/289
代理公司: 北京君泰水木知识产权代理有限公司 11906 代理人: 杜正国;王志远
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 国防 领域 防务 文本 情感 分析 方法
【权利要求书】:

1.一种面向国防领域防务智库的文本情感分析方法,其特征在于,所述文本情感分析方法包括以下步骤:

步骤S1:获取国防领域防务智库的文本Text;

步骤S2:按照预设的分词模型对所述文本Text中的篇章进行切分处理,得到句子集合T={t1,t2,……,tn},其中n为自然数;

步骤S3:对所述步骤S2中获得的句子集合T={t1,t2,……,tn}进行预设方式处理,并且采用条件随机场算法对所述句子集合T中的每个句子ti进行分词,其中i=1,2,……,n,以得到分词后的文本数据;

步骤S4:基于所述步骤S3中得到的分词后的文本数据,运用基于主观2-POS模型的CHI统计方法对所述每个句子ti进行条件筛选,通过对每个句子ti进行主客观情感权重值赋加以及所述主客观情感权重值的判定步骤,获得主观句子集合T′={t′1,t′2,……,t′s},其中s为小于等于n的自然数;

步骤S5:导入预先建立的情感词典,对情感表达词进行程度等级划分,根据程度等级的差异赋予对应的词语权重值;

步骤S6:基于所述步骤S4中得到的每个主观句t′l,其中l=1,2,……,s,进行标志性句子判断,并根据判断结果对每个主观句t′l赋予不同的特征权重值;

步骤S7:依照所述情感词典,对所述主观句t′l中的每个词汇进行情感倾向统计,并根据情感计算模型对每个所述主观句t′l的最终得分进行计算,计算所述文本Text的最终情感得分;

步骤S8:计算所述文本Text的情感倾向值O。

2.根据权利要求1所述的一种面向国防领域防务智库的文本情感分析方法,其特征在于,

在所述步骤S2中,所述预设的分词模型为常用标点符号,其中,所述常用标点符号设定为逗号、句号、问号和感叹号。

3.根据权利要求1所述的一种面向国防领域防务智库的文本情感分析方法,其特征在于,

所述对所述步骤S2中获得的句子集合T={t1,t2,……,tn}进行预设方式处理,具体包括:

采用预设剔除规则将所述每个句子ti中包含的预设属性的字符和/或词语剔除,其中,所述预设属性的字符和/或词语至少包括特殊符号、空值和停用词;

所述采用条件随机场算法对所述句子集合T={t1,t2,……,tn}中的每个句子ti进行分词,具体包括:

将经过预设方式处理后的每个句子ti设定为观测序列,基于输入的观测序列,经条件随机场运算后输出的序列设定为状态序列,所述状态序列构成马尔可夫随机场,其中,在条件随机场运算过程中,寻找每个句子ti最大概率的状态序列,作为每个句子ti的最终分词结果集合ti={wi1,wi2,……,wij,……,wim},其中,wij代表句子ti中第j个切分出来的具有词性属性的词语,i=1,2,……,n,j=i=1,2,……,m,m为自然数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶工业综合技术经济研究院,未经中国船舶工业综合技术经济研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011318544.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top