[发明专利]一种面向国防领域防务智库的文本情感分析方法在审
申请号: | 202011318544.4 | 申请日: | 2020-11-23 |
公开(公告)号: | CN112464646A | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 董文轩;晏裕生;江洋;李斌;李兴亚;苏慧超;孙孟阳;姚晗 | 申请(专利权)人: | 中国船舶工业综合技术经济研究院 |
主分类号: | G06F40/216 | 分类号: | G06F40/216;G06F40/242;G06F40/289 |
代理公司: | 北京君泰水木知识产权代理有限公司 11906 | 代理人: | 杜正国;王志远 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 国防 领域 防务 文本 情感 分析 方法 | ||
1.一种面向国防领域防务智库的文本情感分析方法,其特征在于,所述文本情感分析方法包括以下步骤:
步骤S1:获取国防领域防务智库的文本Text;
步骤S2:按照预设的分词模型对所述文本Text中的篇章进行切分处理,得到句子集合T={t1,t2,……,tn},其中n为自然数;
步骤S3:对所述步骤S2中获得的句子集合T={t1,t2,……,tn}进行预设方式处理,并且采用条件随机场算法对所述句子集合T中的每个句子ti进行分词,其中i=1,2,……,n,以得到分词后的文本数据;
步骤S4:基于所述步骤S3中得到的分词后的文本数据,运用基于主观2-POS模型的CHI统计方法对所述每个句子ti进行条件筛选,通过对每个句子ti进行主客观情感权重值赋加以及所述主客观情感权重值的判定步骤,获得主观句子集合T′={t′1,t′2,……,t′s},其中s为小于等于n的自然数;
步骤S5:导入预先建立的情感词典,对情感表达词进行程度等级划分,根据程度等级的差异赋予对应的词语权重值;
步骤S6:基于所述步骤S4中得到的每个主观句t′l,其中l=1,2,……,s,进行标志性句子判断,并根据判断结果对每个主观句t′l赋予不同的特征权重值;
步骤S7:依照所述情感词典,对所述主观句t′l中的每个词汇进行情感倾向统计,并根据情感计算模型对每个所述主观句t′l的最终得分进行计算,计算所述文本Text的最终情感得分;
步骤S8:计算所述文本Text的情感倾向值O。
2.根据权利要求1所述的一种面向国防领域防务智库的文本情感分析方法,其特征在于,
在所述步骤S2中,所述预设的分词模型为常用标点符号,其中,所述常用标点符号设定为逗号、句号、问号和感叹号。
3.根据权利要求1所述的一种面向国防领域防务智库的文本情感分析方法,其特征在于,
所述对所述步骤S2中获得的句子集合T={t1,t2,……,tn}进行预设方式处理,具体包括:
采用预设剔除规则将所述每个句子ti中包含的预设属性的字符和/或词语剔除,其中,所述预设属性的字符和/或词语至少包括特殊符号、空值和停用词;
所述采用条件随机场算法对所述句子集合T={t1,t2,……,tn}中的每个句子ti进行分词,具体包括:
将经过预设方式处理后的每个句子ti设定为观测序列,基于输入的观测序列,经条件随机场运算后输出的序列设定为状态序列,所述状态序列构成马尔可夫随机场,其中,在条件随机场运算过程中,寻找每个句子ti最大概率的状态序列,作为每个句子ti的最终分词结果集合ti={wi1,wi2,……,wij,……,wim},其中,wij代表句子ti中第j个切分出来的具有词性属性的词语,i=1,2,……,n,j=i=1,2,……,m,m为自然数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶工业综合技术经济研究院,未经中国船舶工业综合技术经济研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011318544.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种不锈钢丝网的灼烧装饰工艺
- 下一篇:一种多功能红木茶桌