[发明专利]一种确定文档情感倾向性的方法及装置有效
申请号: | 201510671710.1 | 申请日: | 2015-10-16 |
公开(公告)号: | CN106598935B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 史立华;崔维福;何鑫 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/36 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 文档 情感 倾向性 方法 装置 | ||
1.一种确定文档情感倾向性的方法,其特征在于,所述方法包括:
分别获取一个具有字典树结构的情感词典和一个具有字典树结构的修饰词典,其中,所述情感词典中包含带有情感标定值的情感词,所述修饰词典中包含带有修饰程度标定值的修饰词;
将待测文档以字为单位分别与所述情感词典及所述修饰词典中字典树的各节点进行匹配,获取相匹配的情感词或修饰词;
根据情感词与修饰词之间的修饰关系、情感词的情感标定值以及修饰词的修饰程度标定值计算所述待测文档的情感标定值;
根据所述待测文档的情感标定值在预置的情感趋向映射区间中的位置,确定所述待测文档的情感趋向。
2.根据权利要求1所述的方法,其特征在于,获取一个具有字典树结构的情感词典包括:
根据不同的领域创建至少一个情感词典,所述情感词典中包含指定领域中的情感词;
将所述情感词典中的情感词按照正面、中性、负面三类进行划分,并根据情感词的情感程度标记情感标定值;
将所述情感词以字为单位构建字典树,得到具有字典树结构的情感词典;
在所述至少一个情感词典中获取一个所述待测文档所属领域的情感词典。
3.根据权利要求1所述的方法,其特征在于,获取一个具有字典树结构的修饰词典包括:
根据不同的领域创建至少一个修饰词典,所述修饰词典中包含用于修饰指定领域中情感词的修饰词;
根据所述修饰词的修饰程度标记修饰程度标定值;
将所述修饰词以字为单位构建字典树,得到具有字典树结构的修饰词典;
在所述至少一个修饰词典中获取一个所述待测文档所属领域的修饰词典。
4.根据权利要求1所述的方法,其特征在于,所述将待测文档以字为单位分别与所述情感词典及所述修饰词典中字典树的各节点进行匹配,获取相匹配的情感词或修饰词包括:
将所述待测文档分解为单个的字;
根据所述字在待测文档中的排列顺序分别与所述情感词典以及修饰词典中字典树的各节点进行匹配;
当存在与所述字相匹配的节点时,在所述节点的子节点中匹配与所述字相邻的后一个字;
将匹配成功的字组成情感词或修饰词,并获取所述情感词的情感标定值或所述修饰词的修饰程度标定值。
5.根据权利要求1或4所述的方法,其特征在于,所述根据情感词与修饰词之间的修饰关系、情感词的情感标定值以及修饰词的修饰程度标定值计算所述待测文档的情感标定值包括:
根据所述情感词和所述修饰词在所述待测文档中的位置判断所述情感词与所述修饰词是否相邻;
若相邻,则将所述情感词与所述修饰词组成情感词组,并将情感词的情感标定值与修饰词的修饰程度标定值的乘积设置为所述情感词组的情感标定值;
将所述情感词组的情感标定值与单独的情感词的情感标定值累加,计算出所述待测文档的情感标定值。
6.根据权利要求1-4中任一项所述的方法,其特征在于,在所述根据所述待测文档的情感标定值在预置的情感趋向映射区间中的位置,确定所述待测文档的情感趋向之前,所述方法还包括:
设置正面情感阈值和负面情感阈值;
将大于所述正面情感阈值的情感标定值区间划分为正趋向区间,将小于所述负面情感阈值的情感标定值区间划分为负趋向区间,将正面情感阈值和负面情感阈值之间的区间范围划分为中性区间。
7.根据权利要求2所述的方法,其特征在于,所述将所述情感词典中的情感词按照正面、中性、负面三类进行划分,并根据情感词的情感程度标记情感标定值,包括:
将正面情感词的情感标定值取大于零的值;
将负面情感词的情感标定值取小于零的值;
将中性情感词的情感标定值取为零。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510671710.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电子书数据的显示方法、装置及终端设备
- 下一篇:字母词的提取方法及装置