[发明专利]一种基于情感词匹配与频度结合的情感程度检测方法在审
申请号: | 202110319710.0 | 申请日: | 2021-03-25 |
公开(公告)号: | CN113157858A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 郭伟薇 | 申请(专利权)人: | 上海柏观数据科技有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/9536;G06Q50/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 宣慧兰 |
地址: | 200062 上海市普陀*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 匹配 频度 结合 程度 检测 方法 | ||
本发明涉及一种基于情感词匹配与频度结合的情感程度检测方法,具体包括以下步骤:S1、获取待评价人才的主题需求信息,根据主题需求信息构建相应的情感语料库;S2、采集待评价人才在社交网络平台上存在操作记录的文本内容,从文本内容中提取情感关键词;S3、将提取出的情感关键词与情感语料库中的情感标准词进行匹配,对情感关键词中情感标准词的出现频次进行统计;S4、对出现频次的统计结果进行对比分析,确定待评价人才的情感倾向程度。与现有技术相比,本发明具有避免偶发因素对情感倾向的判断,提高了情感倾向程度判断结果的准确性和稳定性等优点。
技术领域
本发明涉及人才评价领域,尤其是涉及一种基于情感词匹配与频度结合的情感程度检测方法。
背景技术
情感倾向即是主体对某一客体主观存在的内心喜恶、内在评价的一种倾向,有程度和对象性;情感是态度中的一部分,它与态度中的内向感受、意向具有协调一致性,是态度在生理上一种复杂而稳定的生理评价和体验。情感包括道德感和价值感等方面。
目前词语情感倾向性识别较为成熟,针对文本内容获得有用的倾向性信息和知识已经成为自然语言处理的研究热点,情感词识别和情感词极性判别的方法和技术已经形成相应的体系。在目前的方法中,在对情感词与情感倾向的匹配方面已比较精确,但仅得出了情感词与情感倾向的匹配关系,不能对情感程度进行有效判断,不能确定被评价人才做出的是偶发的行为,还是常态的行为,因此仅凭情感词与情感倾向的匹配关系,就确定被评价人才的情感倾向,具有不确定性且容易产生误判。
发明内容
本发明的目的就是为了克服上述现有技术存在的仅凭情感词与情感倾向的匹配关系确定情感倾向具有不确定性且容易产生误判的缺陷而提供一种基于情感词匹配与频度结合的情感程度检测方法。
本发明的目的可以通过以下技术方案来实现:
一种基于情感词匹配与频度结合的情感程度检测方法,具体包括以下步骤:
S1、获取待评价人才的主题需求信息,根据所述主题需求信息构建相应的情感语料库;
S2、采集待评价人才在社交网络平台上存在操作记录的文本内容,从所述文本内容中提取情感关键词;
S3、将提取出的情感关键词与情感语料库中的情感标准词进行匹配,对情感关键词中情感标准词的出现频次进行统计;
S4、对出现频次的统计结果进行对比分析,确定待评价人才的情感倾向程度。
所述出现频次的类型包括单个情感标准词出现和多个情感标准词组合出现。
进一步地,所述情感标准词组合出现的形式包括情感标准词之间间隔两个字、一个字或没有字。
所述情感标准词组合出现的形式还包括情感标准词之间间隔一个标点符号,所述标点符号不包括句号。
进一步地,所述组合出现的情感标准词的来源包括多个情感语料库。
所述主题需求信息包括政治倾向信息和宗教倾向信息。
所述存在操作记录的文本内容具体为待评价人才公开发表的文本内容。
进一步地,所述公开发表的文本内容通过大数据技术检索得到。
所述出现频次的统计结果具体为根据总出现频次计算得到的情感标准词出现频次的百分数。
进一步地,所述情感标准词出现频次的百分数按照预设的百分数跨度进行分组,每组对应一个情感倾向程度,所述百分数跨度的取值范围为1%~50%。
进一步地,所述百分数跨度的取值优选为10%。
与现有技术相比,本发明具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海柏观数据科技有限公司,未经上海柏观数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110319710.0/2.html,转载请声明来源钻瓜专利网。