[发明专利]文本的分析方法、设备和存储介质在审
申请号: | 201911126259.X | 申请日: | 2019-11-18 |
公开(公告)号: | CN110837561A | 公开(公告)日: | 2020-02-25 |
发明(设计)人: | 陈汝龙;戴敏;陈誉 | 申请(专利权)人: | 苏州朗动网络科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 董燕 |
地址: | 215000 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分析 方法 设备 存储 介质 | ||
本发明揭示了一种文本的分析方法,所述方法包括:使用复数个情感倾向性分析模型对所述文本进行分析,得到复数个文本的情感倾向性结果;根据不同情感倾向性分析模型的权重,合并所述复数个文本的情感倾向性结果,得到最终的文本的情感倾向性结果。与现有技术相比,本发明的文本的分析方法,采用多个情感倾向性模型对文本进行分析,并按权重对分析结果进行合并,从而可以对文本的情感倾向性做出稳定的分析,并且分析的结果准确度非常高,符合一般人对新闻情感的第一感知。
技术领域
本发明涉及互联网技术领域,尤其涉及一种文本的分析方法、设备和存储介质。
背景技术
所谓情感倾向性分析,就是对文本内容中的主观性信息进行分析,挖掘文本所表达的观点和态度,定性分析出文本内容传递的观点态度是正向情感、负向情感还是中性情感。
目前常用的文本情感分析方法是将文本向量化,然后通过模型进行训练,模型算法一般为SVM、Random Forest、xgboost、adaboost、GBDT等算法。
但是上述这些模型在进行情感倾向性分析时,针对训练模型的测试集未覆盖到的文本类型,情感倾向性分析的结果准确性低。
发明内容
本发明的目的在于提供一种文本的分析方法、设备和存储介质。
为实现上述发明目的之一,本发明一实施方式提供一种文本的分析方法,所述方法包括:
使用复数个情感倾向性分析模型对所述文本进行分析,得到复数个文本的情感倾向性结果;
根据不同情感倾向性分析模型的权重,合并所述复数个文本的情感倾向性结果,得到最终的文本的情感倾向性结果。
作为本发明一实施方式的进一步改进,通过每个情感倾向性分析模型的模拟测试精度,确定所述情感倾向性分析模型的权重。
作为本发明一实施方式的进一步改进,通过每个情感倾向性分析模型的实际测试精度,调整所述复数个情感倾向性分析模型的权重。
作为本发明一实施方式的进一步改进,使用复数个情感倾向性分析模型分别对所述文本的标题和正文进行分析,得到复数个标题的情感倾向性结果和复数个正文的情感倾向性结果;
根据不同情感倾向性分析模型的权重,分别合并所述复数个标题的情感倾向性结果和复数个正文的情感倾向性结果,得到最终的标题的情感倾向性结果和正文的情感倾向性结果;
根据所述标题和正文的情感倾向性的权重,合并所述标题的情感倾向性结果和正文的情感倾向性结果,得到所述文本的情感倾向性结果。
作为本发明一实施方式的进一步改进,所述标题的情感倾向性的权重大于所述正文的情感倾向性的权重。
作为本发明一实施方式的进一步改进,所述标题的情感倾向性的权重与所述正文的情感倾向性的权重之比为7:3。
作为本发明一实施方式的进一步改进,当所述正文的长度超过预定长度阈值,向下调整所述正文的权重,同时向上调整所述标题的权重。
作为本发明一实施方式的进一步改进,当所述正文的长度超过预定长度阈值,舍弃所述正文的超过预定长度阈值的部分,只分析所述正文的剩下部分的情感倾向性。
为实现上述发明目的之一,本发明一实施方式提供一种电子设备,包括存储器和处理器,所述存储器存储有可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意一项所述文本的分析方法中的步骤。
为实现上述发明目的之一,本发明一实施方式提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述文本的分析方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州朗动网络科技有限公司,未经苏州朗动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911126259.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:跨语言交流的语音机器人交互方法及装置
- 下一篇:一种传输装置