[发明专利]一种用工平台正负面评论识别的方法及系统有效
申请号: | 202110466944.8 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113158669B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 吴晓军;王浩军;陈宁;石越;金利欣 | 申请(专利权)人: | 河北冀联人力资源服务集团有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/284;G06F40/268;G06F40/216;G06F40/237 |
代理公司: | 苏州瞪羚知识产权代理事务所(普通合伙) 32438 | 代理人: | 周治宇 |
地址: | 050073 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用工 平台 负面 评论 识别 方法 系统 | ||
本发明提出了一种用工平台正负面评论识别的方法及系统,基于新增评论文本分析用工企业的正负面评论,同时采用改进的基于位置距离的词汇比对算法计算词语之间的关联性,从而计算获得用工公司特征矩阵,在计算完成并获得用工公司特征矩阵后累加在先数据库保存的既往特征矩阵数据,得到用工企业的当前正负面评论数据。本发明仅对新增评论文本进行数据处理,降低了数据处理的时间,减小了程序时间复杂的,同时采用算法通过关联性特征实现正负面数据的计算,提高了算法的效率。
技术领域
本发明涉及自然语言处理的技术领域,特别涉及一种用工平台正负面评论识别的方法及系统。
背景技术
现代社会网络化进程极大加快,平台系统,或者网络已经成为人们表达个人意见和观点的重要渠道。但网络评论具有数据量大、突发性强、影响范围广等特点,信息挖掘难度更加打,如何通过信息技术提取挖掘用户有效信息,并为其他用户作为参考成为一大难题。
现有技术中,通常是通过分词,然后对分词词组进行n-gram处理,利用n-gram中语法对句子单元处理,或者通过上下文语境进行分析,但是这些仅仅通过简单的中文分词以及对于这些词构建神经网络或者语境都只能简单的分析短文本评论的字面语义,并不能应对博大精深的汉语文化,评论的整体语义也会失真。
发明内容
基于上述问题,本发明提供了一种用工平台正负面评论识别方法及系统,通过提取用工平台工人对用人单位评论信息,构建特征矩阵,通过基于位置距离的词汇出现概率算法自动学习分析数据判断工人正负面评论,将分析结果保存到特征矩阵中,用户根据用工公司名称和岗位名称,检索数据,会展现该公司的某个岗位正面评论率,负面评论率,正面评论数和负面评论数等数据。
为实现上述目的,本发明提出了一种用工平台正负面评论识别的方法,
步骤101,获取评论数据文本并保存为工人评论文本,标记所述工人评论文本中的新增评论文本建立第一文本集合;
步骤102,对用工公司特征矩阵建模,建立标准正面词库和标准负面词库;
步骤103,遍历所述第一文本集合,根据关键词类型分别进行数据处理,获得正面评论数、负面评论数、正面评论率、负面评论率;
步骤104,展示所述正面评论数、负面评论数、正面评论率、负面评论率。
进一步地,所述对用工公司特征矩阵建模具体包括:提取用工公司数据,建立用工公司表和公司岗位表,对用工公司表和公司岗位表,建立用工公司特征矩阵其中G表示公司名称,R表示岗位名称,z表示正面评论数,f表示负面评论数,s表示正面评论率,p表示负面评论率。
进一步地,遍历所述第一文本集合,根据关键词类型分别进行数据处理具体包括:遍历文本集合,对每一个新增加的工人评论,对评论进行分词,将分词装载到第一数据集合,遍历第一数据集合,其中词性为名词的,判断第一数据集合是否在用工公司表中,若所述第一数据集合值在用工公司表中,提取特征矩阵其中G取第一数据集合的值,R取评论的工人的岗位;
对于第一数据集合关键词类型为形容词的词汇,与正面词库、负面词库进行比对,若属于正面词库中词汇则特征矩阵中正面计数器加一,若属于负面词库中词汇,则负面计数器加一;
若对于第一数据集合关键词类型为形容词的词汇,既不归属正面词库、又不归属负面词库,则对正面词库和负面词汇库负面词库中全部词汇遍历比对,通过改进的词汇比对算法,计算与每个标准词汇的值。
进一步地,所述改进的词汇比对算法为:采用基于位置距离的词汇出现概率算法,判断两个词语出现的概率,出现的概率越大则词语之间的关联性越强,若两个词语之间没有关系,其单独出现概率之乘积等于两个词语一起出现的概率,若两个词语之间有关联,其共同出现概率应大于单独出现概率之乘积,具体公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北冀联人力资源服务集团有限公司,未经河北冀联人力资源服务集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110466944.8/2.html,转载请声明来源钻瓜专利网。