[发明专利]一种用工平台正负面评论识别的方法及系统有效
申请号: | 202110466944.8 | 申请日: | 2021-04-28 |
公开(公告)号: | CN113158669B | 公开(公告)日: | 2023-03-28 |
发明(设计)人: | 吴晓军;王浩军;陈宁;石越;金利欣 | 申请(专利权)人: | 河北冀联人力资源服务集团有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/284;G06F40/268;G06F40/216;G06F40/237 |
代理公司: | 苏州瞪羚知识产权代理事务所(普通合伙) 32438 | 代理人: | 周治宇 |
地址: | 050073 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用工 平台 负面 评论 识别 方法 系统 | ||
1.一种用工平台正负面评论识别的方法,其特征在于,
步骤101,获取评论数据文本并保存为工人评论文本,标记所述工人评论文本中的新增评论文本建立第一文本集合;
步骤102,对用工公司特征矩阵建模,建立标准正面词库和标准负面词库;所述对用工公司特征矩阵建模具体包括:提取用工公司数据,建立用工公司表和公司岗位表,对用工公司表和公司岗位表,建立用工公司特征矩阵其中G表示公司名称,R表示岗位名称,z表示正面评论数,f表示负面评论数,s表示正面评论率,p表示负面评论率;
步骤103,遍历所述第一文本集合,根据关键词类型分别进行数据处理,获得正面评论数、负面评论数、正面评论率、负面评论率;遍历所述第一文本集合,根据关键词类型分别进行数据处理具体包括:遍历文本集合,对每一个新增加的工人评论,对评论进行分词,将分词装载到第一数据集合,遍历第一数据集合FWi(m),其中i表示词性,m表示词语位置,其中词性为名词的,判断第一数据集合是否在用工公司表中,若所述第一数据集合值在用工公司表中,提取特征矩阵其中G取第一数据集合的值,R取评论的工人的岗位;
对于第一数据集合关键词类型为形容词的词汇,与正面词库、负面词库进行比对,若属于正面词库中词汇则特征矩阵中正面计数器加一,若属于负面词库中词汇,则负面计数器加一;
若对于第一数据集合关键词类型为形容词的词汇,既不归属正面词库、又不归属负面词库,则对正面词库和负面词库中全部词汇遍历比对,通过改进的词汇比对算法,计算与每个标准词汇的值;
所述改进的词汇比对算法为:采用基于位置距离的词汇出现概率算法,判断两个词语出现的概率,出现的概率越大则词语之间的关联性越强,若两个词语之间没有关系,其单独出现概率之乘积等于两个词语一起出现的概率,若两个词语之间有关联,其共同出现概率应大于单独出现概率之乘积,具体公式如下:
其中,p(FWi(m1),Zdic(g))为词汇FWi(m1)和正面词库Zdic中位置为g的词汇,在所有文本QK中共同出现的概率;FWi(m1)中i为词性,m1表示词语位置;
其中,p(FWi(m1))为词汇FWi(m1)在所有评论文本QK中出现的概率;
其中,p(Zdic(g))为对比词汇Zdic(g)在所有评论文本QK中出现的概率;
其中,h表示该词汇与产品词汇位置的距离;
其中,r为该词汇与产品词汇位置的历史距离平均距离;
比对负面词库Fdic算法如下:
其中,p(FWi(m1),Fdic(g))为词汇FWi(m1)和负面词库Fdic中位置为g的词汇,在所有文本QK中共同出现的概率;
其中,p(FWi(m1))为词汇FWi(m1)在所有评论文本QK中出现的概率;
其中,p(Fdic(g))为对比词汇Fdic(g)在所有评论文本QK中出现的概率;
其中,h表示该词汇与产品词汇位置的距离;
其中,r为该词汇与产品词汇位置的历史距离平均距离;
步骤104,展示所述正面评论数、负面评论数、正面评论率、负面评论率。
2.根据权利要求1所述的方法,其特征在于,通过基于位置距离的词汇出现概率算法为:
Epre(FWi(m1))
=∑WGS(FWi(m1),Zdic(g1))-∑WGS(FWi(m1),Fdic(g2))
Epre(FWi(m1))大于0.1时,设立临时计数器U,表示正面评论指数,U计数增加1;Epre(FWi(m1))小于-0.1时,设立临时计数器V,表示负面评论指数,V计数增加1;
判断U、V最大值max(U、V),若U最大,该评论语句为正面,将该词汇FWi(m1)加入正面标准词汇库中,并且特征矩阵中,正面计数器加一,若V最大,该评论语句为负面,将该词汇FWi(m1)加入负面标准词汇库中,并且特征矩阵/中,负面计数器加一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北冀联人力资源服务集团有限公司,未经河北冀联人力资源服务集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110466944.8/1.html,转载请声明来源钻瓜专利网。