[发明专利]一种用工平台正负面评论识别的方法及系统有效

专利信息
申请号: 202110466944.8 申请日: 2021-04-28
公开(公告)号: CN113158669B 公开(公告)日: 2023-03-28
发明(设计)人: 吴晓军;王浩军;陈宁;石越;金利欣 申请(专利权)人: 河北冀联人力资源服务集团有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/284;G06F40/268;G06F40/216;G06F40/237
代理公司: 苏州瞪羚知识产权代理事务所(普通合伙) 32438 代理人: 周治宇
地址: 050073 河北*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用工 平台 负面 评论 识别 方法 系统
【权利要求书】:

1.一种用工平台正负面评论识别的方法,其特征在于,

步骤101,获取评论数据文本并保存为工人评论文本,标记所述工人评论文本中的新增评论文本建立第一文本集合;

步骤102,对用工公司特征矩阵建模,建立标准正面词库和标准负面词库;所述对用工公司特征矩阵建模具体包括:提取用工公司数据,建立用工公司表和公司岗位表,对用工公司表和公司岗位表,建立用工公司特征矩阵其中G表示公司名称,R表示岗位名称,z表示正面评论数,f表示负面评论数,s表示正面评论率,p表示负面评论率;

步骤103,遍历所述第一文本集合,根据关键词类型分别进行数据处理,获得正面评论数、负面评论数、正面评论率、负面评论率;遍历所述第一文本集合,根据关键词类型分别进行数据处理具体包括:遍历文本集合,对每一个新增加的工人评论,对评论进行分词,将分词装载到第一数据集合,遍历第一数据集合FWi(m),其中i表示词性,m表示词语位置,其中词性为名词的,判断第一数据集合是否在用工公司表中,若所述第一数据集合值在用工公司表中,提取特征矩阵其中G取第一数据集合的值,R取评论的工人的岗位;

对于第一数据集合关键词类型为形容词的词汇,与正面词库、负面词库进行比对,若属于正面词库中词汇则特征矩阵中正面计数器加一,若属于负面词库中词汇,则负面计数器加一;

若对于第一数据集合关键词类型为形容词的词汇,既不归属正面词库、又不归属负面词库,则对正面词库和负面词库中全部词汇遍历比对,通过改进的词汇比对算法,计算与每个标准词汇的值;

所述改进的词汇比对算法为:采用基于位置距离的词汇出现概率算法,判断两个词语出现的概率,出现的概率越大则词语之间的关联性越强,若两个词语之间没有关系,其单独出现概率之乘积等于两个词语一起出现的概率,若两个词语之间有关联,其共同出现概率应大于单独出现概率之乘积,具体公式如下:

其中,p(FWi(m1),Zdic(g))为词汇FWi(m1)和正面词库Zdic中位置为g的词汇,在所有文本QK中共同出现的概率;FWi(m1)中i为词性,m1表示词语位置;

其中,p(FWi(m1))为词汇FWi(m1)在所有评论文本QK中出现的概率;

其中,p(Zdic(g))为对比词汇Zdic(g)在所有评论文本QK中出现的概率;

其中,h表示该词汇与产品词汇位置的距离;

其中,r为该词汇与产品词汇位置的历史距离平均距离;

比对负面词库Fdic算法如下:

其中,p(FWi(m1),Fdic(g))为词汇FWi(m1)和负面词库Fdic中位置为g的词汇,在所有文本QK中共同出现的概率;

其中,p(FWi(m1))为词汇FWi(m1)在所有评论文本QK中出现的概率;

其中,p(Fdic(g))为对比词汇Fdic(g)在所有评论文本QK中出现的概率;

其中,h表示该词汇与产品词汇位置的距离;

其中,r为该词汇与产品词汇位置的历史距离平均距离;

步骤104,展示所述正面评论数、负面评论数、正面评论率、负面评论率。

2.根据权利要求1所述的方法,其特征在于,通过基于位置距离的词汇出现概率算法为:

Epre(FWi(m1))

=∑WGS(FWi(m1),Zdic(g1))-∑WGS(FWi(m1),Fdic(g2))

Epre(FWi(m1))大于0.1时,设立临时计数器U,表示正面评论指数,U计数增加1;Epre(FWi(m1))小于-0.1时,设立临时计数器V,表示负面评论指数,V计数增加1;

判断U、V最大值max(U、V),若U最大,该评论语句为正面,将该词汇FWi(m1)加入正面标准词汇库中,并且特征矩阵中,正面计数器加一,若V最大,该评论语句为负面,将该词汇FWi(m1)加入负面标准词汇库中,并且特征矩阵/中,负面计数器加一。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北冀联人力资源服务集团有限公司,未经河北冀联人力资源服务集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110466944.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top