[发明专利]评价文本的处理方法、装置以及计算机设备在审
申请号: | 202110390178.1 | 申请日: | 2021-04-12 |
公开(公告)号: | CN113052487A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 陆园丽 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/33;G06F16/35;G06F40/211;G06F40/289;G06F40/30 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;陈秋波 |
地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评价 文本 处理 方法 装置 以及 计算机 设备 | ||
1.一种评价文本的处理方法,其特征在于,包括:
获取员工的原始评价文本;
基于特殊标识符识别所述原始评价文本中的注释内容,并对所述注释内容进行正则化清洗,得到暂时文本;
识别所述暂时文本中的各个句子的信息,并基于预设的信息分类方法对各个句子进行分类;
分类完成后,在每个类别中筛选出各个类别的主题信息;
将所述主题信息进行标准化处理,得到对应的标准化主题信息;
对所述标准化主题信息进行句法分析,提取所述标准化主题信息中的句子关键要素;
根据所述关键要素形成评价短句,并将各所述评价短句作为所述员工的评价。
2.如权利要求1所述的评价文本的处理方法,其特征在于,所述将各所述评价短句作为所述员工的评价的步骤,包括:
通过预设的情感词典对所述评价短句,以及所述评价短句对应的主题信息分别进行情感词识别,分别得到第一情感分值和第二情感分值;
判断所述第一情感分值和所述第二情感分值的差值是否小于情感阈值;
若小于所述情感阈值,则将所述评价短句作为所述员工的评价。
3.如权利要求1所述的评价文本的处理方法,其特征在于,所述将所述主题信息进行标准化处理,得到对应的标准化主题信息的步骤,包括:
将所述主题信息进行预处理,并建立TOKEN列表将预处理后的所述主题信息导入数据集,其中所述预处理包括根据所述特殊字符标识库剔除所述主题信息中的标点符号、统一语种以及删除不相关词句,所述不相关词句包括问候语、形容词以及脏词;
通过BERT中文训练模型读取所述数据集的文本数据,通过BERT训练模型fine-tuning的方式构建词向量,其中所述BERT训练模型基于专业词库训练而成;
在循环神经网络内依次输入所述文本数据对应的所述词向量,所述词向量具有n个,分别为x1,x2,…,xn;
通过公式ot=softmax(Vst)计算得到输出向量ot,再将所述输出向量ot进行排列得到所述标准化主题;其中,st=f(Uxt+Wst-1+b),st为第t步的计算函数,所述xt为第t个词向量,s0为0向量,V、U、W、b均为预设的参数。
4.如权利要求1所述的评价文本的处理方法,其特征在于,所述基于预设的信息分类方法对各个句子进行分类的步骤,包括:
通过文本分类器对所述句子进行分词;
将分词后的所述句子向量化,得到目标向量的多维坐标X=(x1,x2,x3…xn),其中所述目标向量为所述句子对应的向量;
根据公式计算目标向量与预存向量之间的第二相似值,其中,所述Y是预存数据库中各预存向量的多维坐标,Y=(y1,y2,y3…yn);
判断所述第二相似值是否大于第二预设相似度阈值;
若大于第二预设相似度阈值,则将所述句子划分至所述预存向量所属的类别。
5.如权利要求1所述的评价文本的处理方法,其特征在于,所述分类完成后,在每个类别中筛选出各个类别的主题信息的步骤,包括:
从所述暂时文本中获取具有第一类别的目标句子;
定位各所述目标句子中与所述第一类别相关的关键词,并基于所述关键词找出形容所述关键词的形容词;
将所述形容词和所述关键词作为所述第一类别的主题信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110390178.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种阻燃环氧树脂泡沫材料及其制备方法与应用
- 下一篇:一种输送设备及安检系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理