[发明专利]文本审核方法以及装置有效
申请号: | 201910760752.0 | 申请日: | 2019-08-16 |
公开(公告)号: | CN110675269B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 陈永环;邹泊滔;孙清清;王鑫云;王淑钰;赵云;梅树起 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06Q40/08 | 分类号: | G06Q40/08;G06F16/33;G06F16/35 |
代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
地址: | 开曼群岛大开曼岛乔治镇医院*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 审核 方法 以及 装置 | ||
1.一种文本审核方法,包括:
获取待审核文本,并确定所述待审核文本所属的业务维度;
基于所述业务维度对所述待审核文本中包含的关键词进行标注,获得与所述业务维度相关联的业务关键词组成的业务关键词集合;
计算所述业务关键词集合中包含的每个业务关键词在所述待审核文本中的词优化参数;
根据所述词优化参数对所述业务关键词集合中包含的业务关键词进行筛选,获得所述待审核文本的优选关键词集合;
将所述优选关键词集合中包含的每个业务关键词进行向量化处理,根据向量化处理结果获得所述每个业务关键词的向量特征;
将所述向量特征输入至审核模型,对所述待审核文本进行审核,获得所述审核模型输出的所述待审核文本的审核结果。
2.根据权利要求1所述的文本审核方法,所述基于所述业务维度对所述待审核文本中包含的关键词进行标注,获得与所述业务维度相关联的业务关键词组成的业务关键词集合,包括:
通过对所述待审核文本进行分词处理,根据分词处理结果获得所述待审核文本的关键词;
通过对所述关键词进行词性分析,获得与所述业务维度相关联的所述业务关键词;
提取所述业务关键词创建所述业务关键词集合。
3.根据权利要求1所述的文本审核方法,所述计算所述业务关键词集合中包含的每个业务关键词在所述待审核文本中的词优化参数,包括:
确定所述关键词集合中包含的每个业务关键词在所述待审核文本中的业务关键词频次,以及所述业务关键词集合中包含的业务关键词的关键词数目;
计算所述业务关键词频次与所述关键词数目二者的比值,作为所述词优化参数。
4.根据权利要求1所述的文本审核方法,所述将所述优选关键词集合中包含的每个业务关键词进行向量化处理,根据向量化处理结果获得所述每个业务关键词的向量特征,包括:
通过所述优选关键词集合中包含的每个业务关键词构建所述待审核文本的文本共现矩阵;
基于所述文本共现矩阵以及所述优选关键词集合中包含的业务关键词数目确定所述待审核文本的维数;
通过所述待审核文本的所述维数对所述文本共现矩阵进行转换,获得所述每个业务关键词的词向量;
根据所述词向量生成所述每个业务关键词的向量特征。
5.根据权利要求4所述的文本审核方法,所述根据所述词向量生成所述每个业务关键词的向量特征,包括:
确定所述优化关键词集合中包含的每个业务关键词在所述待审核文本中的特征权重;
基于所述特征权重以及所述词向量生成所述每个业务关键词的向量特征。
6.根据权利要求1所述的文本审核方法,所述根据所述词优化参数对所述业务关键词集合中包含的业务关键词进行筛选,获得所述待审核文本的优选关键词集合,包括:
将所述业务关键词结合中包含的每个业务关键词的所述词优化参数与预设参数阈值进行比较;
将所述词优化参数小于所述预设参数阈值的业务关键词从所述业务关键词集合中剔除,获得所述优选关键词集合。
7.根据权利要求1所述的文本审核方法,所述获取待审核文本,并确定所述待审核文本所属的业务维度步骤执行之前,还包括:
根据所述业务维度对待审核文书进行初步审核,获得所述待审核文本的初步审核结果;
基于所述初步审核结果对所述待审核文本进行二次审核,并执行所述获取待审核文本,并确定所述待审核文本所属的业务维度步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910760752.0/1.html,转载请声明来源钻瓜专利网。