[发明专利]一种文本处理方法、装置以及相关设备在审

申请号：	201910304358.6	申请日：	2019-04-16
公开（公告）号：	CN110162624A	公开（公告）日：	2019-08-23
发明（设计）人：	唐亚腾	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F16/35	分类号：	G06F16/35
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郝传鑫;熊永强
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	目标内容属性参数目标文本安全类型目标主题文本处理文本参数组合多个单位多个目标获取目标内容属性内容信息序列识别主题信息
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种文本处理方法、装置以及相关设备，方法包括：获取目标文本，从所述目标文本的主题信息中，获取所述目标文本的目标主题属性参数；将所述目标文本的内容信息划分为多个单位目标内容信息，并获取与每个单位目标内容信息分别对应的目标内容属性参数，将多个目标内容属性参数组合为目标内容属性参数序列；根据所述目标主题属性参数和所述目标内容属性参数序列识别所述目标文本的安全类型。采用本发明，可以提高识别文本安全类型的效率。

技术领域

本发明涉及计算机技术领域，尤其涉及一种文本处理方法、装置以及相关设备。

背景技术

随着通信信息技术的迅速发展，网络信息安全问题日益突出，特别是互联网上色情、暴力、低俗等不良信息的传播，严重破坏社会风气，极大地影响广大青少年的健康成长。数据统计，互联网上的色情文章已经超过2亿篇，由于大多数色情文章都可以随意访问，因此识别出互联网中的色情文章具有重要的社会价值。

现有的识别互联网上的色情文章主要是通过人工审核，即由人工阅读文章并人工自主判断该篇文章是否为色情文章，进而根据人工识别结果确定在互联网上删除该篇文章或者保留该篇文章。

人工识别一篇文章是否为色情文章需要经历人工阅读、理解，判别过程，会耗费大量的时间，造成对色情文章的识别效率低下。

发明内容

本发明实施例提供一种文本处理方法、装置以及相关设备，可以提高识别文本安全类型的效率。

本发明实施例一方面提供了一种文本处理方法，包括：

获取目标文本，从所述目标文本的主题信息中，获取所述目标文本的目标主题属性参数；

将所述目标文本的内容信息划分为多个单位目标内容信息，并获取与每个单位目标内容信息分别对应的目标内容属性参数，将多个目标内容属性参数组合为目标内容属性参数序列；

根据所述目标主题属性参数和所述目标内容属性参数序列识别所述目标文本的安全类型。