[发明专利]一种标题文本处理方法、装置、电子设备及存储介质有效
申请号: | 202010298474.4 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111507097B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 刘刚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 李娟 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标题 文本 处理 方法 装置 电子设备 存储 介质 | ||
本申请涉及互联网技术领域,尤其涉及一种标题文本处理方法、装置、电子设备及存储介质,用以提高标题审核的效率。本申请实施例分别以不同的字符个数为分词单位,对待检测标题文本进行分词处理得到待检测标题文本对应的一组分词;针对每个分词,获得各分词中每个字符对应的字向量、文本向量以及位置向量,并确定每个字符对应的融合向量;根据各分词中每个字符对应的融合向量,获得待检测标题文本对应的标题文本质量评价信息;根据标题文本质量评价信息,对待检测标题文本执行相应的控制策略。由于本申请实施例提供的标题文本方法,可以通过机器自动执行标题文本质量的审核,提高审核效率,降低审核成本。
背景技术
许多用户可以通过在自媒体应用上发布图文内容或者视频内容进行网络社交活动,自媒体应用将这些图文内容或者视频内容以信息流(feeds)的形式进行推送。
为了保证推送的图文内容或者视频内容的安全性,例如是否政治敏感、是否涉及黄赌毒等,从用户上传图文内容或者视频内容到自媒体应用推送图文内容或者视频内容的过程中,需要自媒体应用后台对用户上传的图文内容或者视频内容进行审核,通常对发布的内容从标题、封面、图文或视频的具体内容多个方面进行审核。其中,标题质量的审核是审核过程中至关重要的一环。
随着互联网的快速发展,图文内容以及视频内容的上传量大幅增长,但是目前上传内容的标题通常都是由人工进行审核,导致审核效率较低。
发明内容
本申请提供一种标题文本处理方法、装置、电子设备及存储介质,用以提高标题审核的效率。
第一方面,本申请提供了一种标题文本处理方法,包括:
分别以不同的字符个数为分词单位,对待检测标题文本进行分词处理得到待检测标题文本对应的一组分词,每个分词包括至少一个字符;
针对每个分词,获得各分词中每个字符对应的字向量、文本向量以及位置向量,并确定每个字符对应的融合向量;其中,字符的字向量用于表示字符的标识信息,字符的文本向量用于表示字符在所在分词中的语义信息,字符的位置向量用于表示字符在待检测文本和所在分词中的位置信息,字符的融合向量是对字符对应的字向量、文本向量以及位置向量进行融合处理得到的;
根据各分词中每个字符对应的融合向量,获得待检测标题文本对应的标题文本质量评价信息;
根据标题文本质量评价信息,对待检测标题文本执行相应的控制策略。
第二方面,本申请实施例提供一种标题文本处理装置,包括:
分词模块,用于分别以不同的字符个数为分词单位,对待检测标题文本进行分词处理得到待检测标题文本对应的一组分词,每个分词包括至少一个字符;
确定模块,用于针对每个分词,获得各分词中每个字符对应的字向量、文本向量以及位置向量,并确定每个字符对应的融合向量;其中,字符的字向量用于表示字符的标识信息,字符的文本向量用于表示字符在所在分词中的语义信息,字符的位置向量用于表示字符在待检测文本和所在分词中的位置信息,字符的融合向量是对字符对应的字向量、文本向量以及位置向量进行融合处理得到的;
获取模块,用于根据各分词中每个字符对应的融合向量,获得待检测标题文本对应的标题文本质量评价信息;
控制模块,用于根据标题文本质量评价信息,对待检测标题文本执行相应的控制策略。
第三方面,本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本申请提供的标题文本处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010298474.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习技术的医学图像增强方法
- 下一篇:第三类热驱动压缩式热泵