[发明专利]一种文字标签方法及文字标签装置有效
申请号: | 201611071138.6 | 申请日: | 2016-11-28 |
公开(公告)号: | CN108121715B | 公开(公告)日: | 2022-01-25 |
发明(设计)人: | 魏冰;李小文;李阳;熊正国;杨帅;孔令军;张璐;白义 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G06F16/48 | 分类号: | G06F16/48 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚开丽;王军红 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 标签 方法 装置 | ||
本发明公开了一种文字标签方法,包括:获取待分析的媒体资源,确定所述媒体资源的媒体类型;根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;通过所述文字标签对所述媒体资源进行标识。本发明还公开了一种文字标签装置。
技术领域
本发明涉及通信领域,尤其涉及一种文字标签方法及文字标签装置。
背景技术
随着多媒体、互联网等技术日渐成熟,教育类资源所包含的消息内容从最初的文本逐渐扩展至语音、图片、视频等富媒体形式。在诸如淘宝、微信等应用中,非文本消息所占的比重也越来越大。其中信息内容的关键信息在用户的使用过程中具有非常重要的作用,目前常见的一些提取技术如下:数据挖掘、视频特征提取和音视频自动标注等。但是,数据挖掘无法实现自动分类及分析;视频特征提取没有针对整个视频主题提取;音视频只针对音频部分内容转换。
因此,亟需一种进行文字标签的技术方案,能自动对非文本内容的媒体资源打文字标签,进行自动标注。
发明内容
有鉴于此,本发明实施例希望提供一种文字标签方法及文字标签装置,能自动对非文本内容的媒体资源打文字标签,进行自动标注。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种文字标签方法,所述方法包括:
获取待分析的媒体资源,确定所述媒体资源的媒体类型;
根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;
通过所述文字标签对所述媒体资源进行标识。
上述方案中,当所述媒体资源的媒体类型为图片时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:
获取所述媒体资源的图片内容;
根据预设的内容库确定所述图片内容对应的主题,将所述主题确定为所述媒体资源的文字标签。
上述方案中,当所述的媒体资源的媒体类型为音频时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:
以第一周期为周期对所述媒体资源进行提取处理,提取第一时间长度的音频文件得到切分音频文件,分别获取各切分音频文件的音频内容;
分别根据各切分音频文件的音频内容确定各切分音频文件对应的主题;
从各切分音频文件对应的主题中选择频率超过第一阈值的主题作为所述媒体资源的文字标签。
上述方案中,当所述媒体资源的媒体类型为视频时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:
以第二周期为周期对所述媒体资源进行提取处理,得到视频数据帧和第二时间长度的提取音频文件,分别获取各视频数据帧的帧内容,并分别获取各提取音频文件的音频内容;
分别根据各视频数据帧的帧内容确定各视频数据帧的帧主题;
分别根据所述各提取音频文件的音频内容确定各提取音频文件的音频主题;
从各视频数据帧的帧主题和所述各提取音频文件的音频主题中选择频率超过第二阈值的主题作为所述媒体资源的文字标签。
上述方案中,所述方法还包括:
当接收到检索词时,查找与所述检索词匹配的文字标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611071138.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:服务提供方法和装置
- 下一篇:一种多媒体视图文件的显示方法、装置及智能终端