[发明专利]一种添加多媒体文件的方法及设备有效
申请号: | 201410067024.9 | 申请日: | 2014-02-26 |
公开(公告)号: | CN104866511B | 公开(公告)日: | 2018-10-02 |
发明(设计)人: | 王睿;关国锋 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 添加 多媒体 文件 方法 设备 | ||
1.一种添加多媒体文件的方法,其特征在于,包括:
获取字符文本;
对所述字符文本进行解析,得到检索关键词组;
根据所述检索关键词组,在预置的多媒体库中检索与所述检索关键词组相匹配的多媒体列表;
计算所述多媒体列表中多媒体文件的置信度;
若确定出所述多媒体列表中多媒体文件的置信度满足预设条件时,将置信度满足预设条件的多媒体文件添加至文本;
所述计算所述多媒体列表中多媒体文件的置信度,包括:
若所述检索关键词组中关键词全部命中多媒体文件,则将全部命中的多媒体文件标记为相关,且将所述全部命中的多媒体文件的置信度设置为1;
若所述检索关键词组中关键词部分命中多媒体文件,则将部分命中的多媒体文件标记为相关,且利用公式:
confidence=wprimary*hit_ratioprimary+wsecondary*hit_ratiosecondary
计算所述部分命中的多媒体文件的置信度,其中,所述confidence为所述部分命中的多媒体文件的置信度,所述wprimary为主属性关键词组的权重值,所述wsecondary为从属性关键词组的权重值,所述hit_ratioprimary为所述主属性关键词组的命中率,所述hit_ratiosecondary为所述从属性关键词组的命中率,所述命中率为命中的关键词个数占检索关键词组中全部关键词个数的比值。
2.根据权利要求1所述的方法,其特征在于,所述对所述字符文本进行解析,得到检索关键词组包括:
对所述字符文本进行词法解析;
对词法解析得到的结果进行句法解析;
对句法解析得到的结果进行语义解析,输出检索关键词组。
3.根据权利要求2所述的方法,其特征在于,所述对所述字符文本进行词法解析,包括:
对所述字符文本进行分词;
对分词后得到的词语、词组、短语进行命名实体识别;
根据预置同义词组列表,将进行命名实体识别后得到的拥有多种同义表述的词语规范化为同义词组的标准词,所述标准词即为所述词法解析得到的结果。
4.根据权利要求2或3所述的方法,其特征在于,所述对词法解析得到的结果进行句法解析,包括:
对所述词法解析得到的结果进行词性标注;
对词性标注后的输出结果进行分析,得到输出结果中的词语、词组之间的彼此主从、修饰关系,并生成对应的语法分析树。
5.根据权利要求2或3所述的方法,其特征在于,所述对句法解析得到的结果进行语义解析,输出检索关键词组,包括:
结合预置知识库,对句法解析得到的词语、词组之间的彼此主从、修饰关系进行分析,识别字符文本的语义和意图,并生成检索关键词组,其中,所述检索关键词组包括主属性关键词组和从属性关键词组,所述从属性关键词组用于修饰所述主属性关键词组表征的对象的属性。
6.根据权利要求1至3任一项所述的方法,其特征在于,所述若确定出所述多媒体列表中多媒体文件的置信度满足预设条件时,将置信度满足预设条件的多媒体文件添加至文本,包括:
将多媒体文件置信度最大确定为满足预设条件,在所述多媒体列表中获取到多媒体文件置信度最大的多媒体文件,并将所述多媒体文件置信度最大的多媒体文件添加至文本。
7.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
若所述检索关键词组的任一关键词均未命中多媒体文件,则确定出所述预置的多媒体库中不存在与所述检索关键词组相匹配的多媒体文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410067024.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:提取网页内容的方法、装置及系统
- 下一篇:数据匹配的方法及装置