[发明专利]索引和搜索带有文本元数据的语音有效
申请号: | 200680041464.0 | 申请日: | 2006-10-31 |
公开(公告)号: | CN101305360A | 公开(公告)日: | 2008-11-12 |
发明(设计)人: | A·阿塞罗;C·I·克尔伯;J·S·F·桑彻斯 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/20 | 分类号: | G06F17/20;G06F17/28;G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 通过获得语音数据的词语的出现概率和词语的位置信息并且将它与文本元数据中该词语的至少位置信息组合来创建用于搜索具有语音数据和文本元数据的口语文档的索引。可以创建单个索引,因为语音数据和文本元数据被同样处理并仅被视为不同的类别。 | ||
搜索关键词: | 索引 搜索 带有 文本 数据 语音 | ||
【主权项】:
1.一种索引包含语音数据(52)和文本元数据(54)的口头文档(50)的方法,所述方法包括:生成(305)有关来自语音数据(52)的经识别语音的信息,所述信息包含所述经识别语音中词语的出现概率和所述词语的位置信息;以与所述有关经识别语音的信息实质上相同的格式生成(313)有关文本元数据(54)中词语的至少位置信息的信息;以及基于所述有关经识别语音的信息和所述有关文本元数据的信息构造(314)索引。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200680041464.0/,转载请声明来源钻瓜专利网。