[发明专利]一种客服语音智能搜索和分析系统及方法在审
申请号: | 201410048066.8 | 申请日: | 2014-02-11 |
公开(公告)号: | CN103793515A | 公开(公告)日: | 2014-05-14 |
发明(设计)人: | 易中华;武全胜;陆登;王平华 | 申请(专利权)人: | 安徽科大讯飞信息科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 成金玉 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种语音搜索和分析系统,包括:语音转写模块、建立索引模块、语音建索模块、文本分析模块。从而检索出语音中包含的关键词以及关键词出现的位置等特征信息。本发明通过语音分析可以有效的对海量录音文件、音频文件进行分析处理,实现语音中的知识挖掘和对语音文件的快速检索,解决了对语音数据的搜索和分析难题。 | ||
搜索关键词: | 一种 客服 语音 智能 搜索 分析 系统 方法 | ||
【主权项】:
一种语音搜索和分析系统,其特征在于包括:语音转写模块、建立索引模块、语音检索模块、文本分析模块,其中:语音转写模块,实现语音数据向文本数据的转换;接收语音数据并应用语音识别技术进行转写生成文本和属性信息;所述语音识别技术实现过程为:首先进行模数转换,将语音数据数字化,得到录音的数字化信息;再对数字化后的信息进行VAD处理,也就是把首尾端的静音切除,降低对后续步骤造成的干扰,得到VAD段;基于VAD段和特征提取技术区分语音对话角色实现场景分割功能,并将结果以文本形式输出,包括语音对话内容、语音时长、静音信息,至此完成了语音转写过程,并将文本和语音属性信息结果传送至建立索引模块进行结构化建索;建立索引模块,对从语音转写模块接收的文本和语音属性信息进行结构化处理,生成结构化数据;再对生成的结构化数据,应用全文搜索引擎技术建立索引,生成可以进行文本分析和搜索的索引数据,并提供索引查询和分析接口,供语音检索和文本分析使用;语音检索模块,基于建立索引模块的索引查询和接口进行语音搜索,使用全文搜索引擎技术传输关键词、模型、专题、原始维度作为搜索条件进行搜索,返回匹配的录音信息列表,用户可以直接以文字形式查看录音信息列表中的录音,也可以直接以测听语音的形式查看录音,至此已完成语音搜索功能;文本分析模块,基于建立索引模块的索引和接口进行文本分析,多种分析工具可以使用,以建立模型方式进行分类分析,使用热词工具获取热词排行并进行变化趋势分析,直接以关键词搜索方式进行文本分析,使用维度钻取方式进行条件过滤分析,结合模型、关键词、维度钻取方式进行多维交叉分析,多角度、多层次、可视化挖掘海量数据,获取包括趋势信息、热点信息、竞争信息的用户关心的指向性数据;然后以图形、表格形式向用户展示分析产生的这些指向性数据,达到高效沟通的目的,至此完成文本分析功能。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司,未经安徽科大讯飞信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410048066.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种嵌入图像处理软件的移动视觉搜索方法
- 下一篇:路径搜索方法及装置