[发明专利]电话自然对话中关键信息的挖掘系统及其方法无效
申请号: | 200810026367.5 | 申请日: | 2008-02-19 |
公开(公告)号: | CN101231660A | 公开(公告)日: | 2008-07-30 |
发明(设计)人: | 林超 | 申请(专利权)人: | 林超 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/08;G10L15/02 |
代理公司: | 广州市华学知识产权代理有限公司 | 代理人: | 李卫东 |
地址: | 510640广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电话 自然 对话 关键 信息 挖掘 系统 及其 方法 | ||
1.电话自然对话中关键信息的挖掘系统,其特征在于包括依次连接的电话语音检出模块、语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库,所述语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库设置在计算机内;所述电话语音检出模块通过PSTN或者Internet与语音输出设备连接。
2.根据权利要求1所述电话自然对话中关键信息的挖掘系统,其特征在于:所述语音关键词抽取模块包括维特比解码器及其分别连接的特征提取模块、声学模型训练及转换模块、关键词配置及转换模块。
3.根据权利要求2所述电话自然对话中关键信息的挖掘系统,其特征在于:所述数据挖掘模块包括无效词过滤模块及其分别连接的同义及近义分析推荐模块、关联分析推荐模块、汇总模块;无效词过滤模块与所述语音关键词数据库连接;所述同义及近义分析推荐模块包括依次连接的人工编辑模块、同义及近义分析模块,所述关联分析推荐模块包括依次连接的潜在词义分析模块、关联分析模块,所述同义及近义分析模块、关联分析模块分别与无效词过滤模块连接;汇总模块与所述同义及近义分析模块、关联分析模块、用户偏好数据库分别连接。
4.根据权利要求1-3任一项所述电话自然对话中关键信息的挖掘系统,其特征在于:所述语音输出设备包括固定电话、移动电话、麦克风。
5.采用权利要求4所述电话自然对话中关键信息的挖掘系统的电话自然对话中关键信息的挖掘方法,其特征在于包括以下步骤:
(1)通过电话语音检出模块从通信网络中采用VAD方法检出电话用户通话过程中的语音片段,并传送给计算机内的语音关键词抽取模块;
(2)根据本系统使用者的数据挖掘需要,语音关键词抽取模块进行关键词配置操作,并从上述语音片段中抽取关键词;
(3)根据所述语音关键词抽取模块抽取的关键词,建立语音关键词数据库,保存所述关键词和对应的电话用户信息;
(4)通过数据挖掘模块对所述语音关键词数据库进行挖掘分析处理,挖掘出该电话用户多次使用的关键词,过滤掉无效的关键词,并挖掘所述关键词的推荐的同义词、近义词、高度关联词的集合即用户使用偏好关键词进行汇总输出;
(5)建立用户偏好数据库,保存并管理相应电话用户信息及用户使用偏好关键词。
6.根据权利要求5所述电话自然对话中关键信息的挖掘方法,其特征在于:所述关键词根据本系统使用者的需要进行设定。
7.根据权利要求5所述电话自然对话中关键信息的挖掘方法,其特征在于:步骤(2)中,所述语音关键词抽取模块进行关键词配置操作,并从上述语音片段中抽取关键词的步骤包括:
通过关键词配置及转换模块对用户感兴趣的关键词进行配置操作,包括查找、修改、添加、删除以及设定不同的语种,得出所有待检关键词,再转换成维特比解码器识别的格式后供给维特比解码器使用;根据上述设定的语种,通过声学模型训练及转换模块,预先训练不同语种的声学模型,转换成维特比解码器识别的格式后供给维特比解码器使用;语音经过特征提取模块时,将语音波形信号转换成倒谱特征的语音信号,并输入到维特比解码器中,同时,输入上述转换格式后的关键词和声学模型,通过维特比解码器进行KWS检索即关键词检索,从而抽取语音片段中的关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林超,未经林超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810026367.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:自调钉针力的储能式钳型订书机
- 下一篇:汽车及其控制方法