[发明专利]电话自然对话中关键信息的挖掘系统及其方法无效
申请号: | 200810026367.5 | 申请日: | 2008-02-19 |
公开(公告)号: | CN101231660A | 公开(公告)日: | 2008-07-30 |
发明(设计)人: | 林超 | 申请(专利权)人: | 林超 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G10L15/08;G10L15/02 |
代理公司: | 广州市华学知识产权代理有限公司 | 代理人: | 李卫东 |
地址: | 510640广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电话 自然 对话 关键 信息 挖掘 系统 及其 方法 | ||
技术领域
本发明通信网络语音数据挖掘技术,具体是指电话自然对话中关键信息的挖掘系统及其方法。
背景技术
近年来,各种文本数据挖掘(Data Mining)技术(如潜在语义分析技术LSA等等)已经广泛应用于电子商务中的商品推荐、文献搜索中的类似文献推荐等。它能够找出购买该种商品的用户通常会购买其他何种商品,搜索该文献的用户通常会查阅其他何种文献等有用信息,让用户更惬意地享受信息服务。信息提供商根据数据挖掘技术收集统计、预测分析得到的数据、信息,为企业分析发现商机,有针对性、有步骤地进行商业拓展、市场营销活动提供了有力的支撑。
专利申请号为200610012722.4的中国发明专利申请“一种预测新业务潜在用户的数据挖掘模型”公开了一种预测新业务潜在用户的数据挖掘模型,该数据挖掘模型包括以下步骤:1)业务理解;2)数据理解;3)数据分析;4)数据挖掘,得到潜在用户。其采用了数据挖掘、数据仓库、OLAP分析等技术,通过分析客户所有行为特征中的相似行为特征,搜索数据库,从而得到具有该相似行为特征的其他客户,该其他客户即为潜在客户;所述相似行为特征包括有通信次数、通信费用、短信次数、短信费用、GPRS费用、WAP费用等等;通过本发明可以形成各种关联分析和预测分析,可以为企业的营销决策提供有效支持。但是其所选取的行为特征只是属于“面”层次上的数据信息挖掘分析,无法获取并分析客户的兴趣爱好或消费需求、习惯、范围、类别等更加具体、属于“点”层次上的数据信息,从而使信息提供商无法为企业提供更具体更有针对性的数据信息,所提供数据信息的商业价值受到局限。
而人们在日常购物的电话对话中,往往会蕴含着大量反映通话双方的兴趣爱好或消费需求、习惯、范围、类别等更加具体、属于“点”层次上的数据。若能将目前已经发展成熟的语音识别(Speech Recognition)、数据挖掘(DataMining)、语音行为检测(VAD,Voice Activity Detection)、关键词检索(KWS,Key Word Spotting)、大型数据库干台(如SQL Server、Oracle等)、数据库访问编程等技术进行整合,将语音技术和文本数据挖掘合为一体,形成一种从语音中提取有用信息的数据挖掘方法,则该方法将具有广泛的商业应用前景。
发明内容
本发明的目的就是为了解决和克服现有技术存在的问题和缺陷,提供一种电话自然对话中关键信息的挖掘系统,其可以从自有的电话语音数据库中挖掘用户的兴趣爱好或消费需求、习惯、范围、类别等数据信息,建立用户偏好数据库,可以为企业的营销决策提供更为可靠且全面有效的支持。
本发明的另一目的是提供上述系统的电话自然对话中关键信息的挖掘方法。
本发明的目的通过下述技术方案实现:本电话自然对话中关键信息的挖掘系统,包括依次连接的电话语音检出模块、语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库,所述语音关键词抽取模块、语音关键词数据库、数据挖掘模块、用户偏好数据库设置在计算机内;所述电话语音检出模块通过PSTN(Public Switched Telephone Network,公共交换电话网络)或者Internet(采用VIOP:Voice over Internet Protocol,互联网协议语音技术)与语音输出设备连接。
为更好地实现本发明,所述语音关键词抽取模块包括维特比解码器及其分别连接的特征提取模块、声学模型训练及转换模块、关键词配置及转换模块。
所述数据挖掘模块包括无效词过滤模块及其分别连接的同义及近义分析推荐模块、关联分析推荐模块、汇总模块;无效词过滤模块与所述语音关键词数据库连接;所述同义及近义分析推荐模块包括依次连接的人工编辑模块、同义及近义分析模块,所述关联分析推荐模块包括依次连接的潜在语义分析模块、关联分析模块,所述同义及近义分析模块、关联分析模块分别与无效词过滤模块连接;汇总模块与所述同义及近义分析模块、关联分析模块、用户偏好数据库分别连接。
所述语音输出设备包括固定电话、移动电话、麦克风。
采用上述电话自然对话中关键信息的挖掘系统的挖掘方法,其包括以下步骤:
(1)通过电话语音检出模块从通信网络中采用VAD方法检出电话用户通话过程中的语音片段,并传送给计算机内的语音关键词抽取模块;
(2)根据本系统使用者的数掘挖掘需要,语音关键词抽取模块进行关键词配置操作,并从上述语音片段中抽取关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林超,未经林超许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810026367.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:自调钉针力的储能式钳型订书机
- 下一篇:汽车及其控制方法