[发明专利]电力营业厅人员语音异常事件识别方法及装置在审
申请号: | 201710154029.9 | 申请日: | 2017-03-15 |
公开(公告)号: | CN106971710A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 王贻亮;乔学明;吕梁;尹明立;朱伟义;刘乘麟;孟平;汤耀;孙海峰;王飞 | 申请(专利权)人: | 国网山东省电力公司威海供电公司;国家电网公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/05;G10L25/63;G06Q10/06 |
代理公司: | 威海科星专利事务所37202 | 代理人: | 初姣姣 |
地址: | 264200*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电力 营业厅 人员 语音 异常 事件 识别 方法 装置 | ||
技术领域
本发明涉及服务水平评估技术领域,具体的说是一种基于短时能量语音特征的电力营业厅人员语音异常事件识别方法及装置。
背景技术
企业的服务质量关系着企业的发展,如果服务做得不到位,就不能赢得客户和整个行业的口碑,没有好的口碑企业将无法长足发展。所以,企业的服务质量就显得至关重要。供电营业厅作为电力客户办理用电业务的服务窗口,直接与客户面对面打交道,工作人员的一言一行无不彰显着企业服务质量和国网品牌形象。营业人员的素质直接影响着供电服务质量,作为直接面向客户服务的营业人员,其服务态度的好坏关系着客户体验和服务质量。因此,实现对营业人员服务态度的监管,可作为提升其服务质量的有效手段之一。
对营业人员进行服务态度监管,可以采用的手段主要有两种:第一种是采集视频信息通过人工监管的方式,根据视频监控,通过营业员的面部表情、动作等信息判断营业员的服务态度,这种方式需要人工坚守,增加了人工成本,而且由于人自身生理上的弱点,无法察觉细小的情节,从而导致管理上的疏漏,使得管理效率比较低。第二种方式是采集营业员的语音对话,通过分析语音来判断营业员当前的情绪状态,这种方式实现简单,无需人工坚守、轮训,系统自动分析推送异常信息。
在对营业员情绪进行监管时,采用智能音频分析,具有直观、准确、及时和内容丰富等优越性。语音中的短时能量表现为声音的响度,当人处于愤怒等激动情绪时声音的响度会增大很多,因此利用语音的短时能量特征值判断营业员的情绪变化,具有很好的区分性。
发明内容
为解决上述问题,提出一种基于短时能量的电力营业厅人员语音异常事件识别方法及装置,通过对电力营业员的语音分析,监控营业员服务态度,当营业员出现异常情绪时将异常情绪事件存档,作为考核营业员的参考。
为实现上述目的,本发明采用如下方案:
一种电力营业厅人员语音异常事件识别方法,包含以下步骤:
步骤A,对输入的语音进行预处理,主要是对语音进行端点检测和去噪处理,然后输出处理后的语音,
步骤B,将预处理后的语音进行分割,截取成大小相同的语音段,计算每个语音段的短时能量特征值,输出每个语音段及其短时能量特征值,
步骤C,接收步骤B输出的数据,将第一段语音段的短时能量特征值作为参照值,其他语音段的短时能量特征值分别与参照值进行比较,判断每个语音段的异常情况,输出异常语音段,
步骤D,处理异常事件,对步骤C输出的异常语音进行数据存储,将异常事件信息推送给管理员进行核实。
所述步骤A中,对语音的端点检测主要包括以下步骤:
步骤A1,利用迭代算法训练无声语音段和有声语音段的短时平均能量过度阈值,
步骤A2,分帧处理待检测的语音,提取语音的第一帧,
步骤A3,计算已提取帧的短时平均能量值,判断是否超过过度阈值,没有超过,提取下一帧,继续执行步骤A3,超过则说明该帧时语音段的端点,执行步骤A4,
步骤A4,输出检测到的端点后的语音。
所述步骤A1中的迭代算法,具体实现步骤如下:
A1.1采集数量相同的无声语音段和有声语音段训练样本,
A1.2计算每个语音段的短时能量特征值,依据计算,其中w(n)为窗函数,N为窗长,
A1.3求无声语音段的平均短时能量值M1和有声语音段的平均短时能量值M2,设定M=(M1+M2)/2为初始阈值,
A1.4所有测试样本,如果其短时能量值大于阈值M判定为有声,否则判定为无声,
A1.5根据判断结果与样本数据,计算判断的有声语音与无声语音的准确率,
A1.6如果无声语音的准确率大于有声语音的准确率,则向下调整阈值M,执行A1.4,如果无声语音的准确率小于有声语音的准确率向上调整阈值M,执行A1.4。当无声语音的准确率大于有声语音的准确率相同时则返回阈值M为有声语音和无声语音过度阈值。
所述步骤B中,将预处理后的语音进行分割,截取成大小相同的语音段,计算每个语音段的短时能量特征值,输出每个语音段及其短时能量特征值,主要实现步骤如下:
B1,将预处理后的语音分割成时间段相同的语音段,按语音段的起始时间命名该语音段,
B2,计算每段语音的短时能量特征值,通过计算,其中w(n)为窗函数,N为窗长,
B3,将每个语音段及其短时能量特征值输出,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网山东省电力公司威海供电公司;国家电网公司,未经国网山东省电力公司威海供电公司;国家电网公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710154029.9/2.html,转载请声明来源钻瓜专利网。