[发明专利]信息处理方法、装置及电子设备有效
申请号: | 201910271177.8 | 申请日: | 2019-04-04 |
公开(公告)号: | CN111797632B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 韩伟 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/279;G06F16/335;G10L15/26 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 孙静;刘芳 |
地址: | 100043 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 电子设备 | ||
本发明实施例提供一种信息处理方法、装置及电子设备,获取输入智能设备的语音信息;对语音信息进行语音识别处理,得到语音信息对应的文本信息,文本信息包括至少一个词汇以及各词汇的时间信息;根据词汇的时间信息,对文本信息进行划分,得到至少一个文本片段;根据至少一个文本片段的语义识别结果,获取语音信息的有效语义信息;本实施例对语音信息不进行切分而直接识别为文本信息,在根据各词汇的时间信息对文本信息进行切分的过程考虑了自然语言理解,使得对文本信息的切分结果更加准确,进而根据切分后的文本片段的语义识别结果确定语音信息的有效语义信息,能够提高语义识别的准确率。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种信息处理方法、装置及电子设备。
背景技术
随着人机交互技术的发展,语义识别技术显示出其重要性。语义识别是从人类发出的语音信号中提取特征信息并确定其语言含义的过程,主要包括语音识别过程和语义理解过程。语音识别过程是利用声学模型将人类的语音信号转换为文本的过程,语义理解过程是利用自然语言模型对文本的含义进行识别的过程。
现有技术中,在对用户输入的语音信号进行处理时,首先利用语音活动性检测(voice activity detection,VAD)技术,在连续的语音信号中确定出各个语音片段的起始点和终止点,实现对连续语音信号的切分,然后对切换后的语音片段进行语音识别和语义理解,以得到用户的语义。
然而,在实际应用中,由于不同用户的说话语速、说话习惯以及说话人所处场景的不同,通过VAD检测的方式对语句进行切分,使得对语句的切分不够准确,进而导致语义识别的准确率不高。
发明内容
本发明实施例提供一种信息处理方法、装置及电子设备,用以提高语义识别的准确率。
第一方面,本发明实施例提供一种信息处理方法,包括:
获取输入智能设备的语音信息;
对所述语音信息进行语音识别处理,得到所述语音信息对应的文本信息,所述文本信息包括至少一个词汇以及各所述词汇的时间信息,所述时间信息用于指示所述智能设备采集到所述词汇对应的语音帧的时间;
根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段;
根据所述至少一个文本片段的语义识别结果,获取所述语音信息的有效语义信息。
可选的,所述根据所述词汇的时间信息,对所述文本信息进行划分,得到至少一个文本片段,包括:
根据各所述词汇的时间信息,获取所述文本信息中相邻两个词汇之间的时间间隔;
若所述时间间隔满足设定条件,则确定在所述两个词汇之间设置切分点;
根据所确定的切分点,对所述文本信息进行切分,得到所述至少一个文本片段。
可选的,所述若所述时间间隔满足设定条件,则确定在所述两个词汇之间设置切分点,包括:
若所述时间间隔大于或等于目标阈值,则确定在所述两个词汇之间设置切分点。
可选的,所述方法还包括:
根据至少一个所述时间间隔,确定所述语音信息的语速等级;
根据语速等级与时间阈值之间的对应关系,将与所述语音信息的语速等级对应的时间阈值作为所述目标阈值。
可选的,所述方法还包括:
根据所述文本信息的各所述时间间隔,获取所述时间间隔的第一平均值,并将所述第一平均值确定为所述目标阈值;或者,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910271177.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钻井液安全密度设计的方法及设备
- 下一篇:定位解锁装置、换电设备和控制方法