[发明专利]信息处理方法、装置及电子设备在审
申请号: | 201910270744.8 | 申请日: | 2019-04-04 |
公开(公告)号: | CN111797631A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 韩伟 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 孙静;刘芳 |
地址: | 100043 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 电子设备 | ||
本发明实施例提供一种信息处理方法、装置及电子设备,该方法包括:获取待识别的文本信息,依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息;由此可见,本实施例中在进行语义识别之前,无需对语音信息或者文本信息进行任何预切分,避免了切分错误导致的语义识别错误,提高了语义识别的准确率;另外,由于是对各语言单元实时进行语义识别处理,提高了语义识别的实时性。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种信息处理方法、装置及电子设备。
背景技术
随着人机交互技术的发展,语义识别技术显示出其重要性。语义识别是从人类发出的语音信号中提取特征信息并确定其语言含义的过程,主要包括语音识别过程和语义理解过程。语音识别过程是利用声学模型将人类的语音信号转换为文本的过程,语义理解过程是利用自然语言模型对文本的含义进行识别的过程。
现有技术中,在对用户输入的语音信号进行处理时,首先利用语音活动性检测(voice activity detection,VAD)技术,在连续的语音信号中确定出各个语音片段的起始点和终止点,实现对连续语音信号的切分,然后对切换后的语音片段进行语音识别和语义理解,以得到用户的语义。
然而,在实际应用中,由于不同用户的说话语速、说话习惯以及说话人所处场景的不同,通过VAD检测的方式对语句进行切分,使得对语句的切分不够准确,进而导致语义识别的准确率不高。
发明内容
本发明实施例提供一种信息处理方法、装置及电子设备,用以提高语义识别的准确率。
第一方面,本发明实施例提供一种信息处理方法,包括:
获取待识别的文本信息;
依次将所述文本信息的设定数量的词汇确定为语言单元,对所述语言单元进行语义识别处理,并根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息。
可选的,所述语义识别结果包括:语义完整性概率得分和语义信息,所述根据所述语言单元的语义识别结果,确定所述文本信息的有效语义信息,包括:
若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,N大于或等于1。
可选的,所述若连续N个语言单元对应的语义完整性概率得分满足预设条件,则将所述N个语言单元的语义信息作为所述文本信息的有效语义信息,包括:
针对所述语言单元中的任一第一语言单元,获取已缓存的历史语言单元,所述历史语言单元包括所述第一语言单元之前的至少一个语言单元,且所述历史语言单元对应的语义完整性概率得分不满足设定条件;
对所述历史语言单元和所述第一语言单元拼接得到的第二语言单元进行语义识别处理,获取所述第二语言单元的语义识别结果;
若所述第二语言单元的语义完整性概率得分满足设定条件,则将所述第二语言单元的语义信息作为所述文本信息的有效语义信息。
可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:
若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,则确定所述第二语言单元的语义完整性概率得分满足设定条件。
可选的,根据以下步骤确定所述第二语言单元的语义完整性概率得分满足设定条件:
若所述第二语言单元的语义完整性概率得分大于或等于预设阈值,并且,所述第二语言单元的语义完整性概率得分大于或等于所述第二语言单元与第三语言单元拼接得到的语言单元的语义完整性概率得分,则确定所述第二语言单元的语义完整性概率得分满足设定条件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910270744.8/2.html,转载请声明来源钻瓜专利网。