[发明专利]对流式语音识别文本进行断句的方法及装置有效
申请号: | 202010251523.9 | 申请日: | 2020-04-01 |
公开(公告)号: | CN111161711B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 刘思叶;王世镇;周志衡;振天;董敏亚;余睿 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/26 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈婧玥;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对流 语音 识别 文本 进行 断句 方法 装置 | ||
本说明书实施例提供一种对流式语音识别文本进行断句的方法,该方法包括:首先,响应于客户端发送的在第一服务中开始第一会话的通知,持续接收客户端采集的针对该第一会话的流式语音信号;接着,对流式语音信号进行流式语音识别,得到各个时刻下的识别文本;其中在各个时刻下,针对该时刻下的识别文本进行断句判断,具体包括:先将当前时刻下的当前识别文本,与已有语义文本进行比对,得到增量文本,其中已有语义文本是对当前时刻之前的识别文本进行断句而形成的语义片段序列;接着基于与第一服务对应的多个关键词,对该增量文本进行匹配,得到匹配词集合,以确定文本特征;然后,至少基于该文本特征,判断是否在当前识别文本后进行断句。
技术领域
本说明书实施例涉及自然语言处理技术领域,具体地,涉及一种对流式语音识别文本进行断句的方法及装置。
背景技术
越来越多的企业、机构推出基于语音交互技术的产品,如语音点餐系统。这类产品利用语音识别、自然语言处理等技术,分析用户的语音输入,以完成相应的操作或任务,如点单操作或点餐任务。
在语音交互过程中,为提高用户体验,这类产品需要及时对用户语音输入进行处理,以降低响应延时。这就需要产品能够准确、快速地判断输入语句的完整性,即是否可以对当前语音输入进行断句,以将其分成语义上相对完成的片段,然后再进行后续解析,例如,解析出用户想要购买一杯大可乐。
然而,目前对用户语音进行断句的方式过于单一,无法满足实际应用时的多种需求。因此,迫切需要一种合理、有效的方案,可以及时、准确地实现对用户语音的断句,从而提高用户体验。
发明内容
本说明书中的一个或多个实施例提供一种对流式语音识别文本进行断句的方法,通过结合服务场景中的特定信息,确定至少反映当前识别文本语义的文本特征,再基于文本特征,对当前识别文本进行断句判断,如此可以实现准确、有效的断句。
第一方面,提供一种对流式语音识别文本进行断句的方法,所述方法的执行主体为服务端,所述方法包括:响应于客户端发送的在第一服务中开始第一会话的通知,持续接收客户端采集的针对该第一会话的流式语音信号;对所述流式语音信号进行流式语音识别,得到各个时刻下的识别文本;其中,各个时刻下,针对该时刻下的识别文本进行断句判断,其中断句判断包括:将当前时刻下的当前识别文本,与已有语义文本进行比对,得到增量文本,所述已有语义文本是对当前时刻之前的识别文本进行断句而形成的语义片段序列;基于预先获取的与所述第一服务对应的多个关键词,对所述增量文本进行匹配,得到匹配词集合;至少基于所述匹配词集合,确定文本特征;至少基于所述文本特征,判断是否在当前识别文本后进行断句,从而将所述增量文本确定为新增语义片段。
在一个实施例中,在判断是否在当前识别文本后进行断句之后,所述方法还包括:在判断出在当前识别文本后进行断句的情况下,将所述增量文本确定为新增语音片段;将所述新增语义片段续接在所述语义片段序列之后,以更新所述已有语义文本。
在一个实施例中,将当前时刻下的当前识别文本,与已有语义文本进行比对,得到增量文本,包括:确定所述当前识别文本与已有语义文本之间的最长公共序列;基于所述最长公共序列,将所述当前识别文本分割为两部分,并将其中不包括所述最长公共序列的部分作为所述增量文本。
在一个实施例中,将当前时刻下的当前识别文本,与已有语义文本进行比对,得到增量文本,包括:确定所述当前识别文本对应的拼音序列与已有语义文本对应的拼音序列之间的最长公共序列;确定所述当前识别文本中对应于所述最长公共序列的公共文本;基于所述公共文本,将所述当前识别文本分割为两部分,并将其中不包括所述公共文本的部分作为所述增量文本。
在一个实施例中,所述第一服务为购物服务,所述多个关键词包括若干商品名和若干商品属性。
在一个具体的实施例中,所述多个关键词基于以下步骤而预先获取:从所述客户端获取用于向用户展示的商品列表;确定所述商品列表中包括的所述若干商品名和若干商品属性,归入所述多个关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010251523.9/2.html,转载请声明来源钻瓜专利网。