[发明专利]用于转录文本的说话人分离方法、电子设备和存储介质在审
申请号: | 202211000214.X | 申请日: | 2022-08-19 |
公开(公告)号: | CN115293113A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 陈珍 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F3/0481;G10L21/0272 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 邓婷婷;黄谦 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 转录 文本 说话 分离 方法 电子设备 存储 介质 | ||
本发明公开了用于转录文本的说话人分离方法,包括响应于用户对转录文本的分离操作,将分离操作所在的位置作为分离点对转录文本进行分离,其中,分离操作包括对分离快捷键的操作,每一分离快捷键对应唯一说话人信息。至少在分离点位置插入与分离快捷键对应的说话人信息。本发明通过分离快捷键分离转录文本,不同的分离快捷键对应不同的说话人,分离过程中,便于通过键盘操作,其使用者的操作难度低、可实现快速操作且操作的准确性高。同时,本发明还基于声纹的说话人分离方法和基于多声道的说话人分离方法。
技术领域
本发明属于文档处理的技术领域,尤其涉及用于转录文本的说话人分离方法、电子设备和存储介质。
背景技术
当前实时长语音转写应用在会议、培训、访谈等场景时,需要做说话者分离。目前的技术能力虽然可以使用声纹、声源方位、多通道等方式来分离说话者,也可以使用其他方式的手动分离说话人。但是每种技术均有相应的缺陷存在,且短时间内均无法有突破性进展。
现有技术中,通常通过下述几种方法分离说话人。声纹区分的方法:是根据说话人提前注册的声纹来匹配区分的。若不提前注册登记声纹无法做到精准区分,即时做了声纹的注册登记,声纹区分说话人的技术仍处于初级阶段,区分准确率还有很大的提升空间。
声源方位区分的方法:是根据说话人在拾音设备的访问来区分的。对拾音设备有一定要求,并且需要说话人相对分散,若相对聚集或人员有走动,均不能很好区分说话人。多通道区分的方法:是根据分布式多通道的声卡对应的麦克风来区分说话人。需要依赖硬件设备,且对场地要求较高,使用限制较大。
其他方式的手动区分:即使用其他的交互方式来手动灵活区分说话人,如拖拽说话人到对应转写内容的分离点。需要操作人按着鼠标拖拽到区分的位置,这样定位很容易出错,且操作便利度很差。
发明人发现,手动分离发言人:要求在转写内容中,分离说话人的定位要很准确,且需要灵活快速的插入对应的说话人。
本行业内常规会使用鼠标拖拽说话人、组合键+筛选说话人或鼠标定位右击选择说话人等方式来定位并插入说话人。但使用鼠标拖拽方式,在转写内容中,分离说话人的定位容易不准。而使用“组合键+筛选说话人”的方式,则操作负责度高。鼠标定位右击选择说话人:鼠标右击功能隐藏较深,一般用户感知不到,不容易使用。
发明内容
本发明实施例旨在至少解决上述技术问题之一。
第一方面,本发明实施例提供用于转录文本的说话人分离方法,包括:
响应于用户对转录文本的分离操作,将分离操作所在的位置作为分离点对转录文本进行分离,其中,分离操作包括对分离快捷键的操作,每一分离快捷键对应唯一说话人信息。至少在分离点位置插入与分离快捷键对应的说话人信息。
第二方面,本发明实施例提供基于声纹的说话人分离方法,包括:本发明中用于转录文本的说话人分离方法所获取分离后具有分离说话人信息的转录文本。说话人信息包括说话人代码。通过声纹识别方式识别说话人音频,得到分离后转录文本各段的说话人名称信息。
将说话人名称信息对应相应的说话人代码,得到说话人代码对应的说话人名称信息。根据说话人名称信息替换对应的说话人代码信息,得到分离后的转录文本。
第三方面,本发明实施例提供基于多声道的说话人分离方法,包括:本发明中说话人分离方法所获取分离后具有分离说话人信息的转录文本。说话人信息为说话人代码。通过分布式麦克风采集多声道的说话人音频,通过识别多声道说话人音频中的声道,得到分离后转录文本各段的说话人名称信息。
将说话人名称信息对应相应的说话人代码,得到说话人代码对应的说话人名称信息。根据说话人名称信息替换对应的说话人代码信息,得到分离后的转录文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211000214.X/2.html,转载请声明来源钻瓜专利网。