[发明专利]语音输入装置、语音输入方法及记录介质在审
申请号: | 202010206519.0 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111754986A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 西川刚树 | 申请(专利权)人: | 松下电器(美国)知识产权公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G10L17/22 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 高迪 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 输入 装置 方法 记录 介质 | ||
1.一种语音输入装置,具备:
取得部,取得1个以上的说话者发言时的各个语音;
存储部,存储所述取得部所取得的所述1个以上的说话者的发言的所述各个语音;
触发输入部,被输入触发;
发言开始检测部,在所述触发输入部每次被输入所述触发时,根据所述存储部中存储的所述各个语音检测开始发言的开始位置;以及
说话者识别部,至少基于所述触发输入部被输入所述触发的第1时刻、以及所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻,从所述1个以上的说话者之中识别某一个说话者。
2.如权利要求1所述的语音输入装置,具备:
发言时机登记部,至少对所述第1时刻与所述第2时刻中的哪一个时刻是靠前的时间进行登记,
所述说话者识别部基于所述第1时刻、所述第2时刻、以及所述发言时机登记部表示所述第2时刻相对于所述第1时刻的时机的多个登记信息,从所述1个以上的说话者之中识别某一个说话者。
3.如权利要求2所述的语音输入装置,
所述发言时机登记部在对所述1个以上的说话者的各个发言的时机进行登记时,
登记第1登记信息,该第1登记信息是将第1时间信息与所述1个以上的说话者之中的某一个说话者建立了关联的登记信息,所述第1时间信息表示与所述触发输入部被输入所述触发的所述第1时刻相比,开始发言的开始位置的所述第2时刻是更靠后的时间,
登记第2登记信息,该第2登记信息是将第2时间信息与所述1个以上的说话者之中的其他的某一个说话者建立了关联的登记信息,所述第2时间信息表示与所述触发输入部被输入所述触发的所述第1时刻相比,开始发言的开始位置的所述第2时刻是更靠前的时间。
4.如权利要求2或者3所述的语音输入装置,
所述说话者识别部为:
计算所述第2时刻相对于所述第1时刻的时机,
将计算出的表示时机的结果与所述多个登记信息对照,在与所述第1时刻相比所述第2时刻是更靠后的时间的情况下,判定为发言的说话者是第1说话者,在与所述第1时刻相比所述第2时刻是更靠前的时间的情况下,判定为发言的说话者是与所述第1说话者不同的第2说话者。
5.如权利要求1~3中任一项所述的语音输入装置,
所述触发输入部是受理预先设定的语音的输入的语音输入接口,
预先设定的语音被作为所述触发输入至所述触发输入部。
6.如权利要求1~3中任一项所述的语音输入装置,
所述触发输入部是所述语音输入装置上设置的操作按钮,
受理的操作输入被作为所述触发输入至所述触发输入部。
7.一种语音输入方法,包含:
取得1个以上的说话者发言时的各个语音;
将所取得的所述1个以上的说话者的发言的所述各个语音存储至存储部;
被输入触发;
在所述触发每次被输入时,根据所述存储部中存储的所述各个语音检测开始发言的开始位置;以及
至少基于所述触发被输入的第1时刻、以及根据所述各个语音检测出的发言的开始位置的第2时刻,从所述1个以上的说话者之中识别某一个说话者。
8.一种计算机可读取的非易失性的记录介质,记录了使计算机执行权利要求7所述的语音输入方法的程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器(美国)知识产权公司,未经松下电器(美国)知识产权公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010206519.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于并-串转换的设备
- 下一篇:物体检测装置及方法