[发明专利]语音输入装置、语音输入方法及记录介质在审
申请号: | 202010206519.0 | 申请日: | 2020-03-23 |
公开(公告)号: | CN111754986A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 西川刚树 | 申请(专利权)人: | 松下电器(美国)知识产权公司 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/26;G10L17/22 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 高迪 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 输入 装置 方法 记录 介质 | ||
一种语音输入装置、语音输入方法及记录介质。说话者识别装置(1)具备:取得部(21),取得1个以上的说话者发言时的各个语音;存储部(22),存储取得部(21)所取得的1个以上的说话者的发言的各个语音;触发输入部(23),被输入触发;发言开始检测部(24),在触发输入部(23)每次被输入触发时,根据存储部(22)中存储的各个语音检测开始发言的开始位置;以及说话者识别部(26),至少基于触发输入部(23)被输入触发的第1时刻、以及发言开始检测部(24)根据各个语音检测出的发言的开始位置的第2时刻,从1个以上的说话者之中识别某一个说话者。
技术领域
本公开涉及语音输入装置、语音输入方法及记录介质。
背景技术
例如在专利文献1中公开了一种语音识别装置,具备:语音输入开始操作机构,通过用户的操作使得能够进行语音输入操作;语音输入机构,取得用户的语音;发言开始时间学习数据保持机构,保持学习了从用户通过语音输入开始操作机构进行操作的时刻直到用户实际开始发言为止的时间而得到的发言开始学习时间;以及语音识别机构,对计测时间与来自发言开始时间学习数据保持机构的发言开始学习时间进行比较,判定进行了时间计测的语音是否是用户的输入语音,在是用户的输入语音时进行语音识别。
根据该语音识别装置,通过按每个用户进行学习,并使用学习的发言开始时间,能够识别语音是否是用户的。
在先技术文献
专利文献
专利文献1:日本特开2006-313261号公报
发明内容
发明所要解决的课题
但是,在专利文献1所公开的技术中,需要预先学习从用户进行语音输入装置的操作的时刻直到用户实际开始发言为止的期间。因此,在以往的语音识别装置中,由于学习引起的计算量有可能增大。
于是,本公开的目的在于,提供能够通过简易的处理来识别说话者从而抑制计算量的增大的语音输入装置、语音输入方法及记录介质。
用于解决课题的手段
本公开的一个方式所涉及的语音输入装置具备:取得部,取得1个以上的说话者发言时的各个语音;存储部,存储所述取得部所取得的所述1个以上的说话者的发言的所述各个语音;触发输入部,被输入触发;发言开始检测部,在所述触发输入部每次被输入所述触发时,根据所述存储部中存储的所述各个语音检测开始发言的开始位置;以及说话者识别部,至少基于所述触发输入部被输入所述触发的第1时刻、以及所述发言开始检测部根据所述各个语音检测出的发言的开始位置的第2时刻,从所述1个以上的说话者之中识别某一个说话者。
此外,这些之中的一部分的具体的方式也可以使用系统、方法、集成电路、计算机程序或者计算机可读取的CD-ROM等记录介质实现,也可以使用系统、方法、集成电路、计算机程序及记录介质的任意组合实现。
发明效果
根据本公开的语音输入装置等,能够通过简易的处理来识别说话者从而抑制计算量的增大。
附图说明
图1是表示实施方式中的说话者识别装置的外观、以及基于说话者的发言的说话者识别装置的使用场面的一例的图。
图2A是表示实施方式中的说话者识别装置的一例的框图。
图2B是表示实施方式中的其他的说话者识别装置的一例的框图。
图3是表示在第1说话者发言了的情况下的说话者识别装置的动作的流程图。
图4是对第1说话者发言的情况和第2说话者发言的情况下的发言的每个语音的第1时刻和第2时刻的时序进行例示的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器(美国)知识产权公司,未经松下电器(美国)知识产权公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010206519.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于并-串转换的设备
- 下一篇:物体检测装置及方法