[发明专利]角色的多语言语音系统及方法在审
申请号: | 201280057229.8 | 申请日: | 2012-07-18 |
公开(公告)号: | CN104011791A | 公开(公告)日: | 2014-08-27 |
发明(设计)人: | 全永振;宋世经 | 申请(专利权)人: | (株)未来机器人 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 崔征 |
地址: | 韩国京畿道水原市灵通区二*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 角色 语言 语音 系统 方法 | ||
技术领域
本发明涉及一种提供角色(character)的多语言语音操作的系统及方法,更详细地涉及多语言语音系统及方法,其中,提供二维或者三维角色根据周围状况将传达内容表达为多语言的语音操作,从而可通过角色准确地传达咨询或者导向服务等内容。
背景技术
近来,活跃地进行国际交流的同时,在全世界范围内外国人的访问急剧增加。由此,在没有对所要访问的国家的地理或者文化知识的状态下,外国人需要通过本国语的咨询或者导向。由此,增加了可使用多国语言的人力资源的必要性。
特别是,在举行奥林匹克运动会或者亚洲运动会、世界杯等世界性活动的情况下,更切实感到可使用各种语言的人力资源的必要性。由此,近来作为用于应对所述人力资源的方案,正在开发利用导向机器人等的咨询或者导向系统,据此访问他国的外国人在需要时可通过所述导向机器人等接受本国语的咨询或者导向服务。
所述导向机器人等为了将咨询或者导向服务自然地传送给外国人等使用者,将二维或者三维角色显示于画面,可实现与真人相同的面孔表情及口形等,并且可将各种形态的信息向使用者提供为各个国家语言的语音。
二维或者三维角色向使用者将各种形态的信息提供为语音的语音操作为如下:将所属于话语(utterance)的数据作为文本(Text),从而将文本输出为语音。如上所述,适用于角色的语音操作的语音系统中,对所输入的文本进行语言解释,并且通过将此合成为语音的处理过程,将文本转换为自然的合成音而进行输出,通过语音合成(TTS,Text-To Speech)实现。
TTS是指将编码的字符信息转换为人们可听得懂的语音信息的技术。所述编码的字符信息根据所使用的语言或者国家存在很多,并且通过字符编码(character encoding)映射(mapping)为具有计算机可理解的0和1的二进制(binary)值的连续的比特(Bit)形式。
作为对所述字符信息进行编码的方法,ASCII编码系统使用7个比特总共只表示128个字符。ISO-8859-1编码系统作为将西部欧洲国家所使用的字符包括于现有ASCII字符集而制成的新字符集,由于ASCII的扩展,无法通过ASCII字符编码所使用的7比特编码系统全部收容,所以使用8比特(1字节)编码系统。各个国家所使用的代表性字符编码为如下:欧洲使用ISO8859系列、ISO6937;中东使用ISO8859系列;中国使用GB2312-80、GBK、BIG5;日本使用JIS;韩国使用如KSX1001一样的本国字符编码。
如上所述,在字符信息根据语言编码为各种各样的情况下,为了将所属于话语的数据的文本输出为语音,需要根据各个语言建立另外的句子。换句话说,根据状况且根据使用者的明确选择等决定语言,并且如果决定语言,则从存储有根据所属语言的文本的数据库中取得根据所属语言的句子,从而输出为语音,即声音。
如上所述的现有的多语言语音系统中存在如下问题:按照各个语言将对字符信息进行编码的方法构成为不同,从而语言编码按照各种语言无法一次将其他句子转换为语音,并且在将特定语言转换为语音后,指定其他语言,并且只能重新将所属语言转换为语音。
此外,现有的多语言语音系统中存在如下问题:另外制作根据各种语言对语言进行选择的方式的规则,并且也制作根据语言将所属句子转换为语音的顺序的规则,因此使得用于实现所述系统的程序变得复杂。由此,存在的问题在于,不会制作成连续变更语言的形式,而是将系统构成为,如果选择一种语言,则直至特定状况结束为止表达为一种语言。
此外,在对二维或者三维角色适用情感表现和多语言的语音操作的情况下,情感表现和语音操作进行为按次序的不同的操作,换句话说,所述角色在执行微笑等情感表现操作后,接着执行嘴唇运动的语音操作,或者在执行语音操作后,实现哭泣等情感表现操作等。由此,为了提高根据二维或者三维角色的操作的内容传达或者故事(Story)传达力,需要如下技术:执行哭泣或者微笑等情感表现操作的同时,实现语音操作。
发明内容
本发明是为了解决所述问题而提出的,本发明的目的在于,提供一种角色的多语言语音系统及方法,其中,二维或者三维角色提供根据周围状况将传达内容表达为多语言的语音操作,从而将按照各种语言对字符信息进行编码的方法构成为不同,进而可解决编码无法一次将所属于其他语言的句子转换为语音的问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于(株)未来机器人,未经(株)未来机器人许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280057229.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种开放式交易用小额电子钱包
- 下一篇:一种车辆进出管控系统