[发明专利]一种中文人名播报方法及装置在审
申请号: | 201410204353.3 | 申请日: | 2014-05-14 |
公开(公告)号: | CN105095180A | 公开(公告)日: | 2015-11-25 |
发明(设计)人: | 刘伟 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30 |
代理公司: | 北京元本知识产权代理事务所 11308 | 代理人: | 秦力军 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 人名 播报 方法 装置 | ||
技术领域
本发明涉及移动通讯领域,特别涉及一种中文人名播报方法及相关的装置。
背景技术
词法分析:是计算机科学中将字符序列转换为单词序列的过程。进行词法分析的程序或者函数叫做词法分析器,也叫扫描器。供语法分析器调用。由于汉语不像英文单词是以空格分开的,因此词法分析一般都是结合语义分析技术相结合使用。
句法分析:所谓句法分析(Parsing)就是指对句子中的词语语法功能进行分析,比如“我来晚了”,这里“我”是主语,“来”是谓语,“晚了”是补语。句法分析现在主要的应用在于中文信息处理,如机器翻译等。它是语块分析(chunking)思想的一个直接实现,语块分析通过识别出高层次的结构单元来简化句子的描述。从不同的句子中找到语块规律的一条途径是学习一种语法,这种语法能够解释所找到的分块结构。这属于语法归纳的范畴。
语音合成(TextToSpeech,TTS):语音合成就是一个将文本转化为语音输出的过程,这个过程的工作主要是将输入的文本按字或词分解为音素,并且对文本中的数字、货币单位、单词变形以及标点等要特殊处理的符号进行分析,以及将音素生成数字音频然后用扬声器播放出来或者存为声音文件以后用多媒体软件播放。
目前汉语人名中普遍存在多音字,有些多音字的发音又是姓氏中所独有的,例如,曾(zeng)沈(shen)翟(zhai)单(shan),在一些常用词汇中的读音为曾(ceng)沈(chen)翟(di)单(dan)。另外一些历史人名中有些特殊的发音,例如刘禅(shan),关云长(chang),贾平凹(wa),在一些常用词汇中的读音为禅(chan)长(zhang)凹(ao)。对于姓名的多音字,TTS播报引擎基本上按照常用词汇的发音进行播报,经常播出让人啼笑皆非的效果,例如人名:曾(ceng)一庭。
发明内容
本发明的目的在于提供一种中文人名播报方法及装置,通过对待播报文本字符串中的人名字符串进行多音字读音标识,并按照所标识的多音字读音播报人名字符串,解决中文人名中多音字播报不准确的问题。
根据本发明的一个方面,提供了一种中文人名播报方法,包括:
终端侧将含有人名字符串的待播报文本字符串发送至网络侧;
接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;
按照所述读音字符串播报所述人名字符串。
根据本发明的另一个方面,提供了一种中文人名播报方法,包括:
在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;
通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;
将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。
优选地,在预置的读音数据库中,搜索待播报文本字符串中的人名字符串的步骤之前,还包括:
网络侧接收来自终端侧的待播报文本字符串;
对所述待播报文本字符串进行语义分析,得到所述待播报文本字符串中的人名字符串。
优选地,所述读音数据库包括历史人名发音知识库和/或姓氏发音知识库,网络侧在所述历史人名发音知识库和/或姓氏发音知识库中,搜索待播报文本字符串中的人名字符串。
优选地,所述的通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识的步骤包括:
网络侧在所述历史人名发音知识库和/或姓氏发音知识库中提取对应于所述人名字符串的读音字符串;
将所述读音字符串插入到所述待播报文本字符串的指定位置,标识所述人名的读音。
根据本发明的另一个方面,提供了一种中文人名播报装置,包括:
终端侧收发模块,用于将含有人名字符串的待播报文本字符串发送至网络侧,并接收来自网络侧的已对所述人名字符串完成读音标识的待播报文本字符串;
终端侧播报模块,用于按照所述读音字符串播报所述人名字符串。
根据本发明的另一方面,提供了一种中文人名播报装置,包括:
网络侧搜索模块,用于在预置的读音数据库中,搜索待播报文本字符串中的人名字符串;
网络侧标识模块,用于通过所述读音数据库中的读音字符串对所述人名字符串进行读音标识;
网络侧发送模块,用于将已进行读音标识的待播报文本字符串发送至终端侧,以供终端侧按照所述读音字符串播报所述人名字符串。
优选地,还包括:
网络侧接收模块,用于在所述网络侧搜索模块搜索待播报文本字符串中的人名字符串之前,接收来自终端侧的待播报文本字符串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410204353.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语义解析方法和装置
- 下一篇:一种信息处理方法、装置及终端