[发明专利]实体多音字消歧方法和实体多音字消歧设备在审
申请号: | 201610342051.1 | 申请日: | 2016-05-20 |
公开(公告)号: | CN107402933A | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 房璐;缪庆亮;孟遥 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 朱胜,李春晖 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 多音字 方法 设备 | ||
技术领域
本公开涉及信息处理处理领域,更具体地,涉及一种实体多音字消歧方法和实体多音字消歧设备,其能够从关联开放数据中找出实体的发音,从而能够对实体多音字的发音进行消歧。
背景技术
TTS(Text To Speech)技术又称文语转换技术,是当前语音合成的代表性内容,是指利用计算机将任意文本转化为语音的技术。因为对于输入的文本需要将其转化为对应的发音,因此多音字消歧是文语转换的核心问题。多音字转换的正确与否,极大地影响了用户对合成语音的理解情况。如果对多音字消歧的准确率高,则合成的语言更容易被用户理解,听起来也更加自然流畅。
在中文或日文中,存在大量多音字,因此如何确定多音字的发音就成为针对中文或日文文本语音合成领域中需要重点解决的问题。目前,对多音字的消歧主要包括两种方法:一是通过人工总结并制定规则的方法;二是利用机器学习的方法对多音字进行消歧。其中,基于人工规则的方法耗费人力,且有些情况下多音字的发音毫无规律可循,人也无法判断其发音,例如在日语中,同一个汉字在不同的人的名字里发音也可能不同。而在机器学习的方法中,往往需要大量的人工标注的语料,同样费时费力。
关联数据(Linked Data)是一系列利用Web在不同数据源之间创建语义关联的最佳实践方法,关联数据使用统一资源标识符(URI)来标识资源(可理解为实体),因此每个实体具有唯一性,同时还以三元组的形式提供每个资源元数据,即相关的属性和属性值。将关联数据开发并发布在互联网上称为关联开放数据(Linked Open Data,LOD),常用的大规模的LOD的数据集包括DBpedia、Freebase等等。例如,DBpedia是Wikipedia的结构化数据集,人们在编辑某个实体的Wikipedia页面时,往往同时会给出其发音,但是又不是以某个固定的方式给出。在LOD中,有些资源存在类似发音这样的属性,而且每个资源都有唯一的标识,因此, 我们考虑可以利用LOD对多音字资源进行消岐。
发明内容
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
鉴于以上问题,本公开的目的是提供一种实体多音字消歧方法和实体多音字消歧设备,其能够从关联开放数据中找出实体的发音作为实体发音的消歧结果,从而能够对实体多音字的发音进行消歧。
根据本公开的一方面,提供了一种实体多音字消歧方法,包括:实体识别步骤,可以用于从输入的文本中识别出包括多音字的至少一个实体;以及确定发音步骤,可以对于所述至少一个实体中的每个实体,将该实体链接到关联开放数据的数据集中的相应实体,并且可以基于相应实体的其属性值包含发音的至少一个属性和/或与相应实体相关联的发音,确定该实体的发音。
根据本公开的另一方面,还提供了一种实体多音字消歧设备,包括:实体识别单元,可以被配置成从输入的文本中识别出包括多音字的至少一个实体;以及确定发音单元,可以被配置成对于所述至少一个实体中的每个实体,将该实体链接到关联开放数据的数据集中的相应实体,并且可以基于相应实体的其属性值包含发音的至少一个属性和/或与相应实体相关联的发音,确定该实体的发音。
根据本公开的其它方面,还提供了用于实现上述根据本公开的方法的计算机程序代码和计算机程序产品以及其上记录有该用于实现上述根据本公开的方法的计算机程序代码的计算机可读存储介质。
在下面的说明书部分中给出本公开实施例的其它方面,其中,详细说明用于充分地公开本公开实施例的优选实施例,而不对其施加限定。
附图说明
本公开可以通过参考下文中结合附图所给出的详细描述而得到更好 的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并形成说明书的一部分,用来进一步举例说明本公开的优选实施例和解释本公开的原理和优点。其中:
图1是示出根据本公开的实施例的实体多音字消歧方法的流程示例的流程图;
图2是示出关联开放数据的数据集中的一个实体的示例的图;
图3是示出关联开放数据的数据集中的另一个实体的示例的图;
图4是示出关联开放数据的数据集中的又一个实体的示例的图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610342051.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用户标签的扩展处理方法、文本推荐方法和装置
- 下一篇:公交线路推荐方法及装置