[发明专利]一种基于基础字典标注的发音标注方法和装置在审
申请号: | 201910012153.0 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109918619A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 肖玉宾;喻红;杨承勇;敬大彦 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F17/21 | 分类号: | G06F17/21;G06F17/27 |
代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 冯晓平 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种基于基础字典标注的发音标注方法和装置。本发明涉及人工智能技术领域,该方法包括:获取多个汉字单字和每个汉字单字对应的拼音标注;将每个汉字单字和每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和每个拼音标注对应的训练发音标注;将多个拼音标注中的每个拼音标注和每个拼音标注对应的训练发音标注关联存储在第二字典;根据第一字典和第二字典确定第三字典;获取用户输入的待标注词汇;基于待标注词汇从第三字典中查询训练发音标注;将查询得到的训练发音标注作为待标注词汇的训练发音标注。因此,本发明实施例提供的技术方案能够解决现有技术中人工对语音识别字典进行标注效率低的问题。 | ||
搜索关键词: | 发音标注 拼音标注 字典 标注 单字 汉字 方法和装置 词汇 关联存储 基础字典 人工智能技术 语音识别 查询 | ||
【主权项】:
1.一种基于基础字典标注的发音标注方法,其特征在于,所述方法包括:获取多个汉字单字和所述多个汉字单字中每个汉字单字对应的拼音标注;将所述多个汉字单字中的每个汉字单字和所述每个汉字单字对应的拼音标注关联存储在第一字典;获取多个拼音标注和所述多个拼音标注中每个拼音标注对应的训练发音标注;将所述多个拼音标注中的每个拼音标注和所述每个拼音标注对应的训练发音标注关联存储在第二字典;根据所述第一字典和所述第二字典确定第三字典,所述第三字典用于关联存储所述汉字单字和所述训练发音标注;获取用户输入的待标注词汇;基于所述待标注词汇从所述第三字典中查询训练发音标注;将查询得到的训练发音标注作为所述待标注词汇的训练发音标注。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910012153.0/,转载请声明来源钻瓜专利网。