[发明专利]一种音节切分的方法、装置及存储介质在审
申请号: | 202211691525.5 | 申请日: | 2022-12-27 |
公开(公告)号: | CN116070645A | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 邓彪;翟飞飞;徐兆噗 | 申请(专利权)人: | 北京中科凡语科技有限公司 |
主分类号: | G06F40/55 | 分类号: | G06F40/55 |
代理公司: | 湖北权上知识产权代理事务所(特殊普通合伙) 42287 | 代理人: | 陈琳 |
地址: | 100190 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音节 切分 方法 装置 存储 介质 | ||
1.一种音节切分的方法,其特征在于,包括以下步骤:
S1、将单词进行音节切分,获得所有可能的音节切分候选;
S2、根据发音规则,对每种音节切分候选进行打分,将得分最高的候选作为音节切分结果。
2.根据权利要求1所述的音节切分的方法,其特征在于,在步骤S1中,基于音译表的辅音音节和元音音节,遍历每个单词的两个相连字母之间的全部情况,获得所述所有可能的音节切分候选。
3.根据权利要求2所述的音节切分的方法,其特征在于,在步骤S1中,每个单词的两个相连字母之间的全部情况包括辅音音节与元音音节的组合、单独元音音节或者单独辅音音节。
4.根据权利要求2所述的音节切分的方法,其特征在于,在步骤S2中,所述对每种音节切分候选进行打分的计算公式为:
其中,count代表音节的个数,Si代表音节切分候选中的第i个音节,F为音节得分,公式为:
其中,s代表音节,c代表辅音音节,v代表元音音节。
5.根据权利要求2所述的音节切分的方法,其特征在于,在步骤S1中,获得所有可能的音节切分候选包括:
S11、计算单词长度;
S12、以两个字母相连构成辅音音节、辅音音节和元音音节相连,
单独的元音音节,从单词的第二个字母开始,得到每个字母与后面字母的所有组合结果;
S13、对每个组合结果进行判断,去掉不符合实际情况的组合结果。
6.根据权利要求2所述的音节切分的方法,其特征在于,在步骤S13之后还包括步骤:S14、判断是否到最后一个字母,如果是,则输出所有组合结果为音节切分候选结果;如果不是,则返回步骤S13。
7.一种音节切分的装置,其特征在于,包括:
切分单元,用于将单词进行音节切分,获得所有可能的音节切分候选;
打分单元,用于根据发音规则,对每种音节切分候选进行打分,将得分最高的候选作为音节切分结果。
8.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的音节切分的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科凡语科技有限公司,未经北京中科凡语科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211691525.5/1.html,转载请声明来源钻瓜专利网。