[发明专利]音译处理装置、程序、记录媒体及方法有效
申请号: | 201280003171.9 | 申请日: | 2012-02-28 |
公开(公告)号: | CN103140849A | 公开(公告)日: | 2013-06-05 |
发明(设计)人: | 萩原正人 | 申请(专利权)人: | 乐天株式会社 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 章蕾 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明的音译处理装置(100)包括生成部(105),所述生成部(105)生成包含多个为音译而由原片段经覆写为音译片段的覆写概率且与彼此不同的K个语言相对应的覆写表、及与K个语言相对应的音译表。而且,音译处理装置(100)包括更新部(107),所述更新部(107)在将以与所使用的覆写表相对应的语言为起源的原拼写字符串音译为目标拼写字符串的音译概率保存在与该语言相对应的音译表后,以使算出K个音译表的似然度的似然函数的期待值最大化的方式,更新K个覆写表。 | ||
搜索关键词: | 音译 处理 装置 程序 记录 媒体 方法 | ||
【主权项】:
一种音译处理装置,其特征在于包括:生成部,其自包含多个音译对的训练集合而生成K个覆写表及K个音译表;所述音译对是包含任意起源语言的拼写的原拼写字符串、与包含将该原拼写字符串音译为特定目标语言的拼写的目标拼写字符串的音译对;所述K个覆写表包含多个构成所述原拼写字符串的原片段、构成所述目标拼写字符串的音译片段、及为音译而由该原片段经覆写为该音译片段的覆写概率的组,且与彼此不同的K个起源语言相对应;所述K个音译表包含多个所述训练集合中所含的音译对,且与所述K个起源语言相对应;及更新部,其针对所述训练集合中所含的多个音译对的各者,通过使用所述K个覆写表中所含的覆写概率的各者,算出以与该覆写表相对应的起源语言为起源的情形时将该音译对的原拼写字符串音译为该音译对的目标拼写字符串的音译概率,并将该音译概率与该音译对建立关联而保存在与该起源语言相对应的音译表后,以使算出表示获得所述训练集合的情形时的所述K个音译表的或然性的似然度的似然函数的期待值、即使得用该音译概率算出的值最大化的方式,更新所述K个覆写表的各者中所含的覆写概率后,重复进行所述音译概率的算出及所述覆写概率的更新。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于乐天株式会社,未经乐天株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201280003171.9/,转载请声明来源钻瓜专利网。