[发明专利]字符处理装置、方法、程序以及存储介质有效
申请号: | 200780002874.9 | 申请日: | 2007-01-31 |
公开(公告)号: | CN101371252A | 公开(公告)日: | 2009-02-18 |
发明(设计)人: | 佐藤良治;石桥纪子;关美由纪;鹿子木宏明;梅冈孝史 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/22 | 分类号: | G06F17/22 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 张鑫 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字符 处理 装置 方法 程序 以及 存储 介质 | ||
1.一种字符处理装置,是使用词网格将多个单词的读法的字符串转换为对 应的多个写法的字符串的字符处理装置,其特征在于,具有:
将多个短语的读法的字符串和对应的写法的字符串构成一个记录、并存储 具有不同的多个记录的短语辞典的第1存储单元;
以多个单词的读法的字符串作为转换对象来检索所述短语辞典、并取得短 语辞典中与该多个单词的读法的字符串有相同读法的字符串所对应的多个单 词的写法的字符串的检索单元;
将通过该检索单元的检索得到的多个短语的写法的字符串作为多个节点 添加到所述词网格的第1信息处理单元;
将多个单词的写法形成为一组、并存储多个组的出现概率的第2存储单 元;
存储所述多个短语的写法的出现概率的第3存储单元;以及
根据所述第2存储单元和第3存储单元中存储的出现概率、取得添加了作 为节点的所述短语的写法的字符串的词网格上出现概率最高的路径上的写法 的字符串作为转换候补的第2信息处理单元。
2.如权利要求1所述的字符处理装置,其特征在于,
将所述第1存储单元作为第3存储单元来使用,在所述记录中包含了出现 概率。
3.一种字符处理装置的字符处理方法,是使用词网格将多个单词的读法的 字符串转换为对应的多个写法的字符串的字符处理装置的字符处理方法,其特 征在于,
所述字符处理装置具有:
将多个短语的读法的字符串和对应的写法的字符串构成一个记录、并存储 具有不同的多个记录的短语辞典的第1存储单元;
将多个单词的写法形成为一组、并存储多个组的出现概率的第2存储单 元;存储所述多个短语的写法的出现概率的第3存储单元;
检索单元;以及
第1信息处理单元和第2信息处理单元,
所述字符处理方法通过所述检索单元以多个单词的读法的字符串作为转 换对象来检索所述短语辞典,取得短语辞典中与该多个单词的读法的字符串有 相同读法的字符串所对应的多个单词的写法的字符串,
通过所述第1信息处理单元将通过所述检索单元的检索得到的多个单词 的写法的字符串作为多个节点添加到所述词网格,
通过所述第2信息处理单元,根据所述第2存储单元和第3存储单元中存 储的出现概率,取得添加了作为节点的所述短语的写法的字符串的词网格上出 现概率最高的路径上的写法的字符串,作为转换候补。
4.如权利要求3所述的字符处理装置的字符处理方法,其特征在于,
将所述第1存储单元作为第3存储单元来使用,在所述记录中包含了出现 概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780002874.9/1.html,转载请声明来源钻瓜专利网。