[发明专利]一种对中文句子输入法的优化系统及方法有效

专利信息
申请号: 201010526953.3 申请日: 2010-10-25
公开(公告)号: CN102455786A 公开(公告)日: 2012-05-16
发明(设计)人: 周进华;颜晓蔚;万磊;周志彬;孙国勇;陆灿江;赵丹尼 申请(专利权)人: 三星电子(中国)研发中心;三星电子株式会社
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 北京德琦知识产权代理有限公司 11018 代理人: 牛峥;王丽琴
地址: 210008 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 中文 句子 输入法 优化 系统 方法
【权利要求书】:

1.一种对中文句子输入法的优化系统,其特征在于,该系统包括:输入法引擎模块、识别模块、重排序模块、候选中文句子列表显示模块、选择模块及输出模块,其中,

输入法引擎模块,用于解析得到输入的拼音串,发送给识别模块;

识别模块,用于对接收的拼音串,进行识别翻译后,得到多个候选的中文句子,发送给重排序模块;

重排序模块,用于接收多个候选中文句子,对每个中文句子,根据生成的资源文件计算得到反应语言习惯、语法和语义的特征向量,与所训练的特征权重进行内积运算,得到每个中文句子的评分,根据各个中文句子的评分高低对多个候选中文句子排序,得到候选中文句子列表,发送给候选中文句子列表显示模块;

候选中文句子列表显示模块,用于显示候选中文句子列表,由选择模块控制选择得到一个中文句子,通过输出模块输出;

选择模块,用于选择候选中文句子列表显示模块中的一个最符合用户要求的中文句子。

2.如权利要求1所述的系统,其特征在于,所述识别模块,还用于在得到多个候选的中文句子之后,发送给重排序模块之前对候选中文句子列表进行排序。

3.如权利要求1所述的系统,其特征在于,所述系统还包括:资源文件库和提供特征权重模块,其中,

资源文件库,用于生成音-字转换表、互信息表、汉语语言模型和词性标注语言模型,提供给重排序模块;

提供特征权重模块,用于生成特征权重,提供给重排序模块;

重排序模块,对于每一个要排序的中文句子,还用于根据原排序得到基系统特征值,根据互信息表计算得到候选句子的互信息,根据音-字转换表得到词语字音转换概率、逆向词语字音转换概率、字音转换概率和逆向字音转换概率,根据汉语语言模型计算得到候选句子的语言模型评分,根据词性标注语言模型计算得到候选句子的词性标注语言模型评分,根据中文句子的短语个数得到候选句子长度,然后再将所得到的特征向量与特征权重求内积,得到每个中文句子的评分,根据各个中文句子的评分高低对多个候选中文句子排序,得到候选中文句子列表,发送给候选中文句子列表显示模块。

4.一种对中文句子输入法的优化方法,其特征在于,该方法包括生成计算特征向量所需的资源文件,训练特征权重,利用特征权重和表示候选句子的特征向量对候选句子进行评分,具体为:

将用户输入的拼音串进行识别翻译后,得到多个候选的中文句子;

对每个中文句子,根据生成的资源文件计算得到反应语言习惯、语法和语义的特征向量,与所训练的特征权重进行内积运算,得到每个中文句子的评分,根据评分高低对多个候选中文句子进行排序,得到候选中文句子列表,提供给用户;

根据用户的选择从候选中文句子列表中选择得到一个中文句子,输出。

5.如权利要求1所述的方法,其特征在于,所述资源文件包括:音-字转换表、互信息表、汉语语言模型和词性标注语言模型中的一种或多种组合,

所述资源文件和所述特征权重采用同分布的汉语语言资源得到。

6.如权利要求5所述的方法,其特征在于,所述特征向量的分量为以下一个或多个特征的组合:基系统特征、互信息、词语字音转换概率、逆向词语字音转换概率、字音转换概率、逆向字音转换概率、汉语语言模型、词性标注语言模型和候选句子长度。其中,

根据原排序的倒数得到基系统特征值,根据互信息表计算得到候选句子的互信息,根据音-字转换表得到词语字音转换概率、逆向词语字音转换概率、字音转换概率和逆向字音转换概率,根据汉语语言模型计算得到候选句子的语言模型评分,根据词性标注语言模型计算得到候选句子的词性标注语言模型评分,根据中文句子的短语个数得到候选句子长度,然后再将所得到的特征向量与特征权重求内积,得到每个中文句子的评分,根据各个中文句子的评分高低对多个候选中文句子排序,得到候选中文句子列表。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子(中国)研发中心;三星电子株式会社,未经三星电子(中国)研发中心;三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010526953.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top