[发明专利]一种智能组词方法和装置、一种用于智能组词的装置有效

专利信息
申请号: 201610996202.5 申请日: 2016-11-11
公开(公告)号: CN108073292B 公开(公告)日: 2021-10-15
发明(设计)人: 费腾 申请(专利权)人: 北京搜狗科技发展有限公司
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 刘祥景
地址: 100084 北京市海淀区中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 智能 方法 装置 用于
【说明书】:

发明实施例提供了一种智能组词方法和装置、一种用于智能组词的装置,其中的方法具体包括:获取用户的输入内容;获取所述输入内容对应的待组词汇、以及各待组词汇的词性;依据预置词性搭配规则和所述各待组词汇的词性,确定所述待组词汇对应的组词路径中相邻词汇之间的词性搭配得分;其中,所述预置词性搭配规则用于描述词性之间的搭配关系;依据所述组词路径所包含相邻词汇之间的词性搭配得分,确定所述组词路径的路径得分;依据所述路径得分,从所述组词路径中获取组词候选。本发明实施例能够提高组词候选的合理性和质量,这样,即使在智能组词失败的情形下,也能够提供较为合理的组词候选,进而提高用户的输入效率。

技术领域

本发明涉及计算机信息输入技术领域,特别是涉及一种智能组词方法和装置、一种用于智能组词的装置。

背景技术

目前,涉及交互的设备,通常需要用户通过输入法系统将自己的操作意图与设备交互识别。例如,用户可以输入输入串,然后由输入法系统依据其预置的标准映射规则将该输入串转换为相应语言的候选项并展示,进而将用户选择的候选项上屏。

当词库中不存在输入串直接命中的词条时,输入法系统可以触发智能组词功能。现有的智能组词方案为:查找二元库中的二元关系,该依据该二元关系的命中情况计算每个组词方案中词汇串的路径概率,并将具有最大路径概率的组词方案作为首选项返回给用户。其中,该二元关系是指词汇与词汇之间的搭配关系,如“天气-好热”、“我-知道”、“喜欢-你”、“十万-八千”等可以具有二元关系。智能组词功能非常重要,智能组词结果的好坏将直接决定输入法系统的质量,也将直接影响到用户的体验。

在实际应用中,对于包含数词、量词或者副词的智能组词,其往往需要非常多的二元关系。然而,一方面,受限于存储空间,存储的二元关系有限;另一方面,二元库中存储的二元关系往往是通过统计学习的方式得到,通常存储的二元关系很难保证能够覆盖所有的情况;这样,在智能组词过程中若无法命中二元库中的二元关系,将导致智能组词失败。例如,若二元库中未存储“九万-八千”和“八千-元”,则输入串“jiuwanliangqianyuan”对应的词汇“九万”和“八千”、以及“八千”和“元”将无法命中二元库中的二元关系,进而导致智能组词失败。在智能组词失败时,现有方案往往选取词频最高的词进行组合,以得到对应的组词候选,例如,上述输入串“jiuwanliangqianyuan”对应的组词候选为“就玩梁倩院”,但“就玩梁倩院”明显为一个质量较低、较为不合理的候选,符合用户的输入意图的概率较低。

发明内容

鉴于上述问题,本发明实施例提出了一种克服上述问题或者至少部分地解决上述问题的智能组词方法、智能组词装置及用于智能组词的装置,本发明实施例能够提高组词候选的合理性和质量,这样,即使在智能组词失败的情形下,也能够提供较为合理的组词候选,进而提高用户的输入效率。

为了解决上述问题,本发明公开了一种智能组词方法,包括:

获取用户的输入内容;

获取所述输入内容对应的待组词汇、以及各待组词汇的词性;

依据预置词性搭配规则和所述各待组词汇的词性,确定所述待组词汇对应的组词路径中相邻词汇之间的词性搭配得分;其中,所述预置词性搭配规则用于描述词性之间的搭配关系;

依据所述组词路径所包含相邻词汇之间的词性搭配得分,确定所述组词路径的路径得分;

依据所述路径得分,从所述组词路径中获取组词候选。

可选地,所述确定所述待组词汇对应的组词路径中相邻词汇之间的词性搭配得分的步骤,包括:

依据所述各待组词汇的词性,确定所述待组词汇对应的组词路径中相邻词汇的词性;

在所述相邻词汇的词性搭配符合预置词性搭配规则时,将所述预置词性搭配规则对应的得分,作为所述相邻词汇之间的词性搭配得分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610996202.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top