[发明专利]一种智能组词方法和装置、一种用于智能组词的装置有效
申请号: | 201610996202.5 | 申请日: | 2016-11-11 |
公开(公告)号: | CN108073292B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 费腾 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 刘祥景 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 方法 装置 用于 | ||
1.一种智能组词方法,其特征在于,包括:
获取用户的输入内容;
获取所述输入内容对应的待组词汇、以及各待组词汇的词性;
若二元库中不存在与相邻词汇相匹配的二元关系,则依据预置词性搭配规则和所述各待组词汇的词性,确定所述待组词汇对应的组词路径中相邻词汇之间的词性搭配得分;其中,所述预置词性搭配规则用于描述词性之间的搭配关系;所述相邻词汇具体为所述待组词汇对应的组词路径中相邻词汇;所述预置词性搭配规则包括:数词与数词之间的搭配规则、以及数词与量词之间的搭配规则;
依据所述组词路径所包含相邻词汇之间的词性搭配得分,确定所述组词路径的路径得分;
依据所述路径得分,从所述组词路径中获取组词候选。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待组词汇对应的组词路径中相邻词汇之间的词性搭配得分的步骤,包括:
依据所述各待组词汇的词性,确定所述待组词汇对应的组词路径中相邻词汇的词性;
在所述相邻词汇的词性搭配符合预置词性搭配规则时,将所述预置词性搭配规则对应的得分,作为所述相邻词汇之间的词性搭配得分。
3.根据权利要求1或2所述的方法,其特征在于,通过如下步骤获取所述预置词性搭配规则对应的得分:
从预置语料中获取符合所述预置词性搭配规则的词性搭配内容;
统计各词性搭配内容中相邻词汇之间的搭配概率;
依据所有词性搭配内容中相邻词汇之间的搭配概率,确定所述预置词性搭配规则对应的得分。
4.根据权利要求1或2所述的方法,其特征在于,所述输入内容包括:输入串,则所述方法还包括:
对所述输入串进行切分,以得到对应的切分结果;
在词库中进行查找,以得到与所述切分结果相匹配的词汇,作为所述输入串对应的待组词汇。
5.根据权利要求4所述的方法,其特征在于,所述输入内容还包括:所述输入串对应的上下文,则所述输入内容对应的待组词汇包括:所述输入串对应的待组词汇和所述上下文。
6.根据权利要求1或2所述的方法,其特征在于,所述依据所述组词路径所包含相邻词汇之间的词性搭配得分,确定所述组词路径的路径得分的步骤,包括:
依据所述组词路径所包含的所有相邻词汇之间的词性搭配得分,得到所述组词路径的路径得分;或者
依据所述组词路径所包含的所有相邻词汇之间的词性搭配得分、以及所述组词路径命中的二元关系得分,得到所述组词路径的路径得分。
7.根据权利要求1或2所述的方法,其特征在于,在所述依据预置词性搭配规则和所述各待组词汇的词性,确定所述待组词汇对应的组词路径中相邻词汇之间的词性搭配得分的步骤之前,所述方法还包括:
依据所述待组词汇对应的组词路径中相邻词汇,在二元库中进行查找,以得到与所述相邻词汇相匹配的二元关系;
在所述二元库的查找未命中时,执行所述依据预置词性搭配规则和所述各待组词汇的词性,确定所述待组词汇对应的组词路径中相邻词汇之间的词性搭配得分的步骤。
8.根据权利要求1或2所述的方法,其特征在于,所述依据所述路径得分,从所述组词路径中获取组词候选的步骤,包括:
对所述路径得分进行排序;
依据所述路径得分的排序结果,从所述组词路径中选取排在前N位的组词路径作为组词候选。
9.根据权利要求1或2所述的方法,其特征在于,所述预置词性搭配规则还包括:副词与动词之间的搭配规则、副词与形容词之间的搭配规则、形容词与名词之间的搭配规则、以及量词与名词之间的搭配规则中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610996202.5/1.html,转载请声明来源钻瓜专利网。