[发明专利]拼音字符串处理方法和装置在审
申请号: | 201310370370.X | 申请日: | 2013-08-22 |
公开(公告)号: | CN104423621A | 公开(公告)日: | 2015-03-18 |
发明(设计)人: | 张雷;张霓 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/27 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 兰淑铎 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拼音 字符串 处理 方法 装置 | ||
1.一种拼音字符串处理方法,其特征在于,包括:
接收拼音字符串的输入,获取当前环境信息;其中,所述当前环境信息为接收所述拼音字符串的当前应用程序和/或输入框的信息;
依据预设的配置信息,获取输入所述拼音字符串的个性化信息;其中,所述个性化信息中包括用户习惯信息和历史环境信息,所述历史环境信息包括用户往期进行汉字输入时所处的环境信息;
依据所述个性化信息和所述当前环境信息对所述拼音字符串对应的至少一组音节组合进行筛选,从而确定所述拼音字符串中分词符的位置。
2.根据权利要求1所述的方法,其特征在于,所述个性化信息还包括:时间信息和/或位置信息;其中,所述时间信息为所述用户往期进行输入和/或往期进行网络访问时所处的时间;所述位置信息为所述用户往期进行输入和/或往期进行网络访问时所处的地理位置;
所述依据所述个性化信息和所述当前环境信息对所述拼音字符串对应的至少一组音节组合进行筛选时,依据所述用户习惯信息和所述当前环境信息,以及所述当前时间信息和/或所述当前位置信息,对所述拼音字符串对应的至少一组音节组合进行筛选。
3.根据权利要求2所述的方法,其特征在于,所述依据所述用户习惯信息和所述当前环境的信息对所述拼音字符串对应的至少一组音节组合进行筛选,从而确定所述拼音字符串中分词符的位置的步骤包括:
根据所述拼音字符串对应的各组音节组合与所述用户习惯信息的匹配结果,分别获得每组音节组合对应的习惯权值;
根据所述当前环境信息与所述历史环境信息的匹配结果,分别获得每组音节组合对应的环境权值;
根据所述当前时间信息和/或所述当前位置信息与对应的所述时间信息和/或位置信息的匹配结果,分别获得每组音节组合对应的时间权值和/或地点权值;
对所述各组音节组合对应的各权值进行求和,获得所述各组音节组合的总特征权值,根据所述总特征权值对所述各组音节组合进行排序,并根据排序在前的音节组合确定所述拼音字符串中分词符的位置。
4.根据权利要求2或3所述的方法,其特征在于,所述个性化信息从服务器端获取,并通过以下方式生成:
获取所述用户进行网络访问时的历史行为信息;其中,所述历史行为信息中包括:所述用户往期进行输入的内容、时间、地理位置、输入环境,和/或,所述用户往期进行网络访问的内容、时间、地理位置;
分别根据预设的兴趣模型、环境模型、时间模型和位置模型,分别对所述历史行为信息进行分析处理;
根据所述历史行为信息进行分析处理的结果,生成所述服务器端对应的个性化信息。
5.根据权利要求4所述的方法,其特征在于,所述兴趣模型包括个体兴趣模型和群体兴趣模型;
当根据所述拼音字符串对应的各组音节组合与所述用户习惯信息的匹配结果,分别获得每组音节组合对应的习惯权值时:将所述各组音节组合分别与通过所述个体兴趣模型生成的用户习惯信息进行匹配;
若匹配不成功,则将所述各组音节组合分别与通过所述个体兴趣模型对应的群体兴趣模型生成的用户习惯信息进行匹配;
根据所述各组音节组合与所述群体兴趣模型的匹配结果获得所述各组音节组合对应的习惯权值。
6.根据权利要求3或5所述的方法,其特征在于,所述习惯权值通过以下方式获得:
目标音节组合被选择次数÷所述拼音字符串对应的多个音节组合总输入次数×N,其中,N为权重系数,且N为大于0的自然数。
7.根据权利要求1所述的方法,其特征在于,所述对所述拼音字符串对应的至少一组音节组合进行筛选之后,还包括:
获得筛选得到的音节组合分别对应的候选词;
获取各所述候选词对应的附加权值;其中,所述附加权值根据对所有用户对所述各组汉字的选择进行分析统计后得到;
根据所述附加权值对所述候选词进行排序后输出。
8.根据权利要求7所述的方法,其特征在于,所述附加权值除了根据对所有用户对所述各组汉字的选择进行分析统计后得到外,还包括:
根据所述个性化信息和所述当前环境信息,对选择出的所述各组汉字进行分析统计后得到。
9.根据权利要求1、2、3或5中任一项所述的方法,其特征在于,所述用户习惯信息根据当前用户使用各组音节组合的次数和用户使用各组音节组合的最后时间获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310370370.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:体育事件的触感使能的观看
- 下一篇:一种计算机发光键盘