[发明专利]一种连续字符串的切分方法和装置无效
申请号: | 201210401107.8 | 申请日: | 2012-10-19 |
公开(公告)号: | CN103778138A | 公开(公告)日: | 2014-05-07 |
发明(设计)人: | 李超;宋国龙;李磊 | 申请(专利权)人: | 深圳市世纪光速信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 罗振安 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 连续 字符串 切分 方法 装置 | ||
技术领域
本发明涉及网络通信领域,特别涉及一种连续字符串的切分方法和装置。
背景技术
随着网络技术的飞速发展,用户越来越依赖于搜索引擎来搜索所需要的信息,在使用搜索引擎时,用户经常会输入连续字符串,这就需要对输入的连续字符串进行切分,以便更好的搜索到用户需要的信息。
目前对连续字符串的切分方法,主要是对连续英文串以及连续英文数字组合串利用固定的英文词典,对输入的连续英文串以及连续英文数字组合串进行匹配,然后得到切分结果,例如,输入“gohome”,“go”和“home”在词典中存在那么进行匹配,得到这个英文串是由“go”和“home”两个单词构成,那么切分结果为“go home”。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
现有对连续字符串中的连续英文串以及连续英文数字组合串利用英文词典进行切分的方法,一方面,由于互联网的网络上的新词不断更新,对于用户输入的这些新词时无法找到固定的词表来匹配,例如:win7,gaga等;另一方面,根据英文词典对连续英文串以及连续英文数字组合串进行匹配切分,会存在很大切分歧义,从而导致切分错误。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种连续字符串的切分方法和装置。所述技术方案如下:
一方面,提供了一种连续字符串的切分方法,所述方法包括:
接收用户输入的连续字符串;
获取所述连续字符串的切分资源;所述切分资源为与所述连续字符串相匹配且查询次数最多的字符串和/或与所述连续字符串相匹配且所述用户修改次数最多的字符串;
根据获取的所述连续字符串的切分资源对所述连续字符串进行切分。
具体地,所述获取所述连续字符串的切分资源,包括:
从搜索引擎的查询日志中获取所述连续字符串的切分资源;
和/或,
从所述搜索引擎中所述用户的会话日志中获取所述连续字符串的切分资源。
进一步地,所述从所述搜索引擎的查询日志中获取所述连续字符串的切分资源,具体包括:
在所述搜索引擎中获取预设时间内的查询日志,所述查询日志包括所有用户在搜索引擎中的查询记录;
从所述查询日志中查找与所述连续字符串相匹配的至少一个切分查询结果,并获取所述切分查询结果的查询次数以及所述连续字符串的查询次数;
当所述切分查询结果的查询次数大于所述连续字符串的查询次数时,从查询次数大于所述连续字符串的查询次数的切分查询结果中选择查询次数最多的切分查询结果作为所述连续字符串的切分资源。
进一步地,所述从所述搜索引擎中所述用户的会话日志中获取所述连续字符串的切分资源,具体包括:
在所述搜索引擎中获取保存的所述用户的会话日志,所述会话日志为根据预设的时间阈值进行划分的会话日志;
从所述用户的会话日志中查找与所述连续字符串相匹配的至少一个会话查询结果,并获取所述会话查询结果的修改次数;所述会话查询结果为所述用户在所述会话日志中对所述连续字符串进行改写且改写后被所述用户点击的字符串;
从获取的至少一个所述会话查询结果中选择修改次数最多的会话查询结果作为所述连续字符串的切分资源。
进一步地,所述从获取的至少一个所述会话查询结果中选择修改次数最多的会话查询结果作为所述连续字符串的切分资源,具体包括:
从所述搜索引擎中获取所述会话查询结果的检索次数和所述会话查询结果的点击次数,并获取所述连续字符串的检索次数和所述连续字符串的点击次数;
当所述会话查询结果的检索次数大于所述连续字符串的检索次数且所述会话查询结果的点击次数大于所述连续字符串的点击次数时,从检索次数和点击次数分别都大于所述连续字符串的检索次数和点击次数的所述会话查询结果中选择修改次数最多的会话查询结果作为所述连续字符串的切分资源。
具体地,所述根据获取的所述连续字符串的切分资源对所述连续字符串进行切分之后,还包括:
在所述搜索引擎中显示所述连续字符串的切分结果。
另一方面,提供了一种连续字符串的切分装置,所述装置包括:
接收模块,用于接收用户输入的连续字符串;
获取模块,用于获取所述连续字符串的切分资源;所述切分资源为与所述连续字符串相匹配且查询次数最多的字符串和/或与所述连续字符串相匹配且所述用户修改次数最多的字符串;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市世纪光速信息技术有限公司,未经深圳市世纪光速信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210401107.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种醇型密封胶的制备方法
- 下一篇:一种硼酸钙生物材料、制备方法及其应用