[发明专利]一种移动搜索引擎优化方法在审
申请号: | 201210491498.7 | 申请日: | 2012-11-27 |
公开(公告)号: | CN103838797A | 公开(公告)日: | 2014-06-04 |
发明(设计)人: | 李勇;郑世超 | 申请(专利权)人: | 大连灵动科技发展有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 曲永祚 |
地址: | 116023 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种移动搜索引擎优化方法。包括以下步骤:设计移动搜索引擎框架;建立URL列表;编辑翻译器;设计WAP接口.由于本发明针对移动搜索引擎的现状,在现有互联网搜索引擎的框架上加入移动模块,提出一种利用HTML资源建立移动搜索引擎的方式,该方式通过集中处理网络蜘蛛抓取的HTML网页,将HTML网页进行主题信息提取,再将主题信息转化成手机可以识别的WML页面,并存入WML的快照库中,当用户点击条记录察看具体网页时,系统不会直接链接互联网上的该网页,而是链接该网页相对应的WML网页快照,满足用户的移动搜索需求。在实际应用中,使用这种方式成功的建立了一个面向生活服务领域的移动搜索引擎,覆盖全国近四十个城市的餐饮、娱乐和黄页信息。 | ||
搜索关键词: | 一种 移动 搜索引擎 优化 方法 | ||
【主权项】:
1.一种移动搜索引擎优化方法,其特征在于:包括以下步骤:A、设计移动搜索引擎框架包括以下步骤:本搜索引擎框架也是由搜索器、索引器、检索器、用户接口四个部分组成,还具有移动模块,作为移动搜索引擎,它包括三个部分:翻译器,将蜘蛛抓取的HTML页转化为WML页;WML网页快照库,保存转化后的WML页;WAP接口,用手机访问的用户界面;B、建立URL列表将抓取到的网页存入网页库,并将网页上的所有超链接存入到URL列表中;C、编辑翻译器翻译器具有网页过滤、主题信息过滤和翻译三个部分;C.1网页过滤首先将目录页面过滤,不予翻译,根据网页的文本节点数与链接数的比例,来划分页面的性质,存入索引库;C.2主题信息过滤提取网页的主题相关部分,选择不依赖于信息源的STU-DOM的树模型,将网页的table、tr、div和tbody标签结点作为分块结点,对于一个块的取舍用局部相关度Local Correlativity)和上下文相关度Contextual Correlativity来衡量;局部相关度由块内链接和内容决定,其计算公式可以表达为:LinkCount ( STU i ) = Σ j = 1 N LinkCount ( STUC ij ) ]]>CountentLenth ( STU i ) = Σ j = 1 N ContentLength ( STUC ij ) ]]>LocalCorrelativity ( STU i ) ]]>= LinkCount ( STU i ) CountentLenth ( STU i ) ]]> 其中,ContentLength和LinkCount分别表示块内的文字数和链接数,表示的第j个子块;上下文相关度由块内链接和父块内容决定,其计算公式可以表达为:Contextual Correlativ ity ( STU i ) ]]>= LinkCount ( STU i ) CountentLenth ( STU Pi ) ]]> 其中,STUPi表示STUi的父结点;本设计规定局部相关度阈值是2,而上下文相关度的阈值是70;C3.将HTML转化WML:当HTML块转化时,首先要去除WML无法处理的元素,如style、front、script等标签;然后,建立HTML标签与WML标签转化的对应关系表,根据关系列表将HTML转化为手机可读的WML,在手机上无法一屏显示的文本,需要进行分页处理,并存入WML的快照库中;D、设计WAP接口WAP接口是以手机为载体的人机交互查询界面;采用WML或xHTML语言设计,;设计WAP上的内容要尽量简练:在搜索结果的列表页上,条目数最多不超过十条。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连灵动科技发展有限公司,未经大连灵动科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210491498.7/,转载请声明来源钻瓜专利网。