[发明专利]基于中文分词的旅游信息抽取与聚合方法无效
申请号: | 201110051652.4 | 申请日: | 2011-03-03 |
公开(公告)号: | CN102654873A | 公开(公告)日: | 2012-09-05 |
发明(设计)人: | 吴志祥 | 申请(专利权)人: | 苏州同程旅游网络科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 陈忠辉 |
地址: | 215123 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于中文分词的旅游信息抽取与聚合方法,其特点是采用如下:首先,收集初始旅游业特征词库。接着,进行网页获取及预处理。然后,进行网页正文的提取。之后,采取词法分析及信息提取。最后进行信息聚合。可以有效解决对于某一领域内精确信息的需求。同时满足用户精准查找信息的需求,使用垂直搜索引擎的人,对于需求的信息非常明确。并且,与其它Web信息抽取方法相比,当一个新的领域中文词库建成之后,只要对本系统给出它的地址,那么本方法就可以基于新的中文词库进行Web信息抽取了,从而就扩展到新的领域。 | ||
搜索关键词: | 基于 中文 分词 旅游 信息 抽取 聚合 方法 | ||
【主权项】:
基于中文分词的旅游信息抽取与聚合方法,其特征在于包括以下步骤:步骤①,收集初始旅游业特征词库;步骤②,进行网页获取及预处理;步骤③,网页正文的提取;步骤④,词法分析及信息提取;步骤⑤,信息聚合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州同程旅游网络科技有限公司,未经苏州同程旅游网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110051652.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种利用支护桩的抗浮结构
- 下一篇:一种施加预应力的水泥土重力式围护墙