[发明专利]及时发现和跟踪地产项目动态的方法有效
申请号: | 201410633346.5 | 申请日: | 2014-11-11 |
公开(公告)号: | CN104391893B | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 邓伟;张泽泉 | 申请(专利权)人: | 成都锐理数据处理技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 成都宏顺专利代理事务所(普通合伙) 51227 | 代理人: | 周永宏 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 及时 发现 跟踪 地产 项目 动态 方法 | ||
本发明公开了一种及时发现和跟踪地产项目动态的方法;其具体包括获取土地信息、结构化土地信息、将土地存入土地信息库、判断地产指标位置、提取项目信息、获取未登录新项目信息、关联土地和项目信息并录入项目库、提取结构化的项目信息、更新项目后续信息。本发明的有益效果是:本发明建立了多样的模板对信息进行提取,优化了提取结果,省时省力且覆盖率高。
技术领域
本发明属于自然语言识别技术领域,尤其涉及一种及时发现和跟踪地产项目动态的方法。
背景技术
自然语言识别(Natural Language Processing,NLP)是一种对自然语言信息进行处理的技术,从语言学的角度来说,自然语言识别也叫计算语言学(ComputationalLinguistics)。自然语言识别包括自然语言理解(Natural Language Understanding,NLU)和自然语言生成(Natural Language Generation,NLG)两部分。自然语言理解是指对自然语言的内容和意图的深层把握。在人工智能领域中,自然语言理解特指计算机对自然语言的内容和意图的深层把握。自然语言生成是指从非自然语言输入到自然语言输出的处理。自然语言理解与自然语言生成互为逆过程。自然语言识别是人工智能早期的研究领域之一,也是一个极为重要的领域,主要包括人机对话和机器翻译两大任务,是一门融语言学、计算机科学、数学于一体的科学。由于以乔姆斯基为代表的新一代语言学派的贡献和计算机技术的发展,自然语言理解正在变得越来越热门.有很多理由值得人们去研究如何使计算机程序能以某种方式使用自然语言的问题。口语是人们进行交际的自然形式,计算机用户希望能与机器对话交流。自然语言输入可以表示成口语,也能从键盘上打入,以文体的形式给出。信息提取(I nformati on Extracti on)是指从一段文本中抽取指定的一类信息(例如事件、事实)、并将其(形成结构化的数据)填入一个数据库中供用户查询使用的过程。条件随机域(场)(conditional random fields,简称CRF,或CRFs),是一种判别式概率模型,是随机场的一种,常用于标注或分析序列资料,如自然语言文字或是生物序列。如同马尔可夫随机场,条件随机场为具有无向的图模型,图中的顶点代表随机变量,顶点间的连线代表随机变量间的相依关系,在条件随机场中,随机变量Y的分布为条件机率,给定的观察值则为随机变量X。原则上,条件随机场的图模型布局是可以任意给定的,一般常用的布局是链结式的架构,链结式架构不论在训练(training)、推论(inference)、或是解码(decoding)上,都存在效率较高的算法可供演算。“条件随机场”被用于中文分词和词性标注等词法分析工作,一般序列分类模型常常采用隐马尔可夫模型(HMM),像基于类的中文分词。但隐马尔可夫模型中存在两个假设:输出独立性假设和马尔可夫性假设。其中,输出独立性假设要求序列数据严格相互独立才能保证推导的正确性,而事实上大多数序列数据不能被表示成一系列独立事件。而条件随机场则使用一种概率图模型,具有表达长距离依赖性和交叠性特征的能力,能够较好地解决标注(分类)偏置等问题的优点,而且所有特征可以进行全局归一化,能够求得全局的最优解。目前有多种对实体进行识别的技术,但是地产行业不同于人名地名识别,他有自己的命名规则,比如数字字母中文的混合。对不同的营销目的有一套相应的命名原则。现有的模板提取技术没有考虑到行业特点,网络上每天有大量的项目,人工更新费时费力,而且覆盖率不高。
发明内容
为了解决以上问题,本发明提出了一种及时发现和跟踪地产项目动态的方法。
本发明的技术方案是:一种及时发现和跟踪地产项目动态的方法,具体包括如下步骤:
S1.获取与土地信息相关的目标网页,提取土地信息;
S2.依据预先建立的土地和项目指标规则库,将土地信息进行结构化;
S3.结合土地知识库将结构化的土地信息存入土地信息库;
S4.读取地产知识库,判断地产指标所在位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都锐理数据处理技术股份有限公司,未经成都锐理数据处理技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410633346.5/2.html,转载请声明来源钻瓜专利网。