[发明专利]面向跨领域进行信息抽取的多层次特征模型和特征评价方法在审
申请号: | 201710076821.7 | 申请日: | 2017-02-13 |
公开(公告)号: | CN107301166A | 公开(公告)日: | 2017-10-27 |
发明(设计)人: | 朱文浩;徐永林;胡冠男;丁伯汉;郭心怡;居朝友 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 上海上大专利事务所(普通合伙)31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向跨领域进行信息抽取的多层次特征模型和特征评价方法,利用现有信息抽取相关文献中的特征,构建原始特征库;构建多层次特征理论模型,对具有领域性的特征进行降解,将特征分为复合特征和原子特征,降低特征的领域相关性;基于多层次特征理论模型,提出特征适应性评价方法,使用样本库评价可获得特征的跨领域适应性,获得可快速重复使用特征;利用多层次特征理论模型适应领域变化的能力,对模型中的特征进行可变性管理、进行实际网页分析与处理、进行实际网页中的特征识别匹配以及参数化,实现网页信息抽取特征评价系统。本发明完成了在信息抽取特征评价系统中对多层次特征进行建模实现了具有强适应性的跨领域信息抽取功能。 | ||
搜索关键词: | 面向 领域 进行 信息 抽取 多层次 特征 模型 评价 方法 | ||
【主权项】:
一种面向跨领域进行信息抽取的多层次特征模型和特征评价方法,其特征在于,具体操作步骤如下:步骤一,收集现有信息抽取研究文献中提到的文本特征,对其进行归纳、分类,构建原始特征库;步骤二,构建多层次特征理论模型:利用其对具有领域性的特征进行降解,将特征分为原子特征:不包括任何其他特征的独立特征,不具有或仅具有少量的领域特点,和复合特征:由一个或多个原子特征以某种形式或逻辑构成的特征,具有领域特点;来降低特征的领域相关性;步骤三,基于多层次特征理论模型,提出特征适应性评价方法,使用样本库来评价特征库中获得特征的跨领域适应性,以获取特征库中能够快速重复使用的特征;步骤四,基于多层次特征理论模型以及对领域变化具有适应能力的特征库,设计信息抽取特征评价系统,通过该系统对模型中的特征进行层次化的可变性管理、对实际的网页进行分析与处理、进行网页中特征的识别匹配以及参数化操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710076821.7/,转载请声明来源钻瓜专利网。
- 上一篇:使用USB接口的车辆系统和方法
- 下一篇:兼具数据分析功能的大数据存储器
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置