[发明专利]一种知识网络的半自动生成方法有效
申请号: | 201010212264.5 | 申请日: | 2010-06-29 |
公开(公告)号: | CN102207946A | 公开(公告)日: | 2011-10-05 |
发明(设计)人: | 陶鹏;张旭成;张伟伟;杜嘉伟 | 申请(专利权)人: | 天津海量信息技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦 |
地址: | 300384 天津市华苑*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种知识网络的半自动生成方法,包括如下步骤:(1)首先形成一个知识网络内核;(2)由单文本知识发现与抽取单元接收非结构化的文档,通过分词和命名实体识别技术,从非机构化文本数据中找到需要关注的知识点,并抽取出来;(3)在对多篇文档进行知识发现和抽取后,将新的知识放到相应位置上作为候选知识;(4)由知识网络运营平台将候选知识提交给相应的专家系统进行关联性判断,将判断为“是”的候选知识作为确认知识,判断为“否”的候选知识被舍弃。本知识网络半自动生成方法从一个小的知识网络内核开始,让计算机自动从互联网海量的数据中发现、抽取、组织知识,经专家系统进行确认后,能够迅速而有效地构造一个知识网络结构。 | ||
搜索关键词: | 一种 知识 网络 半自动 生成 方法 | ||
【主权项】:
一种知识网络的半自动生成方法,基于文本标引系统实现,所述文本标引系统中包括单文本知识发现与抽取单元、多文本知识关系提取与聚类单元、知识网络生成与修正单元、知识网络应用单元以及知识库存储单元,其特征在于:(1)首先形成一个知识网络内核;(2)所述单文本知识发现与抽取单元接收非结构化的文档,通过分词和命名实体识别技术,从非机构化文本数据中找到需要关注的知识点,并抽取出来;(3)在对多篇文档进行知识发现和抽取后,将新的知识放到相应位置上作为候选知识;(4)知识网络生成与修正单元中的知识网络运营平台将候选知识提交给相应的专家系统进行关联性判断,将判断为“是”的候选知识作为确认知识,判断为“否”的候选知识被舍弃。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津海量信息技术有限公司,未经天津海量信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010212264.5/,转载请声明来源钻瓜专利网。
- 上一篇:流体阀驱动机构
- 下一篇:由挤出金属制成的体育场梯级板