[发明专利]一种可信的知识生态系统在审
申请号: | 201811207431.X | 申请日: | 2018-10-17 |
公开(公告)号: | CN109582858A | 公开(公告)日: | 2019-04-05 |
发明(设计)人: | 吴旭;颉夏青;许晋;戴雨伦 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/35;G06F16/36 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 刘广达 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可信 个人知识库 生态系统 知识体系 存储 知识库 知识管理模块 结构化数据 学习资源库 流动过程 数据清洗 学习资料 知识分享 资源学习 自动收集 自我更新 成果库 结构化 归约 采集 互联网 融合 生长 学习 更新 开放 生产 | ||
1.一种可信的知识生态系统,其特征在于,包括:
学习资源自动收集模块,按需从互联网开放资源中采集特定主题的学习资料,进行数据清洗、数据归约,将结构化或半结构化数据可信地存储在内部学习资源库中;
资源学习模块,资源进行自学习形成个人知识库,其中个人知识库以可信的方式存储于平台上;
知识管理模块,对所述个人知识库中的知识要素进行组织并融合、更新到已有的知识库;
知识分享模块,将知识可信地分享给特定用户;
知识创新模块,结合已有知识体系,生产个人成果,并形成个人成果库;
成果提交模块,将所述个人成果提交到平台上,供其他学习者进行学习。
2.根据权利要求1所述的系统,其特征在于,
所述资源学习模块对象的载体形式包括:视频、音频、文档、和/或网页;
对所述个人知识库中的知识要素和已有的知识体系进行融合,包括:知识去重、消除歧义、和/或知识关联。
3.根据权利要求2所述的系统,其特征在于,
所述知识管理的方法为:利用思维导图工具以插件调用方式嵌入所述系统对知识进行管理。
4.根据权利要求1所述的系统,其特征在于,
所述知识分享包括:将个人知识库中的部分知识分享到所述系统的内部交流平台或者互联网开放资源平台,从内部交流平台分享到互联网开放资源平台,从所述个人成果库分享给内部交流平台或者互联网开放资源平台。
5.根据权利要求4所述的系统,其特征在于,
分享的过程中用户能够通过权限控制严格控制内容的访问范围,并且信息以密文形式在传输信道中传输。
6.根据权利要求1所述的系统,其特征在于,
所述采集学习资料的方法为基于语义的主题爬虫或增量爬虫算法。
7.根据权利要求6所述的系统,其特征在于,
所述主题爬虫方法包括如下步骤:
(一)、使用杜威十进分类法,在网页特征提取阶段,快速找出网页文本与锚文本关键词主题相近的关键词;
(二)、提取主题候选链接特征文本;
(三)、使用朴素贝叶斯文本分类器对候选链接主题边缘文本进行分类,获取主题相关网页;如果文本属于特定主题,那么相对应的候选链接以分类权值作为优先级值,以优先级的大小顺序插入爬行队列,爬虫优先访问分类值大的链接,如果文本不属于特定主题,则丢弃候选链接;
(四)、对相关网页的Web链接信息用HITS算法计算出其对应的权威度和中心度,综合锚文本、锚文本附近信息、反向网页、反向链接的兄弟链接、URL链接,预判待爬取网页与主题的相关度。
8.根据权利要求7所述的系统,其特征在于,
所述提取主题候选链接特征文本包括如下步骤:
(1)对网页的锚文本和正文进行分词处理,去掉停用词,得到关键词;
(2)查找关键词的杜威分类号码;
(3)运用杜威十进制分类法的特性并结合二维坐标提取主题候选链接特征文本;把关键词分类号码的长度作为X轴,关键词分类号码作为Y轴,将关键词对应的杜威十进分类号码在二维坐标中绘制相应的点;
(4)提取二维坐标中锚文本关键点以及锚文本周围的关键点对应的关键词作为主题候选链接特征文本。
9.根据权利要求1所述的系统,其特征在于,
该系统是可信的,具体体现在所述个人知识库、个人成果库的访问权限控制由用户进行管理;其中的数据可信地存储于系统平台。
10.根据权利要求9所述的系统,其特征在于,所述的可信存储,是指数据以密文方式存储在数据库中,通过非对称密钥的公钥进行加密,而私钥只有用户自己拥有,即使平台的管理者无法获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811207431.X/1.html,转载请声明来源钻瓜专利网。