[发明专利]基于概念代数的微博文本特征扩展方法在审
申请号: | 201510151586.6 | 申请日: | 2015-04-01 |
公开(公告)号: | CN106156089A | 公开(公告)日: | 2016-11-23 |
发明(设计)人: | 吴善鹏;叶飞跃 | 申请(专利权)人: | 吴善鹏;叶飞跃 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200444 上海市宝*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于自然语言处理领域中的文本处理方法设计。针对微博文本处理中特征稀疏性问题,本发明提出了一种基于概念代数的微博文本特征扩展方法。包括以下步骤:S1、维基百科知识库信息预处理;S2、微博文本预处理,微博文本内容扩充,词义纠正;S3、基于概念代数的微博文本特征的属性集构建;S4、基于概念代数的微博文本特征的输入关系和输出关系构;S5、生成微博文本的概念代数表示形式。本发明利用基于维基百科的类别网络的相关度计算方法,获得基于概念代数表示微博文本特征的属性集;利用维基百科的页面网络的入度节点信息和出度节点信息,获得基于概念代数表示的微博文本特征的输入关系和输出关系。 | ||
搜索关键词: | 基于 概念 代数 文本 特征 扩展 方法 | ||
【主权项】:
一种基于概念代数的微博文本特征扩展方法,其特征在于,包括以下步骤:S1、维基百科知识库信息预处理S2、微博文本预处理,微博文本内容扩充,词义纠正S3、基于概念代数的微博文本特征的属性集构建S4、基于概念代数的微博文本特征的输入关系和输出关系构建S5、生成微博文本的概念代数表示形式。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴善鹏;叶飞跃,未经吴善鹏;叶飞跃许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510151586.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种索引数据处理方法、数据查询方法及装置
- 下一篇:制冷器具