首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种讨论区集合中热点讨论区的预测方法无效

申请号：	200810117822.2	申请日：	2008-08-05
公开（公告）号：	CN101645067A	公开（公告）日：	2010-02-10
发明（设计）人：	李楠;梁循	申请（专利权）人：	北京大学
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	北京君尚知识产权代理事务所（普通合伙）	代理人：	余功勋
地址：	100871***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种讨论集合热点预测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种讨论区集合中热点讨论区的预测方法，其特征在于，包括下列步骤：

a)针对目标讨论区集合，确定待预测的时间窗口W_i+1；

b)获得目标讨论区集合内的各个讨论区在时间窗口W_i-1和时间窗口W_i内的特征向量，所述特征向量由显示讨论区受关注程度的多个属性组成，其中，W_i在时间上介于W_i-1和W_i+1之间；

c)在W_i内，以各个讨论区的特征向量作为数据对象对各个讨论区进行聚类分析，并以得到的一个或多个类中心作为W_i内的热点讨论区；

d)以各个讨论区在W_i-1内的特征向量作为输入并以W_i内的热点讨论区作为输出进行SVM学习；

e)以各个讨论区在W_i内的特征向量作为上述学习后的SVM的输入，输出目标讨论区集合在W_i+1内的热点讨论区。

2.如权利要求1所述的方法，其特征在于，所述时间窗口W_i-1，W_i和W_i+1具有相同或部分相同或不同的时间长度。

3.如权利要求1所述的方法，其特征在于，所述时间窗口W_i-1和W_i在时间上互相连续，W_i和W_i+1在时间上互相连续。

4.如权利要求1所述的方法，其特征在于，所述时间窗口W_i-1和W_i在时间上互相重叠，W_i和W_i+1在时间上互相重叠。

5.如权利要求1所述的方法，其特征在于，组成所述特征向量的属性包括文本倾向性值，其通过下述方法获得：

a)针对目标讨论区集合中的各个讨论区，获得讨论区内各个目标帖子中用户发表的文本内容；

b)用分词工具提取所述文本内容中的词语；

c)基于HowNet中文情感语料库为所述词语赋予感情值；

d)以所述感情值的总和作为该讨论区的文本倾向性值。

6.如权利要求5所述的方法，其特征在于，步骤c)通过下述方法为所述词语赋予感情值：

i.将所述词语和设定的词语库作匹配，获得所述词语的感情色彩因数，其中正负面感情色彩的词语的感情色彩因数的正负号相反；

ii.将所述词语前若干词语分别和设定的词语库作匹配，若存在否定词汇，则对于每一个否定词汇均对所述感情色彩因数取反；

iii.将所述词语前后若干个词语分别和设定的词语库作匹配，获得所述若干个词语的程度修饰因数；

iv.以上述感情色彩因数和程度修饰因数的乘积作为所述感情值。

7.如权利要求6所述的方法，其特征在于，所述词语库包括中文正面词汇集合、中文负面词汇集合、中文否定词汇集合和修饰程度分成多个级别的多个中文程度修饰词汇集合且各个程度修饰词汇集合中的词汇所对应的程度修饰因数和其修饰程度成正相关。

8.如权利要求6所述的方法，其特征在于，组成所述特征向量的属性还包括选自由主题帖数量、平均回帖数量、平均文本倾向性值、正面感情色彩文本的百分比以及负面感情色彩文本的百分比组成的集合的属性。

9.如权利要求1所述的方法，其特征在于，所述聚类方法为K-means聚类，所述SVM基于LIBSVM工具包。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810117822.2/1.html，转载请声明来源钻瓜专利网。

上一篇：金属连线的制造方法
下一篇：一种适用于图像传感器像素阵列的光学邻近校正方法

同类专利

专利分类

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top