[发明专利]一种网络个体或群体价值观自动判别方法在审
申请号: | 201510531262.5 | 申请日: | 2015-08-26 |
公开(公告)号: | CN105159879A | 公开(公告)日: | 2015-12-16 |
发明(设计)人: | 张华平;赵燕平;周建栋;孙梦姝 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 个体 群体 价值观 自动 判别 方法 | ||
1.一种网络个体或群体价值观自动判别方法,其特征在于:包括以下步骤:
步骤1)基于典型价值观三层树形结构搜集价值观新闻语料集;
步骤2)基于语料集及卡方统计方法构建典型价值观特征向量,并基于TF-IDF-IG方法计算其权重;
步骤3)基于步骤2)的方法确定社交网络个体的价值观特征向量,然后计算其与典型价值观特征向量的相似度,并进行价值观优先级评估;
步骤4)基于网络群体中每个个体的价值观优先级对其进行价值观分类,得到网络群体的价值观评估。
2.根据权利要求1所述的一种网络个体或群体价值观自动判别方法,其特征在于:所述步骤1)基于典型价值观三层树形结构搜集价值观新闻语料集进一步包括以下步骤:
步骤1-1)基于经典价值观理论构建典型价值观三层树形概念结构;
步骤1-2)基于步骤1-1)构建对应的价值观新闻语料集;
步骤1-3)根据设置的时间节点更新价值观新闻语料集。
3.根据权利要求2所述的一种网络个体或群体价值观自动判别方法,其特征在于:所述步骤1-1)基于经典价值观理论构建典型价值观三层树形概念结构,进一步通过以下过程完成:
基于经典价值观理论搜集价值观语料集。本发明以施瓦兹价值观理论为例,但权利要求不限于本例。首先,根据施瓦兹价值观环形结构得到10个基本价值观倾向类别:包括“权力”、“成就”、“仁爱”、“普世”、“享乐”、“安全”、“传统”、“自我定向”、“刺激”和“遵从”十个典型类别特征;其次,每个典型类别特征下包括细分的二级价值观概念词汇;最后,根据二级价值观概念词汇得到的近义词作为各典型价值观类别的三级扩展词汇;由各典型类别特征及其下细分的二级价值观概念词汇和三级扩展词汇形成整个典型价值观类别的三层树形概念结构。
4.根据权利要求2所述的一种网络个体或群体价值观自动判别方法,其特征在于:所述步骤1-2)基于步骤1-1)构建对应的价值观新闻语料集,进一步包括:
首先,基于步骤1-1)得到的典型价值观三层树形结构,在主流新闻类搜索引擎的API接口上对典型三层树形概念结构词汇进行检索,得到粗新闻语料集;其次,根据其所属的价值观类别进行汇总、去重以及摘要提取操作,将各价值观类别下的新闻文档以<名称,摘要>的格式进行数据库存档,完成基于价值观分类的新闻文档语料集构建工作。
5.根据权利要求2所述的一种网络个体或群体价值观自动判别方法,其特征在于:所述的步骤1-3),其特征在于:根据设置的时间节点更新价值观新闻语料集,进一步通过以下过程完成:
将所述步骤1-2)每隔指定时间执行一次,完成价值观语料集的更新;并在每次执行完后触发所述步骤2)的后续过程。
6.根据权利要求1所述的一种网络个体或群体价值观自动判别方法,其特征在于:所述步骤2)基于语料集、卡方统计方法以及TF-IDF-IG方法构建典型价值观特征向量,进一步通过以下步骤完成:
步骤2-1)首先用中文文本分词工具对所述价值观新闻语料集进行分词和词性标注,并完成词频统计,停用词剔除的预处理工作;然后基于卡方统计方法抽取各价值观的典型语义词汇;
步骤2-2)基于TF-IDF-IG方法计算各类别价值观中典型语义词汇的权重值,并构建各典型价值观特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510531262.5/1.html,转载请声明来源钻瓜专利网。