[发明专利]一种谣言识别方法在审

专利信息
申请号: 201810224475.7 申请日: 2018-03-19
公开(公告)号: CN108614855A 公开(公告)日: 2018-10-02
发明(设计)人: 陈鸿睿;肖日新;马斌;纪其进 申请(专利权)人: 众安信息技术服务有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京市万慧达律师事务所 11111 代理人: 张慧娟
地址: 518000 广东省深圳市前海深港合作区前*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种谣言识别方法,所述方法包括:抓取有标记的文本内容,对文本进行清洗整理,并分割成句,将文本内容以句为单位存储到数据库中;依据中文分词词库,对分割成句的文本内容进行分词处理,将分词后的内容再次整理,变成模型可读、规范的形式作为模型的输入内容;将分词后的内容通过模型进行高纬度向量化关联映射,再将词向量进行权重上的组合,形成句子向量、段落向量或者文章向量,从模型输出;将处理后的训练语料信息输入到分类器模型进行训练,并输出判定结果;构造待测文本函数,进行谣言判别模型的效果测试。本发明在降低了人力成本的同时,提高了谣言判定的可靠性。
搜索关键词: 文本内容 分词 向量 文本 高纬度 抓取 分类器模型 分词处理 句子向量 判别模型 人力成本 输出判定 输入内容 效果测试 信息输入 训练语料 中文分词 词向量 向量化 分割 映射 词库 可读 权重 判定 清洗 数据库 存储 关联 输出
【主权项】:
1.一种谣言识别方法,其特征在于,所述方法包括:抓取有标记的文本内容,对文本进行清洗整理,并分割成句,将文本内容以句为单位存储到数据库中;依据中文分词词库,对分割成句的文本内容进行分词处理,将分词后的内容再次整理,变成模型可读、规范的形式作为模型的输入内容;将分词后的内容通过模型进行高纬度向量化关联映射,再将词向量进行权重上的组合,形成句子向量、段落向量或者文章向量,从模型输出;将处理后的训练语料信息输入到分类器模型进行训练,并输出判定结果;构造待测文本函数,进行谣言判别模型的效果测试。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810224475.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top