[发明专利]一种谣言识别方法在审

申请号：	201810224475.7	申请日：	2018-03-19
公开（公告）号：	CN108614855A	公开（公告）日：	2018-10-02
发明（设计）人：	陈鸿睿;肖日新;马斌;纪其进	申请（专利权）人：	众安信息技术服务有限公司
主分类号：	G06F17/30	分类号：	G06F17/30;G06F17/27
代理公司：	北京市万慧达律师事务所 11111	代理人：	张慧娟
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种谣言识别方法，所述方法包括：抓取有标记的文本内容，对文本进行清洗整理，并分割成句，将文本内容以句为单位存储到数据库中；依据中文分词词库，对分割成句的文本内容进行分词处理，将分词后的内容再次整理，变成模型可读、规范的形式作为模型的输入内容；将分词后的内容通过模型进行高纬度向量化关联映射，再将词向量进行权重上的组合，形成句子向量、段落向量或者文章向量，从模型输出；将处理后的训练语料信息输入到分类器模型进行训练，并输出判定结果；构造待测文本函数，进行谣言判别模型的效果测试。本发明在降低了人力成本的同时，提高了谣言判定的可靠性。
搜索关键词：	文本内容分词向量文本高纬度抓取分类器模型分词处理句子向量判别模型人力成本输出判定输入内容效果测试信息输入训练语料中文分词词向量向量化分割映射词库可读权重判定清洗数据库存储关联输出
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种谣言识别方法，其特征在于，所述方法包括：抓取有标记的文本内容，对文本进行清洗整理，并分割成句，将文本内容以句为单位存储到数据库中；依据中文分词词库，对分割成句的文本内容进行分词处理，将分词后的内容再次整理，变成模型可读、规范的形式作为模型的输入内容；将分词后的内容通过模型进行高纬度向量化关联映射，再将词向量进行权重上的组合，形成句子向量、段落向量或者文章向量，从模型输出；将处理后的训练语料信息输入到分类器模型进行训练，并输出判定结果；构造待测文本函数，进行谣言判别模型的效果测试。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司，未经众安信息技术服务有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810224475.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种谣言识别方法在审

专利文献下载