[发明专利]基于深度学习的新闻资讯呈现方法及相关设备在审

申请号：	202010601487.4	申请日：	2020-06-28
公开（公告）号：	CN111813936A	公开（公告）日：	2020-10-23
发明（设计）人：	王文浩;徐国强	申请（专利权）人：	深圳壹账通智能科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F16/951;G06F16/34;G06F40/216;G06K9/62
代理公司：	深圳市赛恩倍吉知识产权代理有限公司 44334	代理人：	何春兰;孙芬
地址：	518052 广东省深圳市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度学习新闻资讯呈现方法相关设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及人工智能技术领域，提供一种基于深度学习的新闻资讯呈现方法，包括：从网络上获取实时新闻资讯，并将实时新闻资讯按照话题进行分类；对话题下的每篇文章进行预处理，提取预处理后的每篇文章的词频‑逆文本频率指数TF‑IDF值，并确定文章中每个词的词向量；根据TF‑IDF值以及词向量，确定文章的特征向量；对每个话题下所有文章的特征向量进行聚类，获得话题下的多个子话题的细粒度聚类；使用BERTSUM模型，提取每个子话题下的多篇文章的代表性摘要；输出话题、话题对应的多个子话题以及每个子话题对应的代表性摘要。本发明还涉及区块链技术，BERTSUM模型存储在区块链上。

技术领域

本发明涉及人工智能技术领域，尤其涉及一种基于深度学习的新闻资讯呈现方法及相关设备。

背景技术

随着互联网的快速发展，社会进入了信息极度爆炸的时代，每天将会产生大量的新闻，人们希望花费更少的时间去了解更多自己关注的资讯话题中的重要信息。

然而，目前的新闻资讯，通常是根据新闻的来源，将新闻资讯按照不同领域进行分类，比如财经、科技、国内、国外等，这种分类方式，很难抓取到用户想要关注的维度，新闻资讯的呈现效果较差。

发明内容

鉴于以上内容，有必要提供一种基于深度学习的新闻资讯呈现方法及相关设备，能够提高新闻资讯的呈现效果。

本发明的第一方面提供一种基于深度学习的新闻资讯呈现方法，所述方法包括：

通过爬虫技术，从网络上获取实时新闻资讯，并将所述实时新闻资讯按照话题进行分类；

针对每个话题，对所述话题下的每篇文章进行预处理；

利用关键词提取算法，提取预处理后的每篇文章的词频-逆文本频率指数 TF-IDF值，并确定所述文章中每个词的词向量；

根据所述TF-IDF值以及所述词向量，确定所述文章的特征向量；