[发明专利]基于长篇文章生成短资讯方法、介质、装置和计算设备在审
申请号: | 201810782269.8 | 申请日: | 2018-07-17 |
公开(公告)号: | CN109508448A | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 刘历歌;陈保需;蒋徐阳 | 申请(专利权)人: | 网易传媒科技(北京)有限公司 |
主分类号: | G06F17/24 | 分类号: | G06F17/24;G06F17/27 |
代理公司: | 北京汉昊知识产权代理事务所(普通合伙) 11370 | 代理人: | 朱海波 |
地址: | 100084 北京市海淀区西北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本内容 资讯 计算设备 媒体用户 关键词选取 用户群体 分发 曝光 阅读 创作 分析 | ||
1.一种基于长篇文章生成短资讯的方法,包括:
获取文章的文本内容;
分析获取到的所述文本内容,从中得到一个或多个关键词;
基于所述一个或多个关键词选取部分文本内容;
根据所述部分文本内容生成短资讯。
2.如权利要求1所述的方法,其中,所述分析获取到的所述文本内容,从中得到一个或多个关键词的步骤包括:
分析获取到的所述文本内容,识别出其中的各个词语;
获取各个词语在所述文章中的词频信息和在全网的热度信息;
基于所述词频信息和热度信息确定一个或多个关键词。
3.如权利要求2所述的方法,其中,当所述文章中的词语具有多个词性时,按照每个词性作为不同的子词语处理,统计与各子词语对应的词频信息和热度信息。
4.如权利要求2所述的方法,其中,当所述文章中的词语具有多个词义时,按照每个词义作为不同的子词语处理,统计与各子词语对应的词频信息和热度信息。
5.如权利要求2所述的方法,其中,所述词语为名词。
6.如权利要求1所述的方法,其中,基于所述一个或多个关键词选取部分文本内容的步骤包括:
分别获取所述文章的文本内容中各个段落的关键词词频信息、位置信息和长度信息中的一个或多个作为参考信息;
根据所述参考信息选取用于生成短资讯的段落。
7.如权利要求1所述的方法,基于所述一个或多个关键词选取部分文本内容的步骤之后,所述方法还包括:
获取所述文章的多媒体内容;
根据所述部分文本内容生成短资讯的步骤包括:
结合所述多媒体内容和部分文本内容生成短资讯。
8.一种基于长篇文章生成短资讯的装置,包括:
文本内容获取模块,被配置为获取文章的文本内容;
关键词获取模块,被配置为分析获取到的所述文本内容,从中得到一个或多个关键词;
文本内容选取模块,被配置为基于所述一个或多个关键词选取部分文本内容;
短资讯生成模块,被配置为根据所述部分文本内容生成短资讯。
9.一种计算机可读存储介质,存储有程序代码,所述程序代码当被处理器执行时,实现如权利要求1-7之一所述的方法。
10.一种计算设备,包括处理器和存储有程序代码的存储介质,所述程序代码当被处理器执行时,实现如权利要求1-7之一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易传媒科技(北京)有限公司,未经网易传媒科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810782269.8/1.html,转载请声明来源钻瓜专利网。