[发明专利]一种基于关键词的文章生成方法有效
申请号: | 202010071315.0 | 申请日: | 2020-01-21 |
公开(公告)号: | CN111274776B | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 梁峰;鲁道沅;王严博 | 申请(专利权)人: | 中国搜索信息科技股份有限公司 |
主分类号: | G06F40/166 | 分类号: | G06F40/166;G06F40/289;G06F16/31 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 于国强 |
地址: | 100000 北京市大兴*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于关键词的文章生成方法,包括S1、利用爬虫获取互联网上的散文内容,并将其作为初始训练数据集,对所述初始训练数据集进行分段,获取多个段落文本,给各个段落文本配置ID编号,并将所有段落文本汇总为散文段落数据集;S2、根据ID编号对所述散文段落数据集建立索引,以获取散文段落数据集的索引;对所述散文段落数据集进行切词,并对分词结果进行训练,以获取散文段落数据集的sentence特征向量模型;S3、获取用户提交的待生成文本的关键词和待生成文本的段落数量;等步骤。优点是:采用了全新的基于sentence的正排索引和倒排索引工程实现服务在线计算服务,在线计算性能高,可以反复生成keyword的多种语义角度的文本文章。 | ||
搜索关键词: | 一种 基于 关键词 文章 生成 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国搜索信息科技股份有限公司,未经中国搜索信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010071315.0/,转载请声明来源钻瓜专利网。
- 上一篇:一种带间隙单元的黏滞阻尼器
- 下一篇:语音合成方法、装置和计算机可读存储介质