[发明专利]一种评论自动生成方法在审
申请号: | 202010754601.7 | 申请日: | 2020-07-30 |
公开(公告)号: | CN111914566A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 张京鹏;蔡博克;贲忠奇;冷若冰;阚野;张云 | 申请(专利权)人: | 混沌时代(北京)教育科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N20/00 |
代理公司: | 北京鱼爪知识产权代理有限公司 11754 | 代理人: | 曹治丽 |
地址: | 100088 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评论 自动 生成 方法 | ||
本发明提出了一种评论自动生成方法,涉及机器学习领域。一种评论自动生成方法,包含获取评价内容,将评价内容输入GPT‑2训练模型中以确定回复内容,其中,GPT‑2训练模型为使用多组评论数据通过机器学习训练得到,多组评论数据包含第一类数据和第二类数据,第一类数据的每组数据均包含评论信息及标识评论信息的内容属性的属性标识,第二类数据的每组数据均包含评论信息及标识多组评论信息的内容质量的质量标识;根据评价内容的行业属性选择属性标识以确定评论信息的选取范围,并根据质量标识选择评论信息的内容以生成回复内容。本发明能够对不同领域的信息进行迁移,并且适应于评论性内容。
技术领域
本发明涉及机器学习领域,具体而言,涉及一种评论自动生成方法。
背景技术
互联网用户社区建设增长迅速,为了增加用户的活跃度和体验,需要对用户内容进行及时的评论。在以往的技术中,大多数是使用人工或者采用语术模板而进行,耗费人力。也有运用语义检索技术从已有的评论库中寻找合适的评论,这种技术方式需要维护一个大规模的评论库,也只能产生已有的评论,对陌生领域无法做迁移。
随着深度学习在自然语言领域的发展,NLG(自然语言生成)技术也得到了很大的发展,
特别是近两年GPT2的生成效果更是让人惊艳。但该模型在针对短文本评论场景,需要将自动评论转换成对话领域,但这种方式适用于闲聊,在意见、评价和探讨类的评论性内容并不合适。
发明内容
本发明的目的在于提供一种自动评论生成方法,其能够对不同领域的信息进行迁移,并且适应于评论性内容。
本发明的实施例是这样实现的:
本申请实施例提供一种评论自动生成方法,包含获取评价内容,将上述评价内容输入GPT-2训练模型中以确定回复内容,其中,上述GPT-2训练模型为使用多组评论数据通过机器学习训练得到,多组上述评论数据包含第一类数据和第二类数据,上述第一类数据的每组数据均包含评论信息及标识上述评论信息的内容属性的属性标识,上述第二类数据的每组数据均包含评论信息及标识多组上述评论信息的内容质量的质量标识;根据上述评价内容的行业属性选择上述属性标识以确定上述评论信息的选取范围,并根据上述质量标识选择上述评论信息的内容以生成上述回复内容。
在本发明的一些实施例中,上述内容质量根据上述评论信息的长度、图片、段落、标题、字体和意见性导语中的一种或多种对上述评论信息进行质量评价并生成质量标识。
在本发明的一些实施例中,上述意见性导语包含认为、观点、觉得、看法、赞同、支持、反对、同意、总的来说、一般和通常中的任意一项或多项。
在本发明的一些实施例中,根据上述评价内容分析上述行业属性,根据上述行业属性与上述属性标识的匹配度确定上述评论信息的上述选取范围。
在本发明的一些实施例中,上述评论信息通过新闻资讯类网站获取。
在本发明的一些实施例中,上述新闻资讯类网站包含新闻评价用语、互联网社评和维基百科中的任意一种或多种。
在本发明的一些实施例中,将多组上述评论信息的内容进行语义分析,并根据多组上述评论信息与上述评价内容的匹配度计算相似内容的出现频率,从而生成回复内容。
在本发明的一些实施例中,上述评论信息包含评价用语和评论。
在本发明的一些实施例中,根据上述评论信息中上述评价用语的出现频率生成评价用语模板,并通过评价用语数据库存储上述评价用语模板,从而通过上述评价用语模板调用上述评价用语并生成上述回复内容。
在本发明的一些实施例中,根据上述评论信息中上述评论的出现频率生成评论模板,并通过评论数据库存储上述评论模板,从而通过上述评价用语模板调用上述评论并生成上述回复内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于混沌时代(北京)教育科技有限公司,未经混沌时代(北京)教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010754601.7/2.html,转载请声明来源钻瓜专利网。