[发明专利]基于人工智能的标题的改写处理方法、装置及可读介质有效
申请号: | 201711147815.2 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107832299B | 公开(公告)日: | 2021-11-23 |
发明(设计)人: | 陈笑;何径舟;周古月;付志宏;袁德璋 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/253 | 分类号: | G06F40/253;G06F40/258 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 袁媛 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 人工智能 标题 改写 处理 方法 装置 可读 介质 | ||
本发明提供一种基于人工智能的标题的改写处理方法、装置及可读介质。其方法包括:获取文章中各句子的特征表达,该句子的特征表达包括句子的信息特征以及句子与文章的原始标题的相似性特征;根据各句子的特征表达和预先训练的支撑句提取模型,从文章的各句子中提取文章的支撑句;根据文章的支撑句和预先训练的标题生成模型,生成文章的支撑句对应的候选标题;根据文章的原始标题、候选标题和预先训练的点击率预估模型,确定是否利用候选标题对文章的原始标题进行改写处理。采用本发明的技术方案,可以保证在文章的标题只要被改写,就可以提高改写后的标题的质量,提高改写标题后的文章的召回率,从而满足真正的标题改写需求。
【技术领域】
本发明涉及计算机应用技术领域,尤其涉及一种基于人工智能的标题的改写处理方法、装置及可读介质。
【背景技术】
人工智能(Artificial Intelligence;AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
现有技术中,互联网内容平台普遍存在提高优质内容流量的需求。在海量内容数据中,什么样的内容能够吸引用户点击和浏览,其中一个重要特征就是标题。一方面随着内容生产者的门槛降低、内容的生产速度大幅提升,标题质量难以得到保障;另一方面,单个内容生产者对用户的理解有限,难以有效评估标题对用户的吸引度。如何帮助内容生产者为优质内容生成一个优质的吸引用户点击的标题,是互联网内容平台的一个重要课题。现有的标题改写多采用人工改写的方式,将某些词语改写为同义的另一些词语,改写后的标题与原标题差别较小,具体表现为字面稍有差别、句式基本不变、语义高度一致。
但是,由于现有的标题改写处理方法为用户的手动改写,仅将标题中一个词语改写为另一词语,使得改写后的标题质量较差,无法满足真正的标题改写需求。
【发明内容】
本发明提供了一种基于人工智能的标题的改写处理方法、装置及可读介质,用于提高标题改写质量,满足真正的标题改写需求。
本发明提供一种基于人工智能的标题的改写处理方法,所述方法包括:
获取文章中各句子的特征表达,所述句子的特征表达包括所述句子的信息特征以及所述句子与所述文章的原始标题的相似性特征;
根据各所述句子的特征表达和预先训练的支撑句提取模型,从所述文章的各所述句子中提取文章的支撑句;
根据所述文章的支撑句和预先训练的标题生成模型,生成所述文章的支撑句对应的候选标题;
根据所述文章的原始标题、所述候选标题和预先训练的点击率预估模型,确定是否利用所述候选标题对所述文章的所述原始标题进行改写处理。
进一步可选地,如上所述的方法中,根据所述文章的原始标题、所述候选标题和预先训练的点击率预估模型,确定是否利用所述候选标题对所述文章的所述原始标题进行改写处理,具体包括:
根据所述文章的原始标题和预先训练的点击率预估模型,获取所述原始标题对应的预估点击率;
根据所述文章的所述候选标题和所述点击率预估模型,获取所述候选标题对应的预估点击率;
判断所述候选标题对应的预估点击率是否大于所述原始标题对应的预估点击率;
若是,利用所述候选标题对所述文章的所述原始标题进行改写处理;否则不用对所述文章的所述原始标题进行改写处理。
进一步可选地,如上所述的方法中,根据所述文章的原始标题和预先训练的点击率预估模型,获取所述原始标题对应的预估点击率,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711147815.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于输出信息的方法和装置
- 下一篇:面向微创医疗领域文本摘要生成方法及装置