[发明专利]标题文本生成方法、装置、计算机存储介质和电子设备在审
申请号: | 201910338380.2 | 申请日: | 2019-04-25 |
公开(公告)号: | CN111753533A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 郭昆;陶通;赫阳 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 王辉;阚梓瑄 |
地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标题 文本 生成 方法 装置 计算机 存储 介质 电子设备 | ||
本公开涉及计算机技术领域,具体涉及了一种标题文本生成方法及装置、存储介质和电子设备。该方法包括:获取一级候选标题的困惑度;根据所述困惑度对所述一级候选标题进行过滤处理,以获取二级候选标题;获取所述二级候选标题的点击概率;基于所述点击概率对所述二级候选标题进行排序,并从排序后的所述二级候选标题中确定目标候选标题。本公开通过结合候选标题的困惑度和点击概率,对获选标题进行综合排序和过滤处理以确定目标候选标题,提高了目标候选标题的准确性和逻辑性,也增加了目标候选标题对用户的吸引程度。
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种标题文本生成方法、标题文本生成装置、计算机存储介质和电子设备。
背景技术
随着计算机技术和互联网技术的发展,互联网平台普遍存在提高内容访问量的需求(例如物品信息、新闻信息的浏览量等),而面于海量的数据,为了提高内容的访问量并且方便用户在最短时间内寻找到目标内容,能否提供高质量、具有吸引力的标题文本,已成为不可小觑的问题之一。
在相关技术中,主要是基于预设规则或语言模型生成相关内容的标题,然而,这些方法难以平衡标题文本的准确性、通顺性以及对用户的吸引力,一方面,缺乏对生成标题的质量评估,难以把控标题与相关内容的贴合度,导致生成的标题准确度不高;另一方面,为了提高生成标题的准确性,往往又忽略标题了对用户潜在吸引力的考虑。
因此,需要提供一种新的标题文本生成方法。
需要说明的是,在上述背景技术部分发明的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种标题文本生成方法及装置、计算机存储介质和电子设备,进而至少在一定程度上避免生成的标题文本难以平衡准确性、通顺性以及对用户的吸引力等方面的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种标题文本生成方法,包括:获取一级候选标题的困惑度;根据所述困惑度对所述一级候选标题进行过滤处理,以获取二级候选标题;获取所述二级候选标题的点击概率;基于所述点击概率对所述二级候选标题进行排序,并从排序后的所述二级候选标题中确定最终标题。
在本公开的一种示例性实施例中,在所述获取一级候选标题的困惑度之前,所述方法还包括:提取当前物品对应的文本信息中的物品标签词和目标关键词,并根据所述物品标签词和所述目标关键词生成所述一级候选标题。
在本公开的一种示例性实施例中,所述一级候选标题中包括至少两个目标关键词;所述获取一级候选标题的困惑度,包括:计算所述一级候选标题中目标关键词对的共现概率;根据所述目标关键词对的共现概率确定所述困惑度,其中所述目标关键词对由所述一级候选标题中任意两个相邻的目标关键词组成。
在本公开的一种示例性实施例中,所述目标关键词对依次包括第一关键词和第二关键词;所述计算所述一级候选标题中目标关键词对的共现概率,包括:获取与所述一级候选标题对应的目标物品词;获取预设标题库中出现第一目标标题的第一概率,所述第一目标标题为包含所述目标物品词和所述目标关键词对的标题;获取所述预设标题库中出现第二目标标题的第二概率,所述第二目标标题为包含所述目标物品词和所述第一关键词的标题;将所述第一概率与所述第二概率作比,以获取所述共现概率。
在本公开的一种示例性实施例中,所述根据所述目标关键词对的共现概率确定所述困惑度,其中所述目标关键词对由所述一级候选标题中任意两个相邻的目标关键词组成,包括:求取所述共现概率的几何平均数的倒数,并将所述倒数确定为所述困惑度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910338380.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种监听PDCCH的方法及装置
- 下一篇:控制方法及真空系统