[发明专利]一种标题生成方法、设备及计算机可读存储介质有效
申请号: | 202010222802.2 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111444707B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 康战辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/258 | 分类号: | G06F40/258;G06F40/30;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 刘晖铭;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 标题 生成 方法 设备 计算机 可读 存储 介质 | ||
1.一种标题生成方法,其特征在于,包括:
获取待生成标题的词条数据;其中,所述待生成标题的词条数据中包括至少一个子词条数据;其中,每个子词条数据都有其所属的类型;
从标题信息数据库中,针对所述待生成标题的词条数据提取到多个标题内容组合;其中,标题内容组合中包含有候选标题和所述候选标题所对应的信息内容;
对所述多个标题内容组合的信息内容进行解析,得到所述多个标题内容组合的信息内容所属的类型,从而得到与所述信息内容相对应的各个候选标题所属的标题类型;
利用所述标题类型和所述每个子词条数据的类型,对所述各个候选标题和所述每个子词条数据进行匹配,得到与所述每个子词条数据对应的一个或多个匹配候选标题;
利用所述一个或多个匹配候选标题组成所述每个子词条数据的标题集合;
针对所述每个子词条数据的标题集合中的每个匹配候选标题计算出搜索热门度,根据所述搜索热门度从所述每个子词条数据的标题集合中为所述每个子词条数据选择出标题,完成针对所述待生成标题的词条数据的标题生成;其中,所述搜索热门度表征了匹配候选标题与用户搜索习惯的贴合程度。
2.根据权利要求1所述的方法,其特征在于,所述利用所述标题类型和所述每个子词条数据的类型,对所述各个候选标题和所述每个子词条数据进行匹配,得到与所述每个子词条数据对应的一个或多个匹配候选标题,包括:
对所述每个子词条数据的类型和所述标题类型进行匹配,将与子词条数据的类型匹配上的标题类型作为匹配标题类型;
挑选出所述各个候选标题中属于所述匹配标题类型的候选标题,得到所述一个或多个匹配候选标题。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
将所述至少一个子词条数据中未分类的子词条数据的每个字符进行编码,得到字符编码结果;
针对所述字符编码结果进行语序特征挖掘,得到所述未分类的子词条数据的特征向量;
对所述特征向量进行分类,得到所述未分类的子词条数据的类型,从而得到所述每个子词条数据所属的类型。
4.根据权利要求1或2所述的方法,其特征在于,所述针对所述每个子词条数据的标题集合中的每个匹配候选标题计算出搜索热门度,根据所述搜索热门度从所述每个子词条数据的标题集合中为所述每个子词条数据选择出标题,包括:
获取所述每个子词条数据的标题集合中的每个匹配候选标题的热度计算参数;
利用所述热度计算参数,计算出所述每个子词条数据的标题集合中的每个匹配候选标题的所述搜索热门度;
从所述每个子词条数据的标题集合中,挑选出所述搜索热门度最大的匹配候选标题,作为所述每个子词条数据的所述标题。
5.根据权利要求4所述的方法,其特征在于,所述热度计算参数中至少包括候选标题的点击次数和候选标题的搜索次数;所述利用所述热度计算参数,计算出所述每个子词条数据的标题集合中的每个匹配候选标题的所述搜索热门度,包括:
利用所述点击次数和所述搜索次数构造出中间热度参数;
利用所述中间热度参数构造出所述每个子词条数据的标题集合中的每个匹配候选标题的搜索热门度。
6.根据权利要求1或2所述的方法,其特征在于,所述信息内容中具有用于说明所述信息内容的权威程度的权威标签;所述从标题信息数据库中,针对所述待生成标题的词条数据提取到多个标题内容组合,包括:
对所述待生成标题的词条数据进行主题提取,并将提取到的主题作为搜索关键字,在所述标题信息数据库中获取到包含所述搜索关键字的多个初始标题内容组合;
对所述多个初始标题内容组合中的信息内容进行标签读取,得到所述多个初始标题内容组合的权威标签;
对所述权威标签表征所述信息内容的权威程度高于或等于预设的权威程度阈值的初始标题内容组合进行筛选,得到所述多个标题内容组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010222802.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种现场双编打印装置及软件系统
- 下一篇:一种等截面椭圆流道旋塞阀