[发明专利]介绍信息生成方法和装置有效

专利信息
申请号: 201910536679.9 申请日: 2019-06-20
公开(公告)号: CN110264315B 公开(公告)日: 2023-04-11
发明(设计)人: 卞东海;蒋帅;陈思姣;罗雨;陈奇石 申请(专利权)人: 北京百度网讯科技有限公司
主分类号: G06Q30/0601 分类号: G06Q30/0601
代理公司: 北京市铸成律师事务所 11313 代理人: 王一;武晨燕
地址: 100085 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 介绍 信息 生成 方法 装置
【权利要求书】:

1.一种介绍信息生成方法,其特征在于,包括:

根据目标对象的类型,获取介绍需求和介绍信息模板,所述介绍需求从至少一个维度反映所述目标对象的特征;

从所述目标对象的评论数据中获取与所述介绍需求相关的候选语句;

根据候选语句和所述介绍信息模板,生成所述目标对象的介绍信息,包括:

当每个介绍需求对应多个候选语句时,确定每个介绍需求在所述介绍信息模板中对应的位置;选取第一介绍需求对应的一个候选语句,并填入所述介绍信息模板的对应位置;选取第二介绍需求对应的一个候选语句,计算该候选语句与已生成的介绍信息的内容相似度,若相似度大于阈值,则计算所述第二介绍需求对应的另一个候选语句与已生成的介绍信息的内容相似度,直至填入的候选语句满足阈值要求;

其中,将候选语句填入所述介绍信息模板的对应位置通过以下方式实现:

将所述候选语句的部分内容添加到所述介绍信息模板的对应待填充位置、将所述介绍信息模板中的某一句整体替换为所述候选语句或将所述候选语句整体添加到所述介绍信息模板的对应待填充位置。

2.根据权利要求1所述的方法,其特征在于,还包括:

根据所述目标对象的类型,获取关键词表;

根据所述关键词表,从所述评论数据中获取初始推荐语句,所述初始推荐语句中包括所述关键词表中含有的关键词;

根据预设抽取规则,对所述初始推荐语句进行抽取,生成所述目标对象的推荐理由语句;

将所述目标对象的推荐理由语句加入所述目标对象的介绍信息中。

3.根据权利要求2所述的方法,其特征在于,根据预设抽取规则,对所述初始推荐语句进行抽取,生成所述目标对象的推荐理由语句,包括:

根据句式规则对所述初始推荐语句进行抽取,生成所述目标对象的推荐理由语句;或,

抽取所述初始推荐语句中的关键词,以及与所述关键词对应的主语和谓语,并将抽取出的关键词、主语和谓语重新组合,生成所述目标对象的推荐理由语句;或,

根据预设模型,抽取所述初始推荐语句中具有观点信息的句子。

4.根据权利要求1或2所述的方法,其特征在于,还包括:

获取所述目标对象的图片集;

根据图片集中各图片的图片描述信息和/或图片内容信息,获取多张候选图片;

根据图片质量,从所述多张候选图片中选取一张作为展示图;

将所述展示图加入所述目标对象的介绍信息中。

5.根据权利要求1或2所述的方法,其特征在于,还包括:

对所述评论数据进行预处理,得到数据优化的评论数据。

6.根据权利要求5所述的方法,其特征在于,对所述评论数据进行预处理,得到数据优化的评论数据,包括:

对所述评论数据中的各评论语句进行词频统计,获取词频大于阈值的第一词语;

从所述评论数据中筛选出具有第一词语的多个评论语句;

对所述具有第一词语的多个评论语句进行文本归一处理,得到所述数据优化的评论数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910536679.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top