[发明专利]线上服务实体的文案信息生成方法及装置有效
申请号: | 202010087233.5 | 申请日: | 2020-02-11 |
公开(公告)号: | CN111310445B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 殷晓明 | 申请(专利权)人: | 口碑(上海)信息技术有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06N3/08 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲 |
地址: | 200131 上海市浦东新区民生路11*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线上 服务 实体 文案 信息 生成 方法 装置 | ||
本发明公开了一种线上服务实体的文案信息生成方法及装置,该方法包括:采集待展示线上服务实体的多个预设维度的描述信息;从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词,根据查询结果构建所述待展示线上服务实体的描述向量;将所述描述向量输入至训练好的文案预测模型中,根据所述文案预测模型输出的文案向量生成所述待展示线上服务实体的文案信息。本发明方案,依据待展示线上服务对象的描述信息构建描述向量,并生成该待展示服务对象的文案信息,进而可以快速、准确的生成文案信息并进行展示。
技术领域
本发明涉及互联网技术领域,具体涉及一种线上服务实体的文案信息生成方法及装置。
背景技术
近年来,随着互联网技术的发展,依赖线上平台满足日常的需求已越来越普遍,例如,利用购物平台进行购物,利用本地生活应用完成点餐、预约服务等等。与此同时,这些平台通过为平台上的实体赋予相应的标签,来区分不同实体的实体特征。
在现有技术中,通常是选取某一维度的特征来作为实体的标签,例如,选取用户评价特征作为店铺的标签,这种方式能够从一定程度上区别不同实体的实体特征,但是该标签过于单一,尤其是针对一些特征维度较多的实体,根本无法全面的体现该实体的特征。
发明内容
鉴于上述问题,提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的线上服务实体的文案信息生成方法及装置。
根据本发明实施例的一个方面,提供了一种线上服务实体的文案信息生成方法,包括:
采集待展示线上服务实体的多个预设维度的描述信息;
从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词,根据查询结果构建所述待展示线上服务实体的描述向量;
将所述描述向量输入至训练好的文案预测模型中,根据所述文案预测模型输出的文案向量生成所述待展示线上服务实体的文案信息。
可选的,所述词典通过如下步骤建立:
采集多个线上服务实体的多个预设维度的描述信息;
统计所述多个线上服务实体的多个预设维度的描述信息中包含的多个词语及其词频;
按照多个词语的词频由高至低的顺序对多个词语进行排序,根据排序结果建立包含多个词语及其排序编号的词典。
可选的,所述在建立的词典中查询所述关键分词,根据查询结果构建所述线上服务实体的描述向量进一步包括:
在所述词典中查询所述关键分词,根据词典中所述关键分词的排序编号构建所述线上服务实体的描述向量。
可选的,所述多个预设维度包括评价信息维度,所述方法还包括:
采集多个线上服务实体的评价信息维度的描述信息,对所述多个线上服务实体的评价信息维度的描述信息进行分词处理;对得到的多个分词中的停顿词进行过滤处理,根据过滤结果确定多个评价分词;
统计多个评价分词在所述多个线上服务实体的评价信息维度的描述信息中的出现频率;
根据出现频率由高至低的顺序从所述多个评价分词中选出预设数量的候选分词并构成评价热词候选集;
所述从各个维度的描述信息中提取关键分词进一步包括:
从待展示线上服务实体的评价信息维度的描述信息中拆分出多个待选评价分词,将所述多个待选评价分词与评价热词候选集中的候选分词进行匹配,根据匹配结果从多个待选评价分词中筛选出关键分词。
可选的,所述多个预设维度包括入驻店铺信息维度;
所述采集待展示线上服务实体的多个预设维度的描述信息进一步包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口碑(上海)信息技术有限公司,未经口碑(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087233.5/2.html,转载请声明来源钻瓜专利网。