[发明专利]线上服务实体的文案信息生成方法及装置有效
申请号: | 202010087233.5 | 申请日: | 2020-02-11 |
公开(公告)号: | CN111310445B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 殷晓明 | 申请(专利权)人: | 口碑(上海)信息技术有限公司 |
主分类号: | G06F40/242 | 分类号: | G06F40/242;G06F40/289;G06N3/08 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲 |
地址: | 200131 上海市浦东新区民生路11*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 线上 服务 实体 文案 信息 生成 方法 装置 | ||
1.一种线上服务实体的文案信息生成方法,包括:
采集待展示线上服务实体的多个预设维度的描述信息;
从各个维度的描述信息中提取关键分词,在建立的词典中查询所述关键分词对应的词语,将所述词典中所述关键分词对应的词语的排序编号按照预设维度的顺序依次作为描述向量中各个元素的元素值,构建所述待展示线上服务实体的描述向量;词典用于在词语和排序编号之间进行转化;
将所述描述向量输入至训练好的文案预测模型中,得到文案向量,所述文案向量中的每个元素代表组成文案信息的一个分词;在词典的排序编号中查询所述文案向量中每个元素的元素值,确定与元素值对应的词语作为分词,生成所述待展示线上服务实体的文案信息;
其中,所述词典通过如下步骤建立:
采集多个线上服务实体的多个预设维度的描述信息;
统计所述多个线上服务实体的多个预设维度的描述信息中包含的多个词语及其词频;
按照多个词语的词频由高至低的顺序对多个词语进行排序,根据排序结果建立包含多个词语及其排序编号的词典。
2.根据权利要求1所述的方法,其中,所述多个预设维度包括评价信息维度,所述方法还包括:
采集多个线上服务实体的评价信息维度的描述信息,对所述多个线上服务实体的评价信息维度的描述信息进行分词处理;对得到的多个分词中的停顿词进行过滤处理,根据过滤结果确定多个评价分词;
统计多个评价分词在所述多个线上服务实体的评价信息维度的描述信息中的出现频率;
根据出现频率由高至低的顺序从所述多个评价分词中选出预设数量的候选分词并构成评价热词候选集;
所述从各个维度的描述信息中提取关键分词进一步包括:
从待展示线上服务实体的评价信息维度的描述信息中拆分出多个待选评价分词,将所述多个待选评价分词与评价热词候选集中的候选分词进行匹配,根据匹配结果从多个待选评价分词中筛选出关键分词。
3.根据权利要求1所述的方法,其中,所述多个预设维度包括入驻店铺信息维度;
所述采集待展示线上服务实体的多个预设维度的描述信息进一步包括:
将所述待展示线上服务实体的入驻店铺与品牌店铺库进行匹配,若所述入驻店铺包含在品牌店铺库中,则采集所述入驻店铺的品牌信息;若所述入驻店铺不包含在品牌店铺库中,则采集所述入驻店铺的标识信息和地理位置信息。
4.根据权利要求1所述的方法,其中,所述多个预设维度包括实体属性信息维度;
所述采集待展示线上服务实体的多个预设维度的描述信息进一步包括:
采集待展示线上服务实体的从业时间信息、培训进修信息、角色信息和/或证书信息。
5.根据权利要求1所述的方法,其中,所述多个预设维度还包括活动信息维度。
6.根据权利要求1-5任一项所述的方法,其中,所述文案预测模型通过以下步骤训练得到:
确定多个线上服务实体样本;获取每个线上服务实体样本的多个预设维度的描述信息样本,从各个维度的描述信息样本中提取关键分词样本,在建立的词典中查询所述关键分词样本对应的词语,根据查询结果构建所述线上服务实体样本的描述向量样本,将所述描述向量样本作为训练输入数据;
对每个线上服务实体样本的已配置文案信息进行分词处理,得到多个文案分词样本,在建立的词典中查询所述多个文案分词样本对应的词语,根据查询结果构建所述线上服务实体样本的文案向量样本,将所述文案向量样本作为训练输出数据;
利用所述训练输入数据和训练输出数据对神经网络模型进行训练,根据训练结果得到文案预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口碑(上海)信息技术有限公司,未经口碑(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010087233.5/1.html,转载请声明来源钻瓜专利网。