[发明专利]线下文本挖掘方法、装置及计算机可读存储介质在审

专利信息
申请号: 201811267498.2 申请日: 2018-10-29
公开(公告)号: CN109446239A 公开(公告)日: 2019-03-08
发明(设计)人: 梅琳 申请(专利权)人: 上海玖悦数码科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06Q30/02
代理公司: 上海晨皓知识产权代理事务所(普通合伙) 31260 代理人: 成丽杰
地址: 200441 上海市宝山*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 关键词库 文本挖掘 计算机可读存储介质 预设 音信息 实体店铺 文本信息 信息处理技术 评价信息 商品属性 语音信息 顾客 匹配 判定
【说明书】:

发明实施例涉及信息处理技术领域,公开了一种线下文本挖掘方法、装置及计算机可读存储介质。所述线下文本挖掘方法包括:获取实体店铺内顾客的语音信息,所述语音信息中至少包括所述顾客对商品的评价信息;根据所述语音信息获取与所述语音信息对应的文本信息;提取所述文本信息中用于表征所述商品属性的关键词;将所述关键词与预设关键词库匹配,判断所述关键词是否存在于所述商品的预设关键词库中,在判定所述关键词不在所述预设关键词库中时,将所述关键词加入所述预设关键词库中。本发明提供的线下文本挖掘方法、装置及计算机可读存储介质能够完善实体店铺商品的关键词库,改善关键词来源单一而导致的关键词库不完善的问题。

技术领域

本发明实施例涉及信息处理技术领域,特别涉及一种线下文本挖掘方法、装置及计算机可读存储介质。

背景技术

在现实世界中,可获取的大部分信息是以文本形式存储在文本数据库中的,由来自各种数据源的大量文档组成,如新闻文档、研究论文、书籍、数字图书馆、电子邮件和Web页面。由于电子形式的文本信息飞速增涨,文本挖掘已经成为信息领域的研究热点。文本挖掘是指从大量文本数据中抽取事先未知的、可理解的、最终可用的知识的过程,同时运用这些知识更好地组织信息以便将来参考。文本挖掘的主要用途是从原本未经处理的文本中提取出未知的知识,但是文本挖掘也是一项非常困难的工作,因为它必须处理那些本来就模糊而且非结构化的文本数据,所以它是一个多学科混杂领域,涵盖了信息技术、文本分析、模式识别、统计学、数据可视化、数据库技术、机器学习以及数据挖掘等技术。文本挖掘是从数据挖掘发展而来,因此其定义与我们熟知的数据挖掘定义相类似,但与传统的数据挖掘相比,文本挖掘有其独特之处,主要表现在:文档本身是半结构化或非结构化的,无确定形式并且缺乏机器可理解的语义;而数据挖掘的对象以数据库中的结构化数据为主,并利用关系表等存储结构来发现知识。因此,有些数据挖掘技术并不适用于文本挖掘,即使可用,也需要建立在对文本集预处理的基础之上。在现有技术中,零售行业关键词的来源比较散乱,一般是通过线上的技术从各大电商网站中将与零售行业贩卖的商品有关的关键词提炼规整出来。

发明人发现现有技术中至少存在如下问题:通过线上的技术来提炼商品的关键词,使得获取关键词的来源单一,无法通过其他途径获取该商品的新关键词,导致实体店铺商品的关键词库不完善。

发明内容

本发明实施方式的目的在于提供一种,其能够完善实体店铺商品的关键词库,改善关键词来源单一而导致的关键词库不完善的问题。

为解决上述技术问题,本发明的实施方式提供了一种线下文本挖掘方法,包括:获取实体店铺内顾客的语音信息,所述语音信息中至少包括所述顾客对商品的评价信息;根据所述语音信息获取与所述语音信息对应的文本信息;提取所述文本信息中用于表征所述商品属性的关键词;将所述关键词与预设关键词库匹配,判断所述关键词是否存在于所述商品的预设关键词库中,在判定所述关键词不在所述预设关键词库中时,将所述关键词加入所述预设关键词库中。

本发明还提供了一种线下文本挖掘装置,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的线下文本挖掘方法。

本发明还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的线下文本挖掘方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海玖悦数码科技有限公司,未经上海玖悦数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811267498.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top