[发明专利]汽车消费者调研问卷语言的优化方法在审
申请号: | 202010667389.0 | 申请日: | 2020-07-16 |
公开(公告)号: | CN111931497A | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 杨靖;顾洪建;张帆;李斌 | 申请(专利权)人: | 中国汽车技术研究中心有限公司;中汽研(天津)汽车信息咨询有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F16/35;G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300300 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汽车 消费者 调研 问卷 语言 优化 方法 | ||
本发明涉及一种汽车消费者调研问卷语言的优化方法。所述优化方法包括以下步骤:S1、获取汽车行业口碑评论数据;S2、采用jieba分词库和pyhanlp分词库对口碑评论数据进行分词,得到第一分词词库;S3、剔除第一分词词库中的无意义词和停用词,得到第二分词词库;S4、对第二分词词库中的词语与二级技术指标进行语义相似度计算;S5、根据语义相似度大小,对词语进行聚类分组,形成映射表;S6、利用统计方法统计每个车型所有口碑评论中每一个二级指标下所有关键字的权重大小;S7、按照权重大小对问卷语言进行优化。该方法能够对问卷语言进行有效优化,可使得提问用语更易于理解,从而能更准确、高效的对车型进行评价。
技术领域
本发明涉及数据处理领域,具体而言,涉及一种汽车消费者调研问卷语言的优化方法。
背景技术
目前在激烈的竞争环境中,急切需要准确了解市场和用户的需求,在消费者调研过程中,调研问卷的设计对于调研结果有直接影响,能否保证用户准确的理解提问的问题是关键所在,目前整个行业在问卷的设计语言研究方面存在着提问用语过于专业化的现象,导致用户不能理解或者理解存在偏差,所以企业对调研问卷语言的优化有着强烈的需求。
另一方面,随着NLP(自然语言处理)技术的应用成熟,本课题随即引入NLP技术,结合汽车行业的一级技术指标思维,重新统计用户口碑关注的指标以及关注度,旨在深入了解汽车消费者的语言特点,进而优化当前用户调研的问卷语言,从而更准确、更高效的对车型进行评价,帮助企业了解自身优劣势,以及与用户需求之间的差异,这对于企业改进现有产品以及企划开发新车型具有重要推动作用。
有鉴于此,特提出本发明。
发明内容
本发明的目的在于提供一种汽车消费者调研问卷语言的优化方法,该方法能够对问卷语言进行有效优化,可使得提问用语更易于理解,从而能更准确、高效的对车型进行评价。
为了实现本发明的上述目的,特采用以下技术方案:
根据本发明的一个方面,提供了一种汽车消费者调研问卷语言的优化方法,包括以下步骤:
S1、获取汽车行业口碑评论数据;
S2、分别采用jieba分词库和pyhanlp分词库对所述口碑评论数据进行分词,得到两个分词结果,对比两个分词结果,结合计算机校对和验证,得到第一分词词库;
S3、剔除第一分词词库中的无意义词和停用词,得到第二分词词库;
S4、对第二分词词库中的词语与汽车行业的二级技术指标进行语义相似度计算;
S5、根据各个词语与所述二级技术指标的语义相似度大小,对词语进行聚类分组,词语作为每个指标的关键字,形成树形结构的映射表;
S6、利用统计方法统计每个车型所有口碑评论中每一个二级指标下所有关键字的权重大小;
S7、按照所述权重大小对问卷语言进行优化。
需要说明的是:
S3中无意义词或停用词包括但不限于:很、也、呀、啊等。
S4中二级技术指标包括但不限于:外观、内饰、动力等。
S5中聚类分组的聚类标签为相应的二级技术指标。
在一种优选的实施方式中,S1中,获取汽车行业口碑评论数据后,把口碑评论数据导入到数据库中。将数据导入到数据库中,可方便输入输出数据,便利、节省时间和成本。
作为进一步优选的技术方案,利用python语言将口碑评论数据导入到musql数据库中。
作为进一步优选的技术方案,S3中,采用正则表达式剔除无意义词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国汽车技术研究中心有限公司;中汽研(天津)汽车信息咨询有限公司,未经中国汽车技术研究中心有限公司;中汽研(天津)汽车信息咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010667389.0/2.html,转载请声明来源钻瓜专利网。