[发明专利]一种面向自动驾驶汽车的用户满意度评价方法在审
申请号: | 202011292373.2 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112395484A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 郭伟;赵兰兰 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/33;G06F16/78 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 自动 驾驶 汽车 用户 满意 评价 方法 | ||
1.一种面向自动驾驶汽车的用户满意度评价方法,包括以下步骤:
(1)使用爬虫技术抓取短视频类关于自动辅助驾驶汽车平台的用户评论数据。
(2)数据存储
第1步:将抓取的数据以“平台-车型-评论”的树形结构存入本地数据库中;
第2步:对抓取的数据进行初次有效筛取,其中,对于某项评论,若此项评论中有产品属性词或情感属性词,则判断该评论为有效文本评论,提取有效文本评论,存入数据库中;
(3)数据处理,方法如下:
第1步:建立车型命名映射表:将不同中同一车平台中不同车型的不同名称相互映射,统一命名;
第2步:建立汽车属性命名映射表:将不同汽车短视频类关于自动辅助驾驶汽车平台的中的汽车属性名称相互映射,统一命名;
第3步:删除用户发表的重复评论、无效评论,并删除数据项不完善的评论;
其中,数据项不完善的评论根据实际需要进行确定;
第4步:构建汽车领域关键词库、停用词库、情感词库以及同义词词库,其中,
第5步:分词、词性标注及去停用词处理,保留与汽车领域相关的名词、名词词组、形容词、副词;
(4)指标体系建立
利用TF-IDF算法,依据用户在汽车短视频类关于自动辅助驾驶汽车平台的发表评论时的评价项目,以及综合汽车拥有者在日常驾驶过程中关注的汽车行驶属性,基于数据处理提取特征指标,建立结果评价指标体系,根据评价体系构建评论的指标特征向量,并结合情感分析得分,综合评论的所属平台、文本内容,得到自动驾驶汽车产品信息的特征属性的情感倾向结果;
结果评价指标体系共两级,一级指标为综合分析结果H,二级指标为汽车的相关属性,分别为:外观、内饰、动力、操控、舒适性、续航、安全、辅助,汽车的相关属性词由文本特征提取来确定;
(5)满意度评估,方法如下:
1)情感值确定:基于情感词库,计算获取的特征词情感得分,并计算正向情感的概率qNi,取值区间为[0,1];将qNi转换为用户情感值QNi,取值范围[-1,1],QNi数值越大,表示情感越积极,用户满意度越高;
2)情感值均值:计算描述第N个产品属性中第i个评论的情感值均值PN,tN为描述第N个产品属性评论的个数;
3)用户对产品属性的关注度:tN表示个产品属性的评论个数,n表示总的有用评论数量;TN表示用户关注的,TN值越大,说明用户关注度越高;
4)对产品属性的总的评价度H:
H表示基于用户的特征词的产品属性的总的评价度。
2.根据权利要求1所述的方法,其特征在于,步骤(2)中,抓取的数据具体为:
短视频类关于自动辅助驾驶汽车平台的数据,包括:平台的名称、短视频类关于自动辅助驾驶汽车平台中发帖用户数量以及短视频类关于自动辅助驾驶汽车平台的中包含的车型数量;
车型数据,包括:短视频类关于自动辅助驾驶汽车平台的内包括的车型类别、车型品牌、以及车型价格区间;
评论数据,包括:用户针对不同汽车行驶场景属性和功能属性的评论、评论的时间;
初次抓取后,每个月对上述若干个数据项进行增量抓取,确保数据的稳定增长和时间上的连续性。
3.根据权利要求1所述的方法,其特征在于,步骤(3)的第4步中,
汽车领域关键词库:以汽车本体结构词汇及产品规格说明书为基础,融合多款中文输入法中的汽车领域词库,辅以人工补充汽车领域的简写词汇、新兴词汇以及与汽车自动驾驶相关属性的相关附属词汇,构建汽车领域关键词库;
停用词库:将与汽车属性及评价相关的停用词从停用词表中删除,将与汽车属性及评价无关的词汇添加至停用词表;
情感词库:将形容、描述汽车属性的带有情感倾向的形容词及副词添加入情感词,能够更加准确的把握用户描述的汽车属性的情感倾向。
4.根据权利要求1所述的方法,其特征在于,步骤(5)中,计算获取的特征词情感得分的方法如下:
1)读取评论数据,对评论进行分句;
2)查找对分句的情感词,记录积极还是消极,以及位置;
3)往情感词前查找程度词,找到就停止搜寻;为程度词设权值,乘以情感值;
4)往情感词前查找否定词,找完全部否定词,若数量为奇数,乘以-1,若为偶数,乘以1;
5)判断分句结尾是否有感叹号,有叹号则往前寻找情感词,有则相应的情感值+2;
6)计算完一条评论所有分句的情感值,用数组(1ist)记录起来;
7)计算并记录所有评论的情感值;
8)通过分句计算每条评论的积极情感均值,消极情感均值,积极情感方差,消极情感方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011292373.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:EGR单向阀和EGR系统
- 下一篇:一种燃料喷射加电时间修正方法和装置