[发明专利]基于字符级神经网络与SVM的交通事故文本分类方法和系统在审
申请号: | 201910334271.3 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110110085A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 刘彦斌;智伟;温熙华;程元晖;李志伟;陈鹏飞;孙炯炯 | 申请(专利权)人: | 中电海康集团有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨天娇 |
地址: | 311121 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请公开了一种基于字符级神经网络与SVM的交通事故文本分类方法和系统,方法包括获取事故原因语料,得到训练集和测试集,并构建字典;建立字符级神经网络模型,利用训练集得到优化后的字符级神经网络模型,并提取训练集中的事故文本特征,并利用提取的事故文本特征得到优化后的SVM模型;利用测试集测试优化后的字符级神经网络模型和优化后的SVM模型;将获取的待分类的事故原因拆解为字符,通过字典将拆解得到的字符映射为多维矩阵,并将多维矩阵输入至优化后的字符级神经网络模型中提取事故文本特征,最优的SVM模型通过该事故文本特征得到事故文本分类结果。本申请不受语言限制,且可避免预训练的开销,同时避免了SVM模型在特征选取上的盲目性。 | ||
搜索关键词: | 神经网络模型 文本特征 文本分类 优化 多维矩阵 神经网络 事故原因 测试集 训练集 拆解 字典 交通事故 特征选取 语言限制 构建 映射 语料 申请 测试 分类 | ||
【主权项】:
1.一种基于字符级神经网络与SVM的交通事故文本分类方法,其特征在于,所述基于字符级神经网络与SVM的交通事故文本分类方法,包括以下步骤:获取事故原因语料,划分得到训练集和测试集,并将所述事故原因语料拆解为字符,构建字典;建立字符级神经网络模型,利用所述训练集优化所述字符级神经网络模型,利用优化后的字符级神经网络模型提取训练集中数据的事故文本特征,并利用提取的事故文本特征训练SVM模型,直至得到优化后的SVM模型;利用优化后的字符级神经网络模型提取所述测试集中数据的事故文本特征,并将该事故文本特征输入优化后的SVM模型,若判断所述SVM模型输出的分类结果误差小于预设值,则得到最优的SVM模型;否则继续利用训练集优化SVM模型;将获取的待分类的事故原因拆解为字符,通过所述字典将拆解得到的字符映射为多维矩阵,并将所述多维矩阵输入至优化后的字符级神经网络模型中提取事故文本特征,最优的SVM模型通过该事故文本特征得到事故文本分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电海康集团有限公司,未经中电海康集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910334271.3/,转载请声明来源钻瓜专利网。