[发明专利]基于神经网络的文本特征判断方法、装置和存储介质有效
申请号: | 201911185402.2 | 申请日: | 2019-11-27 |
公开(公告)号: | CN110895557B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 邓立邦 | 申请(专利权)人: | 广东智媒云图科技股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/04 |
代理公司: | 北京泽方誉航专利代理事务所(普通合伙) 11884 | 代理人: | 陈照辉 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 文本 特征 判断 方法 装置 存储 介质 | ||
本发明实施例公开了一种基于神经网络的文本特征判断方法、装置和存储介质,该方法包括为标识字符分配标识信息,生成字符标识关联数据,所述标识字符包括汉字字符、标点字符、数字字符和英文字符中的至少一种;获取文本训练集,所述文本集包括多个训练文本以及每个训练文本对应的训练文本特征,每个所述训练文本由一个或多个所述标识字符组成;根据所述字符标识关联数据生成每个所述训练文本对应的曲线坐标图;将所述曲线坐标图作为输入,对应的训练文本特征作为输出,利用神经网络进行训练得到文本特征判断模板;获取待识别文本,根据所述文本特征判断模板对所述待识别文本进行判断确定文本特征。本方案实现了对文本内容的深度分析,得出的文本特征精准度高,同时提高了判断效率。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种基于神经网络的文本特征判断方法、装置和存储介质。
背景技术
随着社交网络、电子商务、移动互联网等技术的发展,博客、论坛以及社会服务网络如大众点评上产生了大量的用户参与的,对于诸如人物、事件、产品等有价值的带有情绪色彩的文本评论数据信息,这些文本评论数据信息迅速膨胀,无不表达了人们的各种情感色彩和情感倾向性,如喜、怒、哀、乐和批评、赞扬等。对此类文本评论数据信息进行充分挖掘和深入分析,可以更好地理解网民的观点和立场,以便更好的辅助舆情管控、商业决策、观点搜索、信息预测、情绪管理等各个领域的决策。
现有技术中,在对文本进行处理以判断文本特征(如文本所代表的情绪特征)时,精准度较低,判断效果以及判断效率较差。
发明内容
本发明实施例提供了一种基于神经网络的文本特征判断方法、装置、设备和存储介质,提高了文本特征判断结果的准确度,处理效率高,处理效果良好,实现了对文本的深入挖掘和分析。
第一方面,本发明实施例提供了一种基于神经网络的文本特征判断方法,该方法包括:
为标识字符分配标识信息,生成字符标识关联数据,所述标识字符包括汉字字符、标点字符、数字字符和英文字符中的至少一种;
获取文本训练集,所述文本集包括多个训练文本以及每个训练文本对应的训练文本特征,每个所述训练文本由一个或多个所述标识字符组成;
根据所述字符标识关联数据生成每个所述训练文本对应的曲线坐标图;
将所述曲线坐标图作为输入,对应的训练文本特征作为输出,利用神经网络进行训练得到文本特征判断模板;
获取待识别文本,根据所述文本特征判断模板对所述待识别文本进行判断确定文本特征。
第二方面,本发明实施例还提供了一种基于神经网络的文本特征判断装置,该装置包括:
数据生成模块,用于为标识字符分配标识信息,生成字符标识关联数据,所述标识字符包括汉字字符、标点字符、数字字符和英文字符中的至少一种;
训练集获取模块,用于获取文本训练集,所述文本集包括多个训练文本以及每个训练文本对应的训练文本特征,每个所述训练文本由一个或多个所述标识字符组成;
坐标图生成模块,用于根据所述字符标识关联数据生成每个所述训练文本对应的曲线坐标图;
模板生成模块,用于将所述曲线坐标图作为输入,对应的训练文本特征作为输出,利用神经网络进行训练得到文本特征判断模板;
文本特征确定模块,用于获取待识别文本,根据所述文本特征判断模板对所述待识别文本进行判断确定文本特征。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东智媒云图科技股份有限公司,未经广东智媒云图科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911185402.2/2.html,转载请声明来源钻瓜专利网。