[发明专利]文本分类方法、装置及设备有效
申请号: | 202010690569.0 | 申请日: | 2020-07-17 |
公开(公告)号: | CN111737473B | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 王君吉;张朝胜;徐琪 | 申请(专利权)人: | 浙江口碑网络技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/295;G06N3/08 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 设备 | ||
本申请公开了一种文本分类方法、装置及设备,涉及文本分类技术领域,使得网络平台能够准确对餐品描述信息所形成的文本进行分类,提高文本分类效果。其中方法包括:获取对餐品描述信息进行处理后所形成的文本特征;将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,所述文本分类模型用于预测文本特征在各个类目上的概率值,所述分类结果为预测得到概率值最高时对应文本特征的类目;通过统计所述文本特征映射的多个分类结果中类目的占比值,将占比值最高的类目确定为所述文本特征映射的最终分类结果。
技术领域
本申请涉及文本分类技术领域,尤其是涉及到一种文本分类方法、装置及设备。
背景技术
随着互联网技术的不断发展,网络往早已成为现代人生活不可或缺的部分,网上订餐由于其独有的便捷性和直观性而受到用户的欢迎。为了便于用户浏览,网络平台端会对线上实体对象提供的餐品描述信息进行分类整理,并将分类整理后的餐品描述信息投放至网络平台,进而在网络平台中展示餐品描述信息,以供用户选取。
通常情况下,网络平台在对线上实体对象提供的餐品描述信息进行分类整理的过程可以转行为对餐品描述信息中文本进行分类的过程,具体可以通过使用深度学习的分类算法来对餐品描述信息形成的文本进行分类,从而判断出餐品对象所属的类目。然而,针对同一个餐品对象,由于线上实体对象所经营的类型不同,该餐品对象在不同线上实体对象所属的类目不同,例如,针对餐品“金针菇”而言,在烧烤实体对象中所属类目“烧烤菌菇类”为,而在炒菜实体对象中所属的类目为“菜品热菜”,另外还有对于实体对象为了吸引用户自命名的餐品,对于上述餐品对象类目划分模糊以及文本命名规则不规范的餐品描述信息,仅通过餐品描述信息形成的文本可能很难去判别餐品对象所属的类目,使得网络平台无法准确对餐品描述信息所形成的文本信息进行分类,导致文本分类效果不理想。
发明内容
有鉴于此,本申请提供了一种文本分类方法、装置及设备,主要目的在于解决现有技术中网络平台无法准确对餐品描述信息所形成的文本进行分类,导致文本分类效果不理想的问题。
根据本申请的第一个方面,提供了一种文本分类方法,该方法包括:
获取对餐品描述信息进行处理后所形成的文本特征;
将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,所述文本分类模型用于预测文本特征在各个类目上的概率值,所述分类结果为预测得到概率值最高时对应文本特征的类目;
通过统计所述文本特征映射的多个分类结果中类目的占比值,将占比值最高的类目确定为所述文本特征映射的最终分类结果。
在本发明另一实施例中,所述具有不同网络分类结果的文本分类模型中包括具有深度神经网络结构的第一分类模型、具有浅层网络结构的第二分类模型、具有卷积神经网络结构的第三分类模型,所述将所述文本特征分别输入至预先训练具有不同网络结构的文本分类模型中进行预测,得到文本特征映射的多个分类结果,具体包括:
将所述文本特征输入至第一分类模型中进行预测,得到文本特征映射的第一分类结果;
将所述文本特征输入至第二分类模型中进行预测,得到文本特征映射的第二分类结果;
将所述文本特征输入至第三分类模型中进行预测,得到文本特征映射的第三分类结果。
在本发明另一实施例中,所述第一分类模型包括用于对文本特征中不同的描述特征进行预测的分类子模型,所述将所述文本特征输入至第一分类模型中进行预测,得到文本特征映射的第一分类结果,具体包括:
通过分析所述文本特征描述对象的维度信息,将所述文本特征划分为不同的描述特征;
确定所述不同的描述特征在第一分类模型所映射的分类子模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江口碑网络技术有限公司,未经浙江口碑网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010690569.0/2.html,转载请声明来源钻瓜专利网。