[发明专利]一种半监督学习的小样本文本分类方法和系统在审
申请号: | 202111503834.0 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114036947A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 张伟文;翁茂彬;叶海明 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 禹小明 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种半监督学习的小样本文本分类方法和系统,涉及半监督文本分类领域,包括步骤:S1、获取待分类文本;S2、将待分类文本输入预先训练完成的查找表,查找表将待分类文本映射为文本表征;S3、将文本表征输入多层感知器得到文本标签,文本标签作为文本分类结果。本发明通过查找表获取待分类文本的文本表征,之后多层感知器根据文本表征得到文本标签作为文本分类结果,针对数据量小、数据标签不全的文本数据进行文本分类的情况也能取得较好的分类效果,不需要对大量的文本数据进行人工标注,节约人工标记成本,能够在各类数据数量和数据标签标注情况的不同场景下灵活应用。 | ||
搜索关键词: | 一种 监督 学习 样本 文本 分类 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111503834.0/,转载请声明来源钻瓜专利网。