[发明专利]无监督文本分类系统及方法在审
申请号: | 201911150769.0 | 申请日: | 2019-11-21 |
公开(公告)号: | CN110889443A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 张发展;刘世林;罗镇权;李焕 | 申请(专利权)人: | 成都数联铭品科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/30 |
代理公司: | 北京市领专知识产权代理有限公司 11590 | 代理人: | 林辉轮;张玲 |
地址: | 610015 四川省成都市自由贸易试验区*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种无监督文本分类方法及系统,该方法包括步骤:针对于每个分类标签,设置种子关键词;采用预训练的词向量对种子关键词进行语义相似词扩充,得到扩充关键词;将种子关键词和扩充关键词编码为词向量;将待分类文本转换为文本向量;基于所述词向量,对所述文本向量进行分类。本发明方法及系统,对文本进行分类时,无需进行人工标注,进而可以降低人工标注的成本,以及加快文本分类的效率。 | ||
搜索关键词: | 监督 文本 分类 系统 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联铭品科技有限公司,未经成都数联铭品科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911150769.0/,转载请声明来源钻瓜专利网。