[发明专利]一种文本分类方法及装置有效
申请号: | 201710301466.9 | 申请日: | 2017-05-02 |
公开(公告)号: | CN107145560B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 姚海鹏;张博;张培颖;章扬;王露瑶;殷志强 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供了一种文本分类方法及装置,应用于计算机技术领域,所述方法包括:通过文本表示将待分类文本映射为向量空间模型VSM中的第一文本向量。根据预先建立的语义平滑矩阵将所述第一文本向量映射为高维空间中的第一映射向量,其中,所述语义平滑矩阵是通过对统计相似度矩阵和词语相似度矩阵进行计算得到。对所述第一映射向量进行分类,得到所述待分类文本的文本分类结果。本发明实施例通过将基于世界知识的词语相似度和基于统计的词语相似度应用于文本分类,提高了文本分类的准确性。 | ||
搜索关键词: | 一种 文本 分类 方法 装置 | ||
【主权项】:
一种文本分类方法,其特征在于,包括:通过文本表示将待分类文本映射为向量空间模型VSM中的第一文本向量;根据预先建立的语义平滑矩阵将所述第一文本向量映射为高维空间中的第一映射向量,其中,所述语义平滑矩阵是通过对统计相似度矩阵和词语相似度矩阵进行计算得到;对所述第一映射向量进行分类,得到所述待分类文本的文本分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710301466.9/,转载请声明来源钻瓜专利网。