[发明专利]新闻分类方法、计算机可读存储介质在审
申请号: | 202010880325.9 | 申请日: | 2020-08-27 |
公开(公告)号: | CN112131384A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 章恒靖;刘琦;邱枫;乔正宇;郑维;徐鹏;朱得元;刘恒昌 | 申请(专利权)人: | 科航(苏州)信息科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/02;G06N3/08 |
代理公司: | 北京中誉威圣知识产权代理有限公司 11279 | 代理人: | 王小蓓 |
地址: | 215000 江苏省苏州市工业园*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种新闻分类方法以及计算机可读存储介质,其包括:获取原始数据,其中,所述原始数据包括新闻文本以及新闻类别;确定各个所述新闻类别下的新闻文本的总体数量;当某个所述新闻类别下的新闻文本的总体数量少于预设阈值,则对该新闻类别下的新闻文本进行数据增强处理从而使得处理后的该新闻类别下的新闻文本的总体数量不低于所述预设阈值;分别从每个所述新闻类别下的所有新闻文本中筛选出与所述预设阈值相同数量的新闻文本作为训练数据输入BERT模型中进行训练。该新闻分类方法以及计算机可读存储介质能够提高分类的准确度。 | ||
搜索关键词: | 新闻 分类 方法 计算机 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科航(苏州)信息科技有限公司,未经科航(苏州)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010880325.9/,转载请声明来源钻瓜专利网。