[发明专利]基于网络新闻的时评类作文素材语料库的构建方法及系统在审
申请号: | 202110759991.1 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113704464A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 赵小兵;李璐萍 | 申请(专利权)人: | 中央民族大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04 |
代理公司: | 北京久诚知识产权代理事务所(特殊普通合伙) 11542 | 代理人: | 翟丽红 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于网络新闻的时评类作文素材语料库的构建方法及系统,涉及自然语言处理技术领域。本技术方案对原始网络语料数据先后进行清洗、预处理,以及向量化、特征提取等处理,然后利用K‑Means++策略优化算法和单边增量聚类的方法对传统K均值聚类算法进行改进,再利用改进后的K均值聚类算法对目标文本进行聚类,从而可以实现运用一个概率公式来选取K个聚类中心,通过事先设定相似度比较阈值,快速判断新增文本的主题类别,然后再根据主题类别提取主题词构建语文时评类作文写作素材语料库。本技术方案提高了构建时评类作文写作素材语料库的效率和准确率。 | ||
搜索关键词: | 基于 网络新闻 时评 作文 素材 语料库 构建 方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中央民族大学,未经中央民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110759991.1/,转载请声明来源钻瓜专利网。
- 上一篇:防变形制动式卡钳总成
- 下一篇:耐高糖和低pH的酵母菌及其应用