[发明专利]一种用于中文文本定级以及计算中文文本难度评分的方法有效
申请号: | 201711309105.5 | 申请日: | 2017-12-11 |
公开(公告)号: | CN107977362B | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 郑子彬;林星彤 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F16/35;G06K9/62 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510275 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种用于中文文本定级以及计算中文文本难度评分的方法,进行首先文本获取及等级标注,获取具有分类标签的作为训练集的文章,然后进行特征提取,获取每篇文章所对应的全部语言学特征的特征值;再之,进行模型的建立与检验,得出预测准确率达到预期的模型,最后采用得到的模型预测文本难度。本发明适用于各种需要评价文本易读性的场景之中,采用的支持向量回归算法模型通过提高特征的维度空间来达到更好的评分效果,优于传统的线性模型。 | ||
搜索关键词: | 一种 用于 中文 文本 定级 以及 计算 难度 评分 方法 | ||
【主权项】:
一种用于中文文本定级以及计算中文文本难度评分的方法,其特征在于:包括以下步骤:S1、文本获取及等级标注,获取具有分类标签的作为训练集的文章;S2、特征提取,获取每篇文章所对应的全部语言学特征的特征值;S3、模型的建立与检验,得出预测准确率达到预期的模型;S4、采用步骤S3得到的模型预测文本难度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711309105.5/,转载请声明来源钻瓜专利网。