[发明专利]一种评估文本难度的方法有效
申请号: | 201510467535.4 | 申请日: | 2015-07-31 |
公开(公告)号: | CN105068993B | 公开(公告)日: | 2018-08-07 |
发明(设计)人: | 范舟;白彬;袁敦龙;钱登胜;余夏婷;陈遥 | 申请(专利权)人: | 成都思戴科科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 杨军 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评估 文本 难度 方法 | ||
1.一种评估文本难度的方法,其特征在于,包括如下步骤:
S101.读取待测评内容;
S102.通过数学统计的方式获取所述待测评内容的文字难度系数、词语难度系数、句子难度系数和段落难度系数中的任意一种或它们的任意组合,其中,按照如下步骤S501~S504获取所述待测评内容的段落难度系数:
S501.获取所述待测评内容中出现的各个段落;
S502.以词汇量为度量标尺确定各个段落的段落长度;
S503.按照如下公式计算各个段落的段落难度等级:
式中,PDi为第i个段落的段落难度等级,PXMax为最高段落难度等级,PXMin为最低段落难度等级,K为不小于20的第一数值,PTi为第i个段落的词汇量;
S504.对多个段落的所述段落难度等级进行算术平均计算,最终得到所述待测评内容的段落难度系数PD;
S103.将获取的段落难度系数作为所述待测评内容的文本难度评估值,或者将获取的文字难度系数、词语难度系数和句子难度系数中的三者之一或者任意组合与段落难度系数的算术平均结果作为所述待测评内容的文本难度评估值。
2.如权利要求1所述的一种评估文本难度的方法,其特征在于,在所述通过数学统计的方式获取所述待测评内容的文字难度系数的步骤中还包括如下步骤:
S201.获取所述待测评内容中出现的各个文字;
S202.统计各个文字在所述待测评内容中的出现频率;
S203.查找各个文字在文字难度等级表中对应的文字难度等级;
S204.按照如下公式计算所述待测评内容的文字难度系数ZD:
式中,n为所述待测评内容中不同文字的个数,ZXi为第i个文字在所述文字难度等级表中对应的文字难度等级,ZRi为第i个文字在所述待测评内容中的出现频率。
3.如权利要求1所述的一种评估文本难度的方法,其特征在于,在所述通过数学统计的方式获取所述待测评内容的词语难度系数的步骤中还包括如下步骤:
S301.获取所述待测评内容中出现的各个词语;
S302.统计各个词语在所述待测评内容中的出现频率;
S303.查找各个词语在词语难度等级表中对应的词语难度等级;
S304.按照如下公式计算所述待测评内容的词语难度系数CD:
式中,m为所述待测评内容中不同词语的个数,CXi为第i个词语在所述词语难度等级表中对应的词语难度等级,CRi为第i个词语在所述待测评内容中的出现频率。
4.如权利要求1所述的一种评估文本难度的方法,其特征在于,在所述通过数学统计的方式获取所述待测评内容的句子难度系数的步骤中还包括如下步骤:
S401.获取所述待测评内容中出现的各个句子;
S402.以词汇量为度量标尺确定各个句子的句子长度;
S403.根据句子长度查找各个句子在句子难度等级表中对应的句子难度等级;
S404.按照如下公式计算所述待测评内容的句子难度系数SD:
式中,k为所述待测评内容中句子的总数,SXi为第i个句子根据句子长度在所述句子难度等级表中对应的句子难度等级;
或者,当所述句子为分句时,按照如下公式计算所述待测评内容的句子难度系数SD:
式中,q为所述待测评内容中复句的总数,p为第j个复句中分句的总数,SXij为第j个复句中第i个分句根据句子长度在所述句子难度等级表中对应的句子难度等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都思戴科科技有限公司,未经成都思戴科科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510467535.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:湿式电除尘器阳极单元
- 下一篇:一种新型圆振动筛激振器系统