[发明专利]面向汉语教学的词语常用度的获取方法及获取系统有效
申请号: | 201510102773.5 | 申请日: | 2015-03-09 |
公开(公告)号: | CN104731769B | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 王治敏 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06Q50/20 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 贾磊 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种面向汉语教学的词语常用度的获取方法及获取系统,词语常用度的获取方法包括设置时间区间T,并将所述时间区间T分成多个时间子区间t1,t2,...,tn;选取对应于所述时间子区间t1,t2,...,tn的语料;解析所述语料获得候选词语;统计所述候选词语在所述时间子区间t1,t2,...,tn对应的所述语料中出现的子次数f1,f2,…,fn;求所述子次数f1,f2,…,fn之和,获得所述候选词语在所述时间区间T对应的所述语料中出现的总次数f;将所述总次数f除以所述统计次数n得到所述候选词语在所述时间子区间t1,t2,...,tn出现的平均次数基于所述子次数f1,f2,…,fn和所述平均次数获得所述候选词语的标准差stdev(f);以及基于所述平均次数和所述标准差stdev(f)获得所述候选词语的常用度U。本发明解决现有技术中不能精准提取用于汉语教学的常用词语的技术问题。 | ||
搜索关键词: | 面向 汉语 教学 词语 用度 获取 方法 系统 | ||
【主权项】:
一种面向汉语教学的词语常用度的获取方法,其特征在于,所述面向汉语教学的词语常用度的获取方法包括:设置一时间区间T,并将所述时间区间T分成多个时间子区间t1,t2,...,tn,其中,t1=t2=...=tn,n为统计次数;选取对应于所述时间子区间t1,t2,...,tn的语料;解析所述语料获得候选词语;统计所述候选词语在所述时间子区间t1,t2,...,tn对应的所述语料中出现的子次数f1,f2,…,fn;求所述子次数f1,f2,…,fn之和,获得所述候选词语在所述时间区间T对应的所述语料中出现的总次数f;将所述总次数f除以所述统计次数n得到所述候选词语在所述时间子区间t1,t2,...,tn出现的平均次数基于所述子次数f1,f2,…,fn和所述平均次数获得所述候选词语的标准差stdev(f);以及基于所述平均次数和所述标准差stdev(f)获得所述候选词语的常用度U,其中,所述常用度U与所述平均次数所述标准差stdev(f)的关系为:U=f‾stdev(f).]]>
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510102773.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种信息查询方法及装置
- 下一篇:基于循环移位的立方相位信号参数估计方法