[发明专利]面向汉语教学的词语常用度的获取方法及获取系统有效
申请号: | 201510102773.5 | 申请日: | 2015-03-09 |
公开(公告)号: | CN104731769B | 公开(公告)日: | 2017-11-14 |
发明(设计)人: | 王治敏 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06Q50/20 |
代理公司: | 北京三友知识产权代理有限公司11127 | 代理人: | 贾磊 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 汉语 教学 词语 用度 获取 方法 系统 | ||
技术领域
本发明涉及词表处理技术,尤其涉及汉语教学中词表的处理方法,具体就是一种面向汉语教学的词语常用度的获取方法及获取系统。
背景技术
常用词语的教学,是对外汉语教学的重点与难点,选取什么样的词语作为教学对象,一直是专家们努力探索的难题之一。长期以来,学界基本上以1992年出版的《汉语水平词汇与汉字等级大纲》(简称词汇大纲)作为对外汉语教学总体设计、教材编写、课堂教学和成绩测试的主要依据。词汇大纲作为规范性的教学词表,在对外汉语教学领域发挥了重要的作用。
但是随着社会的发展,词语的使用频次也发生了很大变化,词汇大纲中的很多常用词语在今天看来已经成了历史词汇,有些甚至已经弃置不用或者很少使用,如:“倒爷、缎子、的确良、走狗、资本家”等词语。同时,也有很多词语进入我们的社会生活并成为常用词语,如:“手机、邮件、短信、视频、上传、下载、传送、光盘、证券、基因、总裁、社区、平台”等词语。昔日的词汇大纲已经无法满足对外汉语教学日新月异的发展需求,使得很多学者在制定教学大纲或者编写教材时不得不采用人工或者专家经验的办法提取常用词,更新教学词表。
2010年国家汉办和教育部社科司研制了《汉语国际教育用音节汉字词汇等级划分》简称《等级划分》,这是面向全球汉语国际教育的国际标准。《等级划分》依据了30多亿字次的当代大型动态语料库和具有代表性的词表和字表,共收录了11093个词语,《等级划分》是大数据时代汉语教学词表的代表,但是经过发明人的统计调查,发现《等级划分》中依然保留着一些不常用的词汇。例如:“焦距、磁盘、陨石、巫婆、爹、菩萨、辫子、阎王、间谍、霍乱、几率、经度、惨白、隐身、迭起、从容不迫”等,这些词都是《等级划分》的4级词汇,对留学生来说学习的意义不大,而广泛出现在中国语言生活中的“提出、展开、达到、批准、人才、农民工、条例、消费者”等常用词语却被排除在词表之外。如何自动更新《词汇大纲》和《等级划分》是一个亟待解决的技术问题。
在第九届全球孔子学院大会,刘延东的讲话中谈到“全球已有475所孔子学院和851个中小学孔子课堂,遍布126个国家,累计注册学员345万人。有61个国家和欧盟已将汉语教学纳入国民教育体系,全球汉语学习者已达1亿。”面向海外的汉语教学从教学模式、教学方法、教材的设计急需教学词表等基础资源的支撑。
陆俭明(1999,2004,2005a,2007)曾多次呼吁,在汉语教学快速发展的同时,迫切需要进行一些基础性研究,迫切需要组织力量研究以下一些问题,其中包括:一年级学生应该掌握多少词语?哪些词语?各个词语在教材中出现时,孰先孰后?复现率为几?递增率为几?目前上述问题仍然没有得到很好解决。
王治敏(2013)统计了北京语言大学初中高级汉语本科系列教材《北语系列》,博雅汉语初中高级教材《博雅系列》和北大初中高级教程《北大系列》等三部教材的成语,考察发现中级阶段三部系列教材的共有成语为0。高级阶段三部教材的共有成语只有6例,占这个层次成语总数的0.88%,三部教材中的独有成语已经达到99%。同时对任意两个系列的中高级出现的成语进行了调查,发现教材中共有成语所占比例非常少,均在7%以下。这说明对外汉语系列教材中成语收取缺少客观依据,教材和教材之间,以及教材内部不同层级之间缺乏有效的衔接。
教材词语的多少,孰先孰后是解决教材统一性的关键因素,目前《词汇大纲》和《等级划分》只能粗略提供词语的等级,而解决词语孰先孰后的可能途径就是要建立词语与大规模语料的关联,通过计量的方式,建立词语常用度客观、真实的标准。为了解决上述问题,发明人利用时间间隔信息和时间区间信息设计一个提取常用词语的模型(王治敏.基于时间跨度的汉语教学常用词表统计研究[J].华文教学与研究.2010.(4):P.49-55),该模型的具体如下:
其中,U表示常用度,表示词语出现的平均时间间隔,stdev(f)表示词语出现时间间隔的标准差。
其中,n为词语统计时间间隔f的个数。
其中,n为词语统计时间间隔f的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510102773.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息查询方法及装置
- 下一篇:基于循环移位的立方相位信号参数估计方法