[发明专利]一种出版文化语言库词汇分析方法在审
申请号: | 201910111146.6 | 申请日: | 2019-02-12 |
公开(公告)号: | CN109948146A | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 李瑶 | 申请(专利权)人: | 吉林工程技术师范学院 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F16/36 |
代理公司: | 合肥顺超知识产权代理事务所(特殊普通合伙) 34120 | 代理人: | 周发军 |
地址: | 130000 *** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了词汇分析领域的一种出版文化语言库词汇分析方法,可以在语料库建设的基础之上,精准选词、用词,辨析词性,扩充语义,进行词典编纂;扩展语料库,有利于使语篇形成相对应的英语双语语料库;生成省域内的出版文化热点高频词,能够为省域热点的发展情况的分析及其经济文化的发展差异分析提供数据支撑;动态观察省域内的出版文化发展趋势,为政策咨询做出分析预判与科学规划,并根据民众关注主题进行人文价值观引;共享省域内的出版文化语料库资源,为更多的学习者、研究者、教师、专家和感兴趣的有关机构,提供出版文化语料库建设与研究查询帮助,具有极高的社会应用价值。 | ||
搜索关键词: | 语料库 词汇分析 出版 文化语言 双语语料库 语义 差异分析 词典编纂 动态观察 经济文化 科学规划 社会应用 数据支撑 文化发展 高频词 词性 预判 分析 查询 共享 英语 建设 教师 咨询 帮助 研究 政策 | ||
【主权项】:
1.一种出版文化语言库词汇分析方法,其特征在于,包括步骤S1:基于省域内近五年公开出版发行的电子出版物作为采样研究对象,结合省域内部的科技文献信息服务平台建立省域数据库;S2:根据国家标准进行词类及其他切分单位分类,通过数据统计软件以及语料处理软件进行字频、词频分析,建立省域的语料库;S3:随机挑选近五年省域发行的电子出版物作为采样样品,依照发行时间进行顺序排列,提取采样样品中各字、词出现频率;S4:通过语料处理软件对采样样品的内容词句进行词性划分,对字频、词频进行分析统计,建立省域的语料库子库;重复S3‑S4,累积采样数量;S5:通过数据统计软件对省域发行的电子出版物的语料子库进行横向及纵向分析,根据分析结果合成语料库总库。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林工程技术师范学院,未经吉林工程技术师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910111146.6/,转载请声明来源钻瓜专利网。