[发明专利]古诗词词频分析方法及系统有效

专利信息
申请号: 202110675786.7 申请日: 2021-06-18
公开(公告)号: CN113420554B 公开(公告)日: 2023-10-27
发明(设计)人: 韩珍 申请(专利权)人: 枣庄科技职业学院
主分类号: G06F40/289 分类号: G06F40/289;G06F40/216;G06F16/35
代理公司: 保定国驰专利代理事务所(特殊普通合伙) 13143 代理人: 唐佳芝
地址: 277500 山东省枣庄市*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 古诗词 词频 分析 方法 系统
【说明书】:

本公开涉及一种古诗词词频分析方法,包括:获取包括古诗词的第一数据集,根据所述第一数据集构建第一文档,所述第一数据集至少包括M首诗词;针对所述第一文档进行词频分析,获得表征词频排序的第一列表,并根据所述第一列表,建立所述第一列表中的关键词到第一数据集中的M首诗词的名称的第一映射表;根据虚字词库中预设虚字词信息,去除所述第一列表中的虚字词以生成第二列表,根据所述第二列表,更新所述第一映射表以形成第二映射表;依据用户预设条件,筛选第二列表中符合预设条件且词频排序最高的至少一个关键词,并依照所述关键词与所述第二映射表的对应关系,确定N首诗词的名称;依据N首诗词的名称,分别展示诗词内容。

技术领域

发明涉及一种信息处理方法,特别是涉及一种古诗词词频分析方法及系统。

背景技术

诗词,一般理解特指旧体格律诗、词,例如广为流传的唐诗、宋词,都属于旧体格律诗。通常认为,诗较为适合“言志”,而词则更为适合“抒情”。有记载的中国诗最早起源于先秦,但鼎盛于唐代。而中国词则起源于隋唐,流行于宋代。中华诗词源自民间,其实是一种草根文学。随着文化的传承,时至今日,在21世纪的中国,诗词仍然深受普通大众青睐。而且,不止限于传统文学爱好者,对于一般人来说,尤其对于青少年或者幼儿时期,接受传统诗词文化的熏陶,非常有利于增强民族自信心及民族自豪感。因此,目前众多的幼儿早教机构所开设的课程中,均包含有诗词部分的教学内容。甚至是在一些早教故事机之类的电子产品中,诗词内容均占有相当大的比重。但是,目前比较流行的早教故事机,收录的诗词都不尽相同,没有统一的标准。据统计,仅唐诗作品,依据《全唐诗》记载,目前存世就约有55763首。同样地,仅《全宋词》收录的宋词存世量就有20000首。这些只是当时以及后人编录的数目,里面也只包括诗词的精华之作,对于大量知名度较低的诗词,可能没有收录,但仍不能排除其具有鉴赏价值的部分。另外,我们知道,在考虑到儿童及青少年的心性发育特点以及诗词的表现形式及内容时,可以容易想到,并不是所有的诗词都适合作为低龄人群的学习鉴赏材料。因此,目前急需要针对我国传统古诗词进行有效合理的分析分类,以指导儿童及青少年早期传统文学教育。

发明内容

鉴于现有技术存在的上述问题,本发明一方面的目的在于提供一种古诗词词频分析方法,该方法可通过词频分析,进而根据用户设定条件向用户以预设时间推送预设古诗词。

为了实现上述目的,本发明提供的古诗词词频分析方法,包括:

获取包括古诗词的第一数据集,根据所述第一数据集构建第一文档,所述第一数据集至少包括M首诗词;

针对所述第一文档进行词频分析,获得表征词频排序的第一列表,并根据所述第一列表,建立所述第一列表中的关键词到第一数据集中的M首诗词的名称的第一映射表;

根据虚字词库中预设虚字词信息,去除所述第一列表中的虚字词以生成第二列表,根据所述第二列表,更新所述第一映射表以形成第二映射表;所述第二映射表中至少包括了诗词对应的分类信息;

依据用户预设条件,筛选第二列表中符合预设条件且词频排序最高的至少一个关键词,并依照所述关键词与所述第二映射表的对应关系,确定N首诗词的名称;

依据N首诗词的名称,分别展示诗词内容;M大于N,且M和N均为自然数。

在本发明技术方案中,诗词对应的分类信息,为常规分类方式,且预存储于设备或云端,包括赠友送别类、边塞征战类、羁旅怀乡类、咏物类、怀古咏史类、写景抒情类及山水田园类。

作为优选,获取包括古诗词的第一数据集,包括从本地数据库中获取预存储的诗词信息,和/或从云端服务器获取预存储的诗词信息,和/或通过WebAPI接口获取所述诗词信息。

作为优选,根据所述第一数据集构建第一文档,包括:

针对每首诗词,按照名称、作者名、年代及内容分别采集,并按照第一固定分隔符连接形成区块信息;所述区块信息还包括区块序列信息;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于枣庄科技职业学院,未经枣庄科技职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110675786.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top