[发明专利]一种慕课的关键词提取方法有效
申请号: | 201810177736.4 | 申请日: | 2018-03-02 |
公开(公告)号: | CN108549626B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 马震远;黄丽霞;张露娟;戴玉珠;林智勇;刘少鹏 | 申请(专利权)人: | 广东技术师范学院 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/30 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 麦小婵;郝传鑫 |
地址: | 510665 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种慕课的关键词提取方法,该方法包括:先将慕课视频文件的语音转换为文本,并对文本进行中文分词、添加词性标注和语义标注,再根据每个词语的词语位置、词性和语义特征,结合预设的权重设置,计算文本中每个词语的第一综合权重,结合TextRank算法构建的图模型,计算每个词语的第二综合权重,最后按照权重由大到小,迭代输出X个关键词,完成关键词的提取。采用本发明实施例,能提高关键词提取的精确性,满足慕课个性化学习的需求。 | ||
搜索关键词: | 一种 关键词 提取 方法 | ||
【主权项】:
1.一种慕课的关键词提取方法,其特征在于,包括:获取待提取慕课的视频文件,将所述视频文件的语音转换为文本;对所述文本进行中文分词,识别每个词语的词性和语义特征,为所述每个词语添加词性标注和语义特征标注;根据所述每个词语的词语位置、词性和语义特征,结合预设的权重设置,计算所述文本中所述每个词语的第一综合权重;根据TextRank算法,构建所述文本的图模型,并根据所述图模型和所述每个词语的第一综合权重,计算所述每个词语的第二综合权重;根据所述每个词语的第二综合权重,按照权重由大到小,迭代输出X个关键词;X≥2。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东技术师范学院,未经广东技术师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810177736.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种基于句法宾语聚类的中文篇章表现主题分析方法
- 下一篇:汉字处理方法及装置