[发明专利]一种从文本语料中提取持续性热点短语的方法、装置及存储介质有效
申请号: | 202110079692.3 | 申请日: | 2021-01-21 |
公开(公告)号: | CN112966505B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 叶东;孙兆伟;李晖;赵翰墨;高祥博;王璐 | 申请(专利权)人: | 哈尔滨工业大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/242;G06F16/33 |
代理公司: | 西安维英格知识产权代理事务所(普通合伙) 61253 | 代理人: | 李斌栋;归莹 |
地址: | 150006 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种从文本语料中提取持续性热点短语的方法、装置及存储介质;该方法可以包括:将原始文本语料划分为多个与时间区间相对应的文本集合;基于每个文本集合所包含的文本后缀及各文本后缀出现的频率构造每个文本集合对应的频率后缀树;基于查询指令所指示的热点持续时间区间以及最小出现频率阈值遍历所述热点持续时间区间所对应的频率后缀树,查询获得在所述热点持续时间区间内出现频率不低于所述最小出现频率阈值的热点短语。 | ||
搜索关键词: | 一种 文本 语料 提取 持续性 热点 短语 方法 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110079692.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种非布司他杂质的制备方法
- 下一篇:一种车辆通信方法