[发明专利]一种无领导小组讨论系统在审
申请号: | 202210429319.0 | 申请日: | 2022-04-22 |
公开(公告)号: | CN114881024A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 徐赞;许宁;陈晚云;陈启实;李联凯;管博昂;聂蕙;谢沛铭;尹建树;李永波 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/242;G06F40/205;G10L15/26 |
代理公司: | 长沙朕扬知识产权代理事务所(普通合伙) 43213 | 代理人: | 包雨函 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 领导小组 讨论 系统 | ||
1.一种无领导小组讨论系统,其特征在于,包括:语音捕捉模块、音频转换模块以及关键词提取模块,所述语音捕捉模块、音频转换模块以及关键词提取模块依次相连;
所述语音捕捉模块:用于捕捉发言者的语音形式的发言;
所述音频转换模块:用于将捕捉的语音形式的发言转化为文本形式的发言;
所述关键词提取模块:用于对文本形式的发言进行了分词处理,并在分词处理过程中过滤掉所述发言中停用词,保留指定词性的单词,得到滤后分词集;使用滤后分词集中的分词构建顶点集,并采用共现关系构造顶点集任意两点之间的边,得到所述滤后分词集的候选关键词图,计算所述候选关键词图中每个顶点集的权重,并对所述候选关键词图的权重按从大到小进行排序,选取权重值大小排序靠前的N个顶点作为发言的关键词。
2.根据权利要求1所述的无领导小组讨论系统,其特征在于,所述关键词提取模块包括:
清洗单元:用于识别所述文本形式的发言中的特殊字符,并将所述文本形式的发言中的特殊字符删除;
分词单元,用于加载词典,建立Trie树分词模块进行DGA分词:构建分词DGA词图,并计算分词DGA词图的全局概率得到基于前缀辞典的词频最大切分组合,对于字典记载的登录词,按字典标注标识,对于未登录词,使用Token识别分词DGA词图的英文和中文;对于英文,识别英文中的英文、数值以及时间形式的组合,并给与相应的标记;对于中文词,加载隐马HMM概率模型图,并采用Viterbi算法动态规划取得分词及其标注,得到滤后分词集;
提取单元,用于使用滤后分词集中的分词构建顶点集,并采用共现关系构造顶点集任意两点之间的边,得到所述滤后分词集的候选关键词图,计算所述候选关键词图中每个顶点集的权重,并对所述候选关键词图的权重按从大到小进行排序,选取权重值大小排序靠前的N个顶点作为发言的关键词。
3.根据权利要求1所述的无领导小组讨论系统,其特征在于,提取单元计算计算所述候选关键词图中每个顶点集的权重通过以下公式实现:
式中,i,j分别为两个不同分词顶点的序号,S(Vi)为第i个分词顶点的权重,d为阻尼系数;In(Vi)为指向第i个分词顶点的分词顶点集合;|Out(Vj)|为第j个分词顶点指向的分词顶点集合;S(Vj)为第j个分词顶点的权重。
4.根据权利要求3所述的无领导小组讨论系统,其特征在于,还包括敏感词提取模块,所述敏感词提取模块与所述音频转换模块连接,用于根据预先构建的敏感词表提取文本形式的发言。
5.根据权利要求4所述的无领导小组讨论系统,其特征在于,所述敏感词提取模块包括:
匹配单元:构建所述文本形式的发言的Trie树,针对Trie树上的接点构建Fail指针,从Trie树root节点开始,每次根据读入的字符沿着AC自动机向下移动;当读入的字符,在分支中不存在时,递归走Fail指针路径;如果走Fail指针路径走到了root节点,则跳过该字符,处理下一个字符,在读取完所有输入文本后,最后递归走失败路径,直到到达根节点,完成匹配;
筛选单元:根据匹配单元的匹配结果筛选匹配成功的分词作为敏感词。
6.根据权利要求5所述的无领导小组讨论系统,其特征在于,所述筛选单元的筛选方式采用以下任一种:
具体敏感词表筛选方式:通过具体敏感词表从文本形式的发言的分词集合中提取出存在的敏感词;
模糊词表筛选方式:以预设字为中心,屏蔽预设字及前后的字,从而达到敏感词屏蔽、提取的效果。
7.根据权利要求6所述的无领导小组讨论系统,其特征在于,所述匹配单元在匹配前还用于将文本形式的发言根据标点符号进行分割,得到多个端文本,再对多个端文本进行匹配。
8.根据权利要求7所述的无领导小组讨论系统,其特征在于,还包括反馈模块,所述反馈模块用于将提取的关键词/敏感词发送给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210429319.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机载光缆连接故障定位方法及系统
- 下一篇:一种铜合金发热丝的制备工艺