[发明专利]事件分类处理方法、装置、电子设备和存储介质在审
申请号: | 202011484245.8 | 申请日: | 2020-12-15 |
公开(公告)号: | CN112559747A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 黄佳艳 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/335;G06F16/33;G06F40/30;G06N3/08 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 韩海花 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 分类 处理 方法 装置 电子设备 存储 介质 | ||
1.一种事件分类处理方法,包括:
获取多个属于不同事件类型的样本事件集合,其中,每个所述样本事件集合包含多个属于相同事件类型的样本事件文本;
获取每个所述样本事件文本对应的字符向量;
对每个所述样本事件文本进行语义分析标注角色实体,获取与每个所述角色实体对应的词向量;
将每个所述样本事件文本对应的所述字符向量,以及所述角色实体对应的所述词向量作为预设神经网络模型的输入信息,以及将每个所述样本事件所属的样本事件集合对应的事件类型作为所述神经网络模型的输出信息,进而训练所述神经网络模型进行事件分类。
2.如权利要求1所述的方法,其中,所述获取多个属于不同事件类型的样本事件集合,包括:
获取满足预设条件的候选事件文本;
对所述候选事件文本进行聚类处理,生成多个属于不同事件类型的候选事件集合,其中,每个所述候选事件集合包含多个属于相同事件类型的候选事件文本;
提取每个所述候选事件集合的集合特征,并获取与每个所述集合特征对应的特征分值;
根据与每个所述集合特征对应的特征分值从多个所述候选事件集合中选择满足筛选条件的所述多个样本事件集合。
3.如权利要求2所述的方法,其中,当所述集合特征为所述候选事件文本的热度值,所述获取与每个所述集合特征对应的特征分值,包括:
计算所述候选事件集合中各所述候选事件文本与预设数据库中文本之间的字符相似度,根据字符相似度确定所述候选事件集合中与所述数据库文本匹配的文本热度;
根据预设的热度模型对所述文本热度进行处理,生成所述候选事件文本的热度值。
4.如权利要求2所述的方法,其中,所述根据与每个所述集合特征对应的特征分值从多个所述候选事件集合中选择满足筛选条件的所述多个样本事件集合,包括:
获取预设的与每个所述集合特征对应的权重;
根据每个所述集合特征对应的特征分值和权重,计算每个所述候选事件集合的集合分值;
将每个所述候选事件集合的集合分值与预设阈值进行比较,将大于所述阈值的集合分值对应的候选事件集合作为所述样本事件集合。
5.如权利要求1-4任一所述的方法,其中,在所述训练所述神经网络模型之前,还包括:
获取所述输入信息经过所述神经网络模型中的编码层的第一向量;
获取所述字符向量经过所述神经网络模型中的全连接层的第二向量;
将所述第一向量和所述第二向量进行级联处理生成第三向量;
将所述第三向量输入到所述神经网络模型中的解码层。
6.一种事件分类处理装置,包括:
第一获取模块,用于获取多个属于不同事件类型的样本事件集合,其中,每个所述样本事件集合包含多个属于相同事件类型的样本事件文本;
第一处理模块,用于获取每个所述样本事件文本对应的字符向量;
第二处理模块,用于对每个所述样本事件文本进行语义分析标注角色实体,获取与每个所述角色实体对应的词向量;
训练模块,将每个所述样本事件文本对应的所述字符向量,以及所述角色实体对应的所述词向量作为预设神经网络模型的输入信息,以及将每个所述样本事件所属的样本事件集合对应的事件类型作为所述神经网络模型的输出信息,进而训练所述神经网络模型进行事件分类。
7.如权利要求6所述的装置,其中,所述第一获取模块,包括:
第一获取单元,用于获取满足预设条件的候选事件文本;
聚类单元,用于对所述候选事件文本进行聚类处理,生成多个属于不同事件类型的候选事件集合,其中,每个所述候选事件集合包含多个属于相同事件类型的候选事件文本;
第二获取单元,用于提取每个所述候选事件集合的集合特征,并获取与每个所述集合特征对应的特征分值;
筛选单元,用于根据与每个所述集合特征对应的特征分值从多个所述候选事件集合中选择满足筛选条件的所述多个样本事件集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011484245.8/1.html,转载请声明来源钻瓜专利网。