[发明专利]关键词抽取方法、话术评分方法以及话术推荐方法有效
申请号: | 201911272272.6 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111160017B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 唐文军;贾晓谦;王冉;宋子岳 | 申请(专利权)人: | 中电金信软件有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/35;G06F16/332;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京华进京联知识产权代理有限公司 11606 | 代理人: | 乔改利 |
地址: | 100089 北京市海淀区西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 抽取 方法 评分 以及 推荐 | ||
1.一种关键词抽取方法,所述方法包括:
获取待处理文本数据;
将所述待处理文本数据输入至已训练的关键词抽取网络模型,得到关键词;
其中,所述已训练的关键词抽取网络模型采用下述方式构建:
获取训练语料样本数据,所述训练语料样本数据包括具有对应关系的标准话术和标准关键词;
对所述标准关键词进行分类处理、并将分类后的标准关键词归类至对应的数据集合;
获取所述数据集合对应的集合编码,基于所述集合编码,将所述标准话术处理成携带集合编码的序列标注样本;
获取初始ERNIE-BiLSTM-CRF关键词抽取网络模型,将所述携带集合编码的序列标注样本输入至所述初始ERNIE-BiLSTM-CRF关键词抽取网络模型;
基于所述携带集合编码的序列标注样本,训练所述初始ERNIE-BiLSTM-CRF关键词抽取网络模型,得到关键词抽取网络模型。
2.根据权利要求1所述的关键词抽取方法,其特征在于,所述对所述标准关键词进行分类处理包括:
采用预设预训练模型对所述标准关键词进行语义向量编码,得到关键词语义向量;
获取所述关键词语义向量之间的语义相似度,根据所述语义相似度对所述标准关键词进行分类。
3.根据权利要求2所述的关键词抽取方法,其特征在于,所述获取所述关键词语义向量之间的语义相似度,根据所述语义相似度对所述标准关键词进行分类包括:
采用局部敏感哈希算法和余弦相似度算法,计算所述关键词语义向量之间的语义相似度;
将所述语义相似度与预设相似度阈值进行比较,根据比较结果对所述标准关键词进行分类。
4.根据权利要求1所述的关键词抽取方法,其特征在于,所述基于所述集合编码,将所述标准话术处理成携带集合编码的序列标注样本包括:
将所述标准话术与所述标准关键词进行匹配;
基于所述集合编码,为匹配出的所述标准话术中的关键词和非关键词添加对应的标注,得到所述携带集合编码的序列标注样本。
5.根据权利要求1所述的关键词抽取方法,其特征在于,所述初始ERNIE-BiLSTM-CRF关键词抽取网络模型的数量至少为两个;所述初始ERNIE-BiLSTM-CRF关键词抽取网络模型的数量包括ERNIE网络单元、BiLSTM网络单元以及CRF网络单元;
所述基于所述携带集合编码的序列标注样本,训练所述初始ERNIE-BiLSTM-CRF关键词抽取网络模型,得到关键词抽取网络模型包括:
根据所述ERNIE网络单元对所述携带集合编码的序列标注样本进行语义编码,得到各序列标注样本对应的上下文词向量;
将所述上下文词向量输入至所述BiLSTM网络单元,得到所述上下文词向量的双向隐藏状态向量;
将所述双向隐藏状态向量进行拼接、并将拼接后的所述双向隐藏状态向量输入至所述CRF网络单元,得到各序列标注样本中关键词出现的概率值;
根据所述概率值,筛选出输出所述概率值最高的初始ERNIE-BiLSTM-CRF关键词抽取网络模型,得到关键词抽取网络模型。
6.一种话术评分方法,所述话术评分方法包括:
获取待评分话术,将所述待评分话术转换为字符序列;
将所述字符序列输入至已训练的关键词抽取网络模型,抽取所述字符序列中的关键词,得到抽取出的关键词对应的集合标记序列;
根据所述集合标记序列,统计命中集合数,确定所述待评分话术的关键词命中数;
根据所述关键词命中数,得到所述待评分话术的评分;
其中,所述已训练的关键词抽取网络模型为上述权利要求1至5中任一项所述的关键词抽取方法中的关键词抽取网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电金信软件有限公司,未经中电金信软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911272272.6/1.html,转载请声明来源钻瓜专利网。