[发明专利]一种建立关键词模型的方法及装置有效
申请号: | 201510956045.0 | 申请日: | 2015-12-17 |
公开(公告)号: | CN106897290B | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 邱志贤;唐敏华;孙佳伟;顾伟;束俞;林嘉 | 申请(专利权)人: | 中国移动通信集团上海有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 200060 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 建立 关键词 模型 方法 装置 | ||
本发明公开了一种建立关键词模型的方法及装置,该方法包括通过获取语音文本数据和核心关键词,检索所述语音文本数据中所述核心关键词所在的文本语句,统计所述文本语句中设定范围内的词以及词的词频,对所述统计的词依据词的词频进行排序,将所述词频的排名大于排名阈值的词,确定辅助关键词,对所述核心关键词和所述辅助关键词进行逻辑关系组合,建立关键词模型。通过对核心关键词所在的文本语句中设定范围内的词的筛选,以及词的词频进行排序,可以获取辅助关键词,从而获取用于建立关键词模型的关键词,再将这些关键词进行逻辑组合,即可以建立关键词模型,提高了语义分析的效率和准确性。
技术领域
本发明涉及业务支撑技术领域,尤其涉及一种建立关键词模型的方法及装置。
背景技术
随着移动通信数据挖掘技术应用的越来越广泛,客服中心存储的大量录音数据成了数据挖掘的重要研究方向,目前客服中心的录音数据已经进行文本化,并可以进行基于关键词的语义分析。
在进行基于关键词的语义分析时,需要先依赖人工经验确定关键词,再根据各关键词之间的逻辑关系,将关键词进行逻辑组合,形成语义分析模型。建立这种模型主要根据业务人员的经验进行的。
发明内容
本发明实施例提供一种建立关键词模型的方法及装置,用以解决现有技术中人工确定关键词的问题。
本发明实施例提供的一种建立关键词模型的方法,包括:
获取语音文本数据和核心关键词;
检索所述语音文本数据中所述核心关键词所在的文本语句,统计所述文本语句中设定范围内的词以及词的词频,所述设定范围内的词是指在所述文本语句中,位于所述核心关键词前后设定范围内的词;
对所述统计的词依据词的词频进行排序,将所述词频的排名大于排名阈值的词,确定辅助关键词;
对所述核心关键词和所述辅助关键词进行逻辑关系组合,建立关键词模型。
较佳地,在统计所述文本语句中设定范围内的词以及词的词频之后,还包括:
根据所述核心关键词所在文本语句的标点符号,确定所述核心关键词所在文本语句所表述的语气,将所述核心关键词所在文本语句所表述的语气确定为所述关键词模型所表述的语气;或
根据各所述核心关键词所在文本语句的标点符号,确定各所述核心关键词所在文本语句所表述的语气;针对每个所述核心关键词所在文本语句所表述的语气,根据所述核心关键词所在的文本语句所述表述的语气及其相邻的两个文本语句所述表述的语气,确定所述关键词模型所表述的语气。
较佳地,所述将词频排名大于排名阈值的词,确定辅助关键词,包括:
对所述统计的词进行领域分类,针对每个领域,将每个领域内词频排名大于排名阈值的词,确定为所述辅助关键词。
较佳地,所述对所述核心关键词和所述辅助关键词进行逻辑关系组合,包括:
将所述核心关键词和所述辅助关键词确定为模型关键词;
对所述模型关键词进行领域分类,将不同类的所述模型关键词之间的逻辑关系确定为逻辑关系与;
若同一类的所述模型关键词之间是同义词,则将所述同一类的所述模型关键词之间的逻辑关系确定为逻辑关系或;
若同一类的所述模型关键词之间不是同义词,则将所述同一类的所述模型关键词之间的逻辑关系确定为逻辑关系非。
较佳地,所述获取核心关键词,包括:
获取根据语音文本数据的业务类型确定的核心关键词;或
获取用户输入的核心关键词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团上海有限公司,未经中国移动通信集团上海有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510956045.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:无人机旋转云台多角度倾斜摄影装置
- 下一篇:球型屏