[发明专利]基于文本分析的停电原因识别系统有效

专利信息
申请号: 201610209966.5 申请日: 2016-04-05
公开(公告)号: CN105930347B 公开(公告)日: 2017-05-10
发明(设计)人: 李虎;程树华;牛良涛;王伟凯;吴文先;徐进澎;嵇望 申请(专利权)人: 浙江远传信息技术股份有限公司
主分类号: G06F17/30 分类号: G06F17/30;G06N5/04
代理公司: 浙江永鼎律师事务所33233 代理人: 陆永强
地址: 310007 浙江省杭州*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及模式识别领域,公开了基于文本分析的停电原因识别系统,其包括数据库和处理器,数据库中记录有由客服人员在提供客户服务时针对频繁停电投诉而记录产生的停电数据,处理器内设有文本分拆与过滤专家系统模块、根因识别专家系统模块和HDSP识别模块。本发明帮助客户从杂乱无章的工单中锁定停电原因,明确责任归属,加强客服中心管理和为提升用户满意度创造条件,有利于企业及时处理停电事件,所用模型和系统均为自动实现,其评价标准客观、集成性能好,大大降低了工作人员的工作量,解决了工作人员因主观原因导致结果体系不一致的问题。
搜索关键词: 基于 文本 分析 停电 原因 识别 系统
【主权项】:
基于文本分析的停电原因识别系统,其特征在于:包括数据库和处理器,数据库中记录有由客服人员在提供客服服务时针对停电投诉而记录产生的停电数据,处理器内设有文本分拆与过滤专家系统模块、根因识别专家系统模块和HDSP识别模块;文本分拆与过滤专家系统模块对停电数据进行文本分拆与过滤并使分拆与过滤后的每条停电数据有且仅有一个停电原因,文本分拆与过滤专家系统模块包括文本分拆单元和过滤专家系统单元,文本分拆单元将停电数据依次通过逗号、句号和分号进行逐层拆分,过滤专家系统单元将分拆后的停电数据进行过滤并去除与停电原因无关的数据;根因识别专家系统模块从分拆过滤后的停电数据提取共性规则,并通过共性规则对停电数据进行分析并得出识别文本;HDSP识别模块将文本分拆与过滤专家系统模块和根因识别专家系统模块进行分析而未被识别的停电数据进行二次分析得并到识别文本;根因识别专家系统模块还包括规则获取单元、规则库和事实库;规则获取单元对经过分拆和过滤的停电数据提取共性规则,将共性规则的性能参数与预先设置在规则库内的第一阈值进行比较,当共性规则的性能参数识别的准确率高于第一阈值的准确率时,再将该共性规则的性能参数与事实库内的第二阈值进行准确率比较,若该共性规则的性能参数的准确率高于第二阈值的准确率,则将该共性规则更新到规则库中;规则库内包含有用于不同停电原因识别的匹配词,将该共性规则与匹配词进行匹配并得出该停电数据对应的识别文本;事实库包括行业背景知识、初始的文本数据、后期标签化数据以及在根因识别专家系统模块运行过程中产生的识别性能数据;根因识别专家系统模块还包括推理机、人机交互单元和解释单元;推理机用于规则库内的规则推理的逻辑性关系推理,人机交互单元包括人机交互界面,工程师通过人机交互界面进行规则库和事实库的数据完善并进行新的规则获取,解释单元将停电原因的识别结果呈现在人机交换界面上直接展现给使用者;HDSP识别模块对未识别的停电数据进行抽取并生成训练文本,通过对训练文本的分析得出性能参数,运用性能参数生成识别文本并对剩余的未识别的停电数据进行停电原因的识别;通过训练文本得θ和p(θ),θ为主题向量即表示每列每个主题在文档出现的概率,p(θ)为主题向量θ的Dirichlet分布,再得出两个控制参数α和β,α为p(θ)分布的参数,用于生成一个主题θ向量;β为各个主题对应的单词概率分布矩阵p(w|z),通过控制参数α和β就确定了主题模型,模型生成识别文本的算法如下:(1)选定一个主题向量θ,确定每个主题被选择的概率;(2)从主题向量θ中选择一个主题z,按主题z的词概率分布生成一个词,该词即为识别文本;HDSP识别模块对未识别的停电数据进行抽取并生成测试文本,通过人为对测试文本进行停电原因识别,判断训练文本得出的控制参数α和β是否合理并进行调整。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江远传信息技术股份有限公司,未经浙江远传信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610209966.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top