[发明专利]基于自然语言处理化学品事故案例的方法及系统在审
申请号: | 202010561393.9 | 申请日: | 2020-06-18 |
公开(公告)号: | CN113821585A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 侯孝波;张广文;孙万付;曲开顺;袁纪武;卢均臣 | 申请(专利权)人: | 应急管理部化学品登记中心;中国石油化工股份有限公司;中国石油化工股份有限公司青岛安全工程研究院 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/951;G06F40/289;G06F40/30;G06N3/04 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨;王晓晓 |
地址: | 266071 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 处理 化学品 事故 案例 方法 系统 | ||
本发明提供一种基于自然语言处理化学品事故案例的方法及系统,属于自然语言处理技术领域。该方法包括:获取化学品事故短文本数据,确定化学品事故短文本数据对应的事故类别;通过分析化学品事故短文本数据,得到化学品事故短文本数据的依存句法结构;根据依存句法结构,从化学品事故短文本数据中提取化学品事故关键信息;根据化学品事故关键信息对化学品事故进行分级,按照化学品事故等级存储化学品事故短文本数据、事故类别和化学品事故关键信息。基于获取的事故案例短文本数据,利用基于神经网路的依存句法分析算法,提取关键信息,并根据事故管理方法,将事故进行分级后,保存事故信息,为事故录入人员的工作提供更为便捷的途径。
技术领域
本发明涉及自然语言处理技术领域,具体地涉及一种基于自然语言处理化学品事故案例的方法以及一种基于自然语言处理化学品事故案例的系统。
背景技术
石化行业具有高温高压、易燃易爆、有毒有害、腐蚀性强等特点,同时,由于资金密集、装置大型化、工艺复杂、连续作业、点多面广,任何一项设备隐患、制度缺陷、程序遗漏、工作疏忽或个人违章都可能造成事故,引发严重后果。事故研究的主要目的是查清事故发生的过程,分析事故发生的原因,研究事故发展的规律,吸取事故教训,提出有针对性的整改措施,进而改善企业的安全管理系统,避免类似事故的重复发生。
目前石化事故信息的收集还处在依靠人工录入到信息化系统的阶段,目前获取事故信息后由人工录入、分级的工作方式,无法及时、全面的掌握事故信息,导致事故录入效率低,缺乏有效的智能化处理手段是事故案例管理分析的主要缺点。
发明内容
本发明实施方式的目的是提供一种基于自然语言处理化学品事故案例的方法和系统,实现了通过智能分析事故信息,将事故进行文本提取、分词,为事故录入人员提供有力的技术支撑。
为了实现上述目的,本发明第一方面提供一种基于自然语言处理化学品事故案例的方法,所述方法包括:
获取化学品事故短文本数据,确定化学品事故短文本数据对应的事故类别;
通过分析所述化学品事故短文本数据,得到化学品事故短文本数据的依存句法结构;
根据所述依存句法结构,从所述化学品事故短文本数据中提取化学品事故关键信息;
根据所述化学品事故关键信息对化学品事故进行分级,按照化学品事故等级存储所述化学品事故短文本数据、所述事故类别和所述化学品事故关键信息。
可选的,所述获取化学品事故短文本数据,确定所述化学品事故短文本数据对应的事故类别,包括:
通过网络爬虫爬取化学品事故短文本数据,当前主要的新闻媒体对化工突发事件报道数量呈几何性增长的趋势,这类报道具有内容篇幅短、更新速度快等特点,面对海量的中文报道数据,网络爬虫根据搜索规则,自动对相关的网站新闻进行全部或者局部的内容爬取,网络爬虫爬取数据速度快,覆盖面广;
对爬取的化学品事故短文本数据去重,网络爬虫爬取的化学品事故短文本数据量大,重合度高,因此需要结合危险化学品事故新闻的文本特征,利用SimHash算法自动去除重复的事故新闻;
对去重后的化学品事故短文本数据进行分类处理,确定所述化学品事故短文本数据对应的事故类别,通过对危险化学品事故新闻的特征研究,利用基于机器学习的逻辑回归算法Logistic regression,设计化学品事故短文本分类器,准确快速的对化学品事故短文本数据进行分类处理,将化学品事故短文本数据归类到火灾、爆炸、泄漏、中毒等事故类别中,完成危险化学品事故的短文本数据爬取。可选的系统还设置“其他”这个事故类别来表示不属于火灾、爆炸、泄漏、中毒这四种事故类别的所有化学品事故短文本数据,当然随着数据的增加,当其他这个事故类别中所包含的化学品事故短文本数据中存在一部分具有相同特点的化学品事故短文本数据时,可以新增一个事故类别用于表示这一类的化学品事故短文本数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于应急管理部化学品登记中心;中国石油化工股份有限公司;中国石油化工股份有限公司青岛安全工程研究院,未经应急管理部化学品登记中心;中国石油化工股份有限公司;中国石油化工股份有限公司青岛安全工程研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010561393.9/2.html,转载请声明来源钻瓜专利网。