[发明专利]面向庭审过程中犯罪嫌疑人态度预测的方法在审
申请号: | 202011103541.9 | 申请日: | 2020-10-15 |
公开(公告)号: | CN112597271A | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 杨亮;曾景杰;李树群;林鸿飞 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/951;G06K9/62 |
代理公司: | 大连智高专利事务所(特殊普通合伙) 21235 | 代理人: | 毕进 |
地址: | 116023 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 庭审 过程 犯罪嫌疑人 态度 预测 方法 | ||
一种面向庭审过程中犯罪嫌疑人态度预测的方法,属于智能司法的领域,用于对犯罪嫌疑人态度进行预测,要点是包括S1、庭审数据的获取与解析;S2、数据规整及标注对齐;S3、庭审过程多模态信息的抽取与拓展;S4、利用多模态信息对犯罪嫌疑人态度进行预测。效果是针对智能司法中的庭审过程,构建了从原始数据获取、特征工程、模型构建等完整的流程框架,在犯罪嫌疑人态度预测任务上实现了较好的预测性能。
技术领域
本发明属于数据挖掘领域,是对智能司法的一种落地,能够对庭审过程中犯罪嫌疑人态度进行预测。
背景技术
随着自然语言处理领域的不断发展,近年来智慧司法作为其中的一个重要研究方向呈现一个逐步上升的趋势,该项研究能够有效帮助法律工作人员从繁琐重复的工作解放出来,给予相关人员方便且快捷的法律建议,减轻律师的工作压力,并且对于多数欠缺法律背景的大众百姓起到一个普法的作用。
通常而言,智能司法包括具体的几个子任务,比方说罚金预测、量刑预测、法条预测等等,通常量刑预测任务目前主要的研究发现被当成是一个自然语言处理中的文本预测任务,研究者们会从文本中去挖掘语义信息,从而去解决罚金或者法条预测务。
但在实际庭审过程中,情况复杂多变。人们常说“坦白从宽,抗拒从严”,一个人在法庭上庭审过程的表现,如姿态、语气、神情,会在一定程度上影响他最终的量刑结果,而法律条款当中也有如蔑视法庭罪名。可以说犯罪嫌疑人的态度及行为举止,反应了犯罪嫌疑人的认错、反省的程度。但目前少有对庭审过程中犯罪嫌疑人的态度进行分析的研究,且缺少关于庭审过程的多模态庭审数据集。因此,对于多模态庭审数据集的构建并基于该数据集分析犯罪嫌疑人的态度,可以有效地提高量刑预测任务的精度。
发明内容
为了解决对犯罪嫌疑人态度进行预测的问题,本发明提出如下技术方案:一种面向庭审过程中犯罪嫌疑人态度预测的方法,包括如下步骤:
S1.庭审数据的获取与解析;
S2.数据规整及标注对齐;
S3.庭审过程多模态信息的抽取与扩展;
S4.利用多模态信息对犯罪嫌疑人态度进行预测。
进一步的,所述步骤S1.庭审数据的获取与解析,具体包括:
A1.数据范围筛选:从中国裁判文书网(http://wenshu.court.gov.cn/Index)和中国庭审公开网(http://tingshen.court.gov.cn/)上收集数据;
A2.数据获取:确定所获取庭审案件号,通过编写网页爬虫程序,于目标庭审案件号上按照指定庭审视频和裁判文书爬取庭审案件的信息;
A3.网页解析:借助BeautifulSoup工具解析将爬取的网页中的数据,通过HTML标签和属性信息,解析出与庭审案件的相关信息。
进一步的,所述步骤S2.数据规整以及标注对齐,具体包括:
B1.数据选取;
B2.数据处理:对收集的视频数据进行剪辑,提取与视频片段配套的音频,作为音频数据,再从音频中提取配套的文字,文本信息存储为TXT格式;
B3.数据标注:由若干标注者观看视频片段并进行数据标注,标注犯罪嫌疑人态度的最终结果按照标注者投票所获得。
进一步的,所述步骤S3.庭审过程多模态信息的抽取与拓展,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011103541.9/2.html,转载请声明来源钻瓜专利网。