[发明专利]一种基于二分类器的用于法律文本分类的特征工程方法在审
申请号: | 201910401645.9 | 申请日: | 2019-05-15 |
公开(公告)号: | CN110110087A | 公开(公告)日: | 2019-08-09 |
发明(设计)人: | 段强;李锐;尹青山 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33;G06F17/27;G06N20/00;G06Q50/18 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于二分类器的用于法律文本分类的特征工程方法,属于自然语言处理技术领域,本发明将以往的文本向量化的方法用于构建提取关键信息的二分类器,借由一系列的二分类器提取到的结果进一步构建机器学习所需的特征工程。这样做可以使文本中影响判决的关键信息特征化。而对于关键信息的判断,使用准确性较好的二分类器。然后通过不同特征的结合构建特征工程向量,可以得到一个对法律文本准确清晰的向量描述。最后可以使用已有的多分类器进行分类,得到的结果可以用来辅助法律判决、辅助法学研究等。 | ||
搜索关键词: | 二分类 法律文本 关键信息 构建 分类 文本 自然语言处理技术 多分类器 法学研究 机器学习 向量描述 判决 特征化 向量化 向量 清晰 法律 | ||
【主权项】:
1.一种基于二分类器的用于法律文本分类的特征工程方法,其特征在于,先将文本向量化的结果用在二分类模型的训练中,用二分类结果表示是否存在犯罪行为或者犯罪关键信息,然后构建出一个特征向量,进而用于法律文本的多分类任务中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910401645.9/,转载请声明来源钻瓜专利网。