[发明专利]一种开源软件许可证条款自动提取方法有效
申请号: | 202110619980.3 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113268714B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 张自力;王志强;唐明;伍胜;刘志有 | 申请(专利权)人: | 西南大学 |
主分类号: | G06F21/10 | 分类号: | G06F21/10;G06F21/12 |
代理公司: | 重庆纵义天泽知识产权代理事务所(普通合伙) 50272 | 代理人: | 舒梦来 |
地址: | 400715*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 软件 许可证 条款 自动 提取 方法 | ||
本发明公开了一种开源软件许可证条款自动提取方法,该方法主要包含以下三个步骤:(1)许可证建模,采用主题分析方法完成许可证条款的确定;(2)许可证主题挖掘,利用隐含狄利克雷分布主题模型完成许可证主题提取;(3)主题与条款匹配,建立主题与条款之间的对应关系;最终将得到对应的许可证条款。本发明提供的方法能够有效提取包含在许可证中的条款,帮助开发人员快速了解许可证允许或禁止做什么。
技术领域
本发明涉及软件工程技术领域,具体涉及一种开源软件许可证条款自动提取方法。
背景技术
云计算、大数据是“新基建”和新兴产业战略性发展的强劲引擎,其中开源已经成为云计算创新发展的关键手段,云计算、大数据、移动互联这些支撑互联网发展的技术都是基于开源软件构建的。开源软件的开发是社区成员协同合作的成果,这种开发模式极大地促进了软件行业的发展,为云计算核心技术革新、生态多元共治提供了便利。
开源软件协作开发的方式打破了传统软件开发的封闭模式,但也带来了新的问题和挑战。为了保护开源软件中包含的知识产权和规范开源软件的使用,开源许可证应运而生。开源许可证以法律的形式对受版权法保护的开源软件的使用、复制、修改和分发行为进行规范。开源许可证在很大程度上影响软件的重新发布或商业化,并且可以为软件提供保护,防止他人对自己的开源代码进行非法的商业使用。
目前,开源软件中已存在的相关许可证超过2600个,但经OSI批准的许可证仅有121个。不同的开源许可证在原作品及衍生作品是否必须要按照原许可证发布、是否必须公开作品源代码、是否授予专利权等方面有着不同的规定。种类繁多的开源许可证给开发者对开源许可证的理解和使用带来了巨大的挑战。并且许可证文本内容晦涩难懂,专业的法律条款描述使得开发者在对接收者的责任和义务理解容易出现偏差。这些潜在的问题导致接收者易因错误理解许可证条款而违约。例如,2018年谷歌公司与甲骨文公司关于JAVAAPI(应用程序接口)的版权案件,以及2019年中国GPL第一案“柚子案”。因此,正确理解许可证内容对于开源软件的合规使用有着重要的指导意义。目前虽然已经有很多的研究人员对主流许可证进行解读与建模,但现有的方法主要是通过手工的方式对许可文本进行分析,并且主要围绕主流的几种许可证进行分析,不利于模型的泛化能力。为了帮助开发者能够快速理解更多的开源许可证内容,自动提取许可证条款的研究将变得十分必要。
发明内容
本方案的目的在于提供一种开源软件许可证条款自动提取方法,以帮助开发者在不阅读许可文本的情况下了解许可中包含的权利和义务。
为了达到上述目的,本方案提供一种开源软件许可证条款自动提取方法,包括如下步骤:第1步:构建许可证模型并提取条款;第2步:训练许可证主题模型并提取主题;第3步:建立主题与条款之间的对应关系;第4步:获取许可证条款并表示许可证。
进一步,所述第1步中构建许可证建模并提取条款,具体为:步骤1-1:选取用于构建许可证模型的许可证文本,提取许可证基本信息、条款和条件的内容和使用许可证的说明;步骤1-2:分析许可证中的句子含义并提取关键条款,将条款编码成相应的主题;步骤1-3:创建主题术语并描述条款的特征;步骤1-4:判断得到的条款类别;若条款为许可证允许开发者做的所有条款,所述条款类别为权利;若条款为开发者分发作品时必要遵守的所有条款,所述条款类别为义务;若条款为开发人员需要额外遵守的所有附加条款,所述条款类别为限制;步骤1-5:交叉验证步骤1-4中的许可证条款;步骤1-6:存储表示同一条款的许可证文本句子,形成许可证条款文档。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南大学,未经西南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110619980.3/2.html,转载请声明来源钻瓜专利网。