[发明专利]一种众包设计资源的语义分析方法在审
申请号: | 202210543747.6 | 申请日: | 2022-05-19 |
公开(公告)号: | CN114970543A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 于树松;郭保琪;刘晓菲;石硕;丁香乾;杨宁;刘国敬;牛迪 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F40/268;G06F40/253 |
代理公司: | 青岛联智专利商标事务所有限公司 37101 | 代理人: | 王笑 |
地址: | 266100 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 设计 资源 语义 分析 方法 | ||
本发明公开了一种众包设计资源的语义分析方法,包括:步骤1、将众包设计资源短句进行词分隔和词性标注;步骤2、将步骤1处理后的短句切分为多个独立短句;步骤3、针对每个独立短句进行以下处理:依存关系分析、以并列关系和独立结构提取独立短句中的独立功能成分,针对每个独立功能成分构建多级语义模型;本发明将众包设计资源短句分词、进行词性标注、划分独立短句、针对每个独立短句划分独立功能成分、针对每个独立功能成分构建多级语义模型,从而将非结构化的自然语言短句描述转换为结构化的关系集合,实现了众包设计资源的统一建模,对后续的检索、匹配都具有重要的意义。
技术领域
本发明属于计算机数据处理技术领域,具体地说,是涉及一种众包设计资源的语义分析方法。
背景技术
众包设计资源在互联网众包平台上大多以文字、数字、图像数据混合表达,而众包服务自组织的特点使得设计资源之间的相关内容存在很大差异,要管理好设计资源,需要对其所涉及的相关服务内容进行结构化处理。
发明内容
本发明提出一种众包服务资源的语义分析方法,以互联网众包平台上的设计资源为研究对象,通过短语划分和依存关系分析,将众包设计资源划分为独立功能成分,针对独立功能成分进行多级语义表示,从而将非结构化的自然语言短句描述转换为结构化的关系集合,以实现众包设计资源的统一建模。
本发明采用以下技术方案予以实现:
提出一种众包设计资源的语义分析方法,包括:
步骤1、将众包设计资源短句进行词分隔和词性标注;
步骤2、将步骤1处理后的短句切分为多个独立短句;
步骤3、针对每个独立短句进行以下处理:
1)依存关系分析;
2)以并列关系和独立结构提取独立短句中的独立功能成分;
3)针对每个独立功能成分构建多级语义模型:
(1)遍历独立功能成分找到核心动谓词,以检测到的广义动宾关系得到一级语义;所述广义动宾关系包括直接宾语关系、间接宾语关系、前置宾语关系、核心动谓词与其支配的名词短语为状中关系、核心动谓词与其支配的名词短语为主谓关系、当核心动谓词的宾语缺失时以定中关系表达的修饰词;
(2)对一级语义中的谓词中心词和宾语中心词检测其修饰成分得到二级语义;
(3)对二级语义的中心词检测其修饰成分得到三级语义;
(4)将检测到的高于三级的语义成分补全到其隶属的中心词上。
进一步的,在步骤2中,通过空格、顿号、逗号和正反斜杆将短句切分为多个独立短句。
进一步的,以并列关系和独立结构关系提取独立短句中的独立功能成分,包括:
(1)当检测到的并列关系位于广义宾语修饰区域时,以核心动谓词为基础同等划分为两个独立功能成分;
(2)当检测到的并列关系位于核心动谓词之间时,同等划分为两个独立功能成分;
(3)当并列关系和独立结构同时存在时,若独立结构是动词性谓语且存在并列关系时,以所述独立结构的动词性谓语为基础同等划分为两个独立功能成分;若独立结构非动词性谓语时,不建立独立功能成分。
进一步的,针对每个独立功能成分构建多级语义模型,包括:
当检测到一级语义不存在核心宾语时,将其修饰部分视为其宾语,构建到一级语义中。
与现有技术相比,本发明的优点和积极效果是:本发明提出的众包设计资源的语义分析方法中,将众包设计资源短句分词、进行词性标注、划分独立短句、针对每个独立短句划分独立功能成分、针对每个独立功能成分构建多级语义模型,从而将非结构化的自然语言短句描述转换为结构化的关系集合,实现了众包设计资源的统一建模,对后续的检索、匹配都具有重要的意义。
结合附图阅读本发明实施方式的详细描述后,本发明的其他特点和优点将变得更加清楚。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210543747.6/2.html,转载请声明来源钻瓜专利网。