[发明专利]基于场景描述的语义评价方法有效
申请号: | 201810429509.6 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108845983B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 马苗;王伯龙;武杰;郭敏;吴琦 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/30;G06F40/216 |
代理公司: | 西安永生专利代理有限责任公司 61201 | 代理人: | 申忠才 |
地址: | 710062 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于场景描述的语义评价方法,由分析英文句子的词性、用同义词库统计相关单词个数、确定5个英文语句与生成语句的相似度步骤组成。本发明通过对5个英文语句进行关键词提取,并为每个关键词关联同义词库,根据确定生成语句关键词与5个英文语句对应关键词同义库单词重复个数作为参考系数,确定两个语句相似度。本发明具有评价结果合理、实用性强、运算速度快等优点,可在场景描述评价技术领域应用。 | ||
搜索关键词: | 基于 场景 描述 语义 评价 方法 | ||
【主权项】:
1.一种基于场景描述的语义评价方法,其特征在于由下述步骤组成:(1)分析英文句子的词性1)从MSCOCO图像数据集中选取待场景描述的原始图像中的5个英文语句,5个英文语句记为S1,S2,S3,S4,S5;2)根据不同的文本描述生成模型,对所选取的原始图像进行场景描述,得到生成语句Sg;3)统计生成语句Sg中关键词个数,按照名词、动词、形容词与副词将生成语句Sg中所有关键词分成名词集合n1、动词集合v1、形容词与副词集合a1,各集合中单词的个数分别表示为Cn1、Cv1、Ca1;4)统计5个英文语句中关键词个数,按照名词、动词、形容词与副词将5个英文语句S1,S2,S3,S4,S5中的关键词分成n2i、v2i、a2i集合,各集合中单词的个数分别表示为Cn2i、Cv2i、Ca2i,i∈[1,5];(2)用同义词库统计相关单词个数1)用Thesaurus.com网站,分别对5个英文语句S1,S2,S3,S4,S5的关键词集合n2i、v2i、a2i中的单词查询同义词,得到相应同义词集合Set‑ni、同义词集合Set‑vi、同义词集合Set‑ai;2)分别确定生成语句Sg的关键词名词集合n1、动词集合v1、形容词与副词集合a1中的单词,与5个英文语句S1,S2,S3,S4,S5中的关键词n2i、v2i、a2i集合中的单词或相应同义词集合Set‑ni、Set‑vi、Set‑ai中单词的相同个数,即确定(n1∩n2i)∪(n1∩Set‑ni)、(v1∩v2i)∪(v1∩Set‑vi)、(a1∩a2i)∪(a1∩Set‑ai)三个集合中元素的个数,为Cn‑syni、Cv‑syni、Ca‑syni,i∈[1,5];(3)确定5个英文语句与生成语句Sg的相似度1)生成语句Sg与5个英文语句S1,S2,S3,S4,S5的词性相似度系数ki为:词性相似度系数ki取值范围[0,1];2)生成语句Sg与5个英文语句S1,S2,S3,S4,S5的语义相似度系数ji为:语义相似度系数ji取值范围[0,1];3)确定生成语句Sg与5个英文语句S1,S2,S3,S4,S5的语句相似度si为:相似度si取值范围[0,1];4)按下式确定生成语句Sg与5个英文语句S1,S2,S3,S4,S5的最大语句相似度:SimilarSyn=max{si} (4)。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810429509.6/,转载请声明来源钻瓜专利网。