[发明专利]面向有无人协同场景的类人语言描述表达方法有效
申请号: | 202210078643.2 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114417807B | 公开(公告)日: | 2023-09-22 |
发明(设计)人: | 耿虎军;高晓倩;楚博策;王梅瑞;张文宝;韩长兴;高峰;陈勇;刘洪超 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所 |
主分类号: | G06F40/186 | 分类号: | G06F40/186;G06F40/242;G06F40/284;G06F18/22;G06F21/60 |
代理公司: | 河北东尚律师事务所 13124 | 代理人: | 王文庆;曲佳颖 |
地址: | 050081 河北省石家庄市中山西*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 无人 协同 场景 人语 描述 表达 方法 | ||
1.一种面向有无人协同场景的类人语言描述表达方法,其特征在于,包含以下步骤:
(1)获取有无人协同场景下的语料或数据库,根据语料或数据库总结出模板库;
(2)当有新消息产生时,获取生成消息的关键数据,根据关键数据以核心谓词为中心,在模板库中选择出匹配度满足预定条件的模板;
(3)预设词汇选择规则,对关键数据进行词汇选择,结合选定的模板,将选择的词汇填入模板中形成初级描述语句,并对初级描述语句中的重复成分进行替换操作,生成有无人协同场景下互操作使用的类人描述语言;
(4)构建隐语词典,通过隐语词典对生成的类人描述语言进行隐语式处理,生成加密之后的消息内容;
其中,步骤(1)具体包括以下过程:
(101)对语料中挑出的设定部分句子进行核心谓词类型标注,并采用聚类方法将挑选出的句子进行核心谓词类型分类,然后进行人工校验,调整不满足要求的句子分类,建立句型类别训练集,利用句型类别训练集训练深度学习模型,并使用训练好的深度学习模型对剩余句子进行分类,形成语料库的句型分类,对每类句型进行模板总结,形成模板库;
(102)在语料覆盖不满足要求时,根据现有的数据库对模板库进行补充,依据数据库字段之间的逻辑关系,从文档、段落和句子三层结构构建有无人协同场景下类人语言表达模板库;
其中,步骤(2)中在模板库中选择出匹配度满足预定条件的模板,具体包括以下过程:
在进行消息生成时,如果关键数据中的字段值含有核心谓词,则根据关键数据中的核心谓词选择句型模板;如果关键数据中的字段值不含有核心谓词,则根据字段值的名词语义类别直接指定核心谓词,然后以指定的核心谓词进行分类和模板匹配。
2.根据权利要求1所述的面向有无人协同场景的类人语言描述表达方法,其特征在于,步骤(3)中在对重复成分进行替换操作时,替换操作包含指代和省略。
3.根据权利要求1所述的面向有无人协同场景的类人语言描述表达方法,其特征在于,根据字段值的名词语义类别直接指定核心谓词,具体方法为:统计语料中和关键数据中的名词语义同时出现的谓词及其概率,选择概率最大的谓词作为核心谓词。
4.根据权利要求1所述的面向有无人协同场景的类人语言描述表达方法,其特征在于,步骤(4)中构建隐语词典,采用两种方法相结合的方式,第一种,从原有隐语中直接继承;另一种,根据汉语造词规律,使用已有的秘密语语素创造新的隐语词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所,未经中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210078643.2/1.html,转载请声明来源钻瓜专利网。