[发明专利]一种基于BERT采样的文本通用触发器生成系统和方法有效
申请号: | 202111132324.7 | 申请日: | 2021-09-27 |
公开(公告)号: | CN113806490B | 公开(公告)日: | 2023-06-13 |
发明(设计)人: | 张雨;邵堃;杨俊安;刘辉;呼鹏江;王健 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06N3/0442;G06N3/08 |
代理公司: | 北京中睿智恒知识产权代理事务所(普通合伙) 16025 | 代理人: | 卢娇娇 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于BERT采样的文本通用触发器生成系统和方法,设置初始单词序列长度m及批次大小n,将初始单词序列复制n份得到n个单词序列,在其上随机选择第i个位置,将初始单词序列输入到BERT语言模型中,获得第i个位置单词的概率分布;采样一个单词y,将第i个位置的原始掩码符号替换为单词y,得到一批初始触发词序列,并连接到数据测试集的所有样本上,输入到目标模型进行测试;将测试结果传输到BERT采样模块,并调整单词分布概率,然后采样获得候选单词;继续将候选单词在除第i个位置外的其他位置上进行替换,直到目标模型的预测错误率达到设定值阈值以上,输出触发器序列。本发明具有效率高、质量好的优点。 | ||
搜索关键词: | 一种 基于 bert 采样 文本 通用 触发器 生成 系统 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111132324.7/,转载请声明来源钻瓜专利网。