model extraction相关论文汇总(部分)
【论文笔记】Data-Free Model Extraction(CVPR 2021)

【论文笔记】Data-Free Model Extraction(CVPR 2021)

(还不是很完善orz)

本文证明并解决了现有model extraction对数据集的依赖(依赖于替代数据集与实际训练集的相似性),并且在目标模型以black box形式被访问的条件下,提出了data-free的model extraction攻击,称为data-free model extraction (DFME)。DFME中采用了data-free knowledge transfer中的一些技术。

  • ⭕利用GAN网络来训练攻击模型,其中一个generator负责生成训练数据,另一个student model来学习目标模型在这些数据上的行为(做到data free)
  • ⭕使用$l_1$范式损失函数(防止梯度消失)
  • 使用零阶优化(前向差分法)来逼近梯度(解决目标模型是个black box,无法获知其真实梯度的问题)
  • ⭕从概率向量中还原目标模型的logits
阅读更多