信息混淆防御

1. 防御描述

在保证AI模型输出结果正确性的前提下,尽可能地干扰输出结果中包含的有效信息,从而减少隐私信息的泄露。

2. 防御流程示意图

模型逆向攻击

流程:

​ 建立一个标签映射表,将原始的标签映射到修改后的标签。这个映射关系应该是随机的,确保攻击者无法通过简单的规律来猜测标签的变化。

3. 指标情况

数据集 模型 原始模型准确率 逆向数据训练的模型准确率
CIFAR-10 VGG-16 84.75% 11.04%
CIFAR-10 ResNet-20 81.83% 10.81%
MNIST VGG-16 99.46% 4.31%
MNIST ResNet-20 99.30% 10.90%

4. 效果展示

逆向MNIST数据集