信息混淆防御
1. 防御描述
在保证AI模型输出结果正确性的前提下,尽可能地干扰输出结果中包含的有效信息,从而减少隐私信息的泄露。
2. 防御流程示意图
流程:
建立一个标签映射表,将原始的标签映射到修改后的标签。这个映射关系应该是随机的,确保攻击者无法通过简单的规律来猜测标签的变化。
3. 指标情况
数据集 | 模型 | 原始模型准确率 | 逆向数据训练的模型准确率 |
CIFAR-10 | VGG-16 | 84.75% | 11.04% |
CIFAR-10 | ResNet-20 | 81.83% | 10.81% |
MNIST | VGG-16 | 99.46% | 4.31% |
MNIST | ResNet-20 | 99.30% | 10.90% |