Abstract

existing attack our attack
detect 99.33% 100%
defense 92% 95.33%

Introduction

A. Motivation

  1. modified pixel을 human은 인지 못하고 DNN은 attack하게 하도록 하는 게 목적
  2. black-box 환경에서 efficent detection method를 만드는게 목표
  3. adversial image까지도 original image로 분류할 수 있게 defense method를 제안하는 것

기존 adversial defend하는 방법

→ add noise to the image using a patch selectiong denoiser