ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • SwiftThief: Enhancing Query Efficiency of Model Stealing by Contrastive Learning
    Seminar/IJCAI 2024 2024. 8. 13. 13:58
    반응형

    초록

     

    AI 기반 서비스에 대한 위협은 공격자가 정규 쿼리 기반 접근을 통해 서비스 내부의 블랙박스 AI 모델의 기능을 복제할 수 있기 때문입니다. 탐지나 쿼리 비용을 피하기 위해, 모델 탈취 공격자는 정확한 클론 모델을 얻기 위해 쿼리의 수를 최소화해야 합니다. 이를 달성하기 위해 우리는 쿼리된 데이터와 쿼리되지 않은 데이터를 모두 활용하여 쿼리 복잡성을 줄이는 새로운 모델 탈취 프레임워크인 SwiftThief를 제안합니다. 특히, SwiftThief는 표현 학습을 위한 최신 기술인 대조 학습(Contrastive Learning)을 사용합니다. 우리는 모델 탈취를 위한 새로운 목적 함수를 공식화하였으며, 이는 공공 데이터셋에서의 풍부한 쿼리되지 않은 입력에 대한 자가 지도 학습(self-supervised learning)과 쿼리된 입력에 대한 소프트 지도 학습(soft-supervised learning) 대조 손실을 포함하고, 쿼리된 입력에 대한 출력 일치 손실과 함께 최적화됩니다. 또한, 우리는 공격 성능을 향상시키기 위해 자주 쿼리되지 않는 클래스에 우선 순위를 부여하는 새로운 샘플링 전략을 제안합니다. 실험 결과, SwiftThief는 기존 방법에 비해 쿼리 예산의 절반만 사용하여 유사한 공격 성능을 달성할 수 있었으며, 방어 메커니즘이 활성화된 경우에도 높은 성능을 보였습니다.

    반응형

    'Seminar > IJCAI 2024' 카테고리의 다른 글

    Natural Language Processing  (2) 2024.08.13
    Knowledge Representation and Reasoning  (1) 2024.08.13
    Data Mining  (0) 2024.08.13
    On the Effects of Fairness to Adversarial Vulnerability  (0) 2024.08.13
Designed by Tistory.