본문 바로가기
  • Naked Code
알롬버스/스터디 문제 모음

[DL] Federated Learning(연합 학습) 문제

by bobmyeonsoo 2023. 8. 27.

1. 다음은 Federated Learning 알고리즘이다. 다음의 보기를 알고리즘 순서대로 나열하시오.

<보기>
(a) 그 weight를 다시 서버로 보냄
(b) 그렇게 모인 weight의 weighted sum을 취해 서버의 모델을 업데이트 
(c) 각 클라이언트 내에서 클라이언트들이 갖고 있는 로컬 데이터를 이용해 메인 모델을 학습
(d) k개의 클라이언트 중 m개를 고르고 → 메인 모델을 보냄
(e) 서버에 메인 모델 준비

 

 

2. 다음에 해당하는 개념을 <보기>에서 찾아 쓰시오.

완전 탈중앙 학습(Fully Decentralized Learning) 문제를 해결하기 위해 선택한 네트워크 형식이며, 네트워크의 모든 노드가 그래프 형태로 연결되어 있는 형태의 네트워크 형식
<보기>
ISDN(Integrated Service Digital Network), VAN(Value Added Network), P2P network(Peer-to-Peer), LAN(Local Area Network)

 

3. 다음 중 틀린 것을 모두 고르시오.

 

1. 연합 학습은 데이터는 공유하지 않으면서 모든 데이터셋을 학습한 글로벌 모델을 만드는 것이 목표이다. 

2. 연합 학습을 채택함으로써 병원의 임상 데이터와 같은 환자 개인정보가 보호되어야 하는 상황에서 데이터 유출 없이 학습이 가능하다는 장점을 갖고 있다. 

3. 연합 학습의 기본적인 아이디어는 중앙 서버에서 로컬 업데이트를 받아 메인 모델을 수정하는 방법인데 이는 단일 서버 모델이기 때문에 시스템 구성 요소 중에서, 동작하지 않으면 전체 시스템이 중단될 수 있는 "단일 장애 지점" 문제가 발생할 수 있다. 

4. 참여와 이탈이 자유로운 P2P 네트워크로 구성된 학습은 보안이 보장되어 있기 때문에 악의적으로 신뢰할 수 없는 데이터를 가지고 학습할 수 없다. 

5. 각각의 디바이스에서 생성되는 데이터는 완벽하게 글로벌 모델을 최적화하는데 어려움이 발생할 수 있기 때문에 각각의 사용자의 데이터 일부분을 중앙 서버에 제출해서 공용 데이터로 사용하도록 하는 방법이 거론된다. 

6. 연합 학습은 많은 딥러닝, 머신러닝 모델을 학습하기 위해 주로 big data를 기반으로 학습하는데 이런 데이터 수집 과정에서 개인 정보 보안 이슈를 줄이기 위해 고안되었다. 

7. 수 만개의 로컬 디바이스의 데이터를 모두 중앙 서버로 전송하게 되었을 때 네트워크 트래픽과 스토리지 비용이 감소하는데 효과가 있다. 

 

 

https://litt1eforest.tistory.com/20