-
torchtitan공부/pytorch 2024. 5. 17. 14:12반응형
- 대규모 LLM 학습을 가능하게 하는 라이브러리
- Megatron이나 Deepspeed 등과도 호환
- 구현의 단순성과 확장성에서 강점
- FSDP2와 개별 파라미터 샤딩: 파라미터 단위로 샤딩을 진행하여 메모리 효율성을 높입니다.
- 텐서 병렬 처리: 복수의 GPU에서 모델 파라미터를 분할하여 계산합니다.
- 분산 체크포인팅 및 선택적 계층 체크포인팅: 효율적인 메모리 관리와 복구를 위한 기능입니다.
- 텐서보드를 통한 학습 모니터링: 학습 과정을 실시간으로 모니터링할 수 있습니다.
https://discuss.pytorch.kr/t/torchtitan-llm-pytorch/4225
torchtitan, 대규모 LLM 학습을 위한 PyTorch 공식 라이브러리
:pytorch:PyTorchKR🇰🇷 최근 다양한 기업들이 PyTorch Foundation에 합류하면서 새로운 기능과 라이브러리들이 쏟아지고 있습니다. 오늘 소개하는 torchtitan은 큰 규모의 LLM을 효과적으로 학습할 수 있는
discuss.pytorch.kr
반응형'공부 > pytorch' 카테고리의 다른 글
import datasets (0) 2023.03.06 DataLoader - num_workers (0) 2023.02.06 LogSoftmax (0) 2023.02.02 [PyTorch] nn.Linear (0) 2023.02.02