HuggingFace Trainer 학습이 중간에 끊겼을 때

2024. 2. 25. 02:04 · Python 및 Torch 코딩 이모저모
trainer.train('output/checkpoint-169862')

 

trainer 로 돌렸을 때 중간에 피치 못 할 사정으로 학습이 끊겼다면

 

위와 같이 원래 돌렸던 output_dir 의 checkpoint 파일을 같은 설정으로 trainer.train() 에 넣어주면 체크포인트를 저장한 epoch (이나 step) 부터 다시 돌기 시작한다!

 

→ optimizer 정보를 저장해두는 것이 중요한데, 이 정보는 trainer 에서 자동으로 저장이 된다.

checkpoint-###### 파일에서 global_step###### 파일 안에 optim_states.pt 파일 제목으로 저장된다.

 

'Python 및 Torch 코딩 이모저모' 카테고리의 다른 글

vLLM  (0) 2024.05.19
Pdb 디버깅  (0) 2024.03.09
HuggingFace OSError: You are trying to access a gated repo.Make sure to request access at 에러  (0) 2024.01.24
Parallelism  (0) 2023.11.07
리눅스에 파이썬 새로운 버전 설치하기!  (0) 2023.10.25
'Python 및 Torch 코딩 이모저모' 카테고리의 다른 글
  • vLLM
  • Pdb 디버깅
  • HuggingFace OSError: You are trying to access a gated repo.Make sure to request access at 에러
  • Parallelism
섬섬옥수수
섬섬옥수수
컴공 AI 개발자가 되기 위한 노역입니다
아날로그 인간의 컴공 되기컴공 AI 개발자가 되기 위한 노역입니다
섬섬옥수수
아날로그 인간의 컴공 되기
섬섬옥수수
전체
오늘
어제
  • 분류 전체보기
    • 백준 단계별 코딩 테스트
    • KB 논문 정리
    • Memory network 논문 정리
    • LLM 관련 논문 정리
    • Python 및 Torch 코딩 이모저모
    • Clustering 관련 논문 정리
    • 머신러닝 이모저모
    • 암호학

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

인기 글

태그

  • dependency tree
  • e5-v
  • eeve
  • 코딩테스트
  • 티스토리챌린지
  • CUDA
  • efficient and effective vocabulary expansion towards multilingual large language models
  • 백준
  • 심재형
  • 문제풀이
  • GIT
  • constituency tree
  • 인공지능융합기반시스템개론
  • 이화여대
  • 하드웨어
  • 소프트웨어
  • PEFT
  • ragas
  • 오블완
  • vocabulary expansion

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.0
섬섬옥수수
HuggingFace Trainer 학습이 중간에 끊겼을 때
상단으로

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.