-
ex_) MNSIT중 성능 가장 좋았던 모델의 정보는?
- 그 모델을 가져올수있는가 ? 아니면 다른 모델은 (ex 3번째)
-
validation → test dataset에서 성능이 떨어지는 경우
- 그전의 model을 가져와야함
- 과거의 모델을 재현해야함
-
혼자 할때는 할수도 있지만 다같이 협업하는 경우라면
-
각각의 개발환경이 다를경우 , 다른 OS, 다른 frame work등
-
하나의 컴퓨터를 공유해야 하는경우
-
대다수의 기업에서 기업 AI 프로젝트의 실패중임
-
다름 google에서 발표한 시스템 논문
- 아래와 같은 forward flow방식은 혼자 할때 가능하지만 협업은 불가능
- devOps 탄생
- dev + operation
- ML의 서비스 부분을 DevOps 부분에서 가져와서 사용
- 다양한 test 방법론을 사용해 자동화를 시킴
- Data의 분야가 다르다.
- 모델보다 Data가 더 중요하고 Data Centric AI 가 중요시 됌
- MLOps는 ML과 Ops를 통합하는 ML 엔지니어링 문화 방식
- MLOps를 수행하면 통합, test , 출시, 배포, 인프라 관리 비롯하여 ML 시스템 구성 단계에서 자동화 및 모니터링 지원 가능
- 데이터 수집, 저장, 관리
- 모델개발 : optuna, Ray ,katib - > 병렬학습 가능
- 모델 버젼 관리 : Git, MLflow, Github Action ⇒ CICD, Jenkins
- 모델 학습 스케쥴링 : kubernetes