Databricks Data Intelligence Day 2025 후기 1편 – MLflow × Unity Catalog로 구현한 중고나라의 자동화된 모델 서빙 환경
이 글은 Databricks Data Intelligence Day 발표 중
‘중고나라의 더 간편하고 자동화된 모델 서빙 환경을 위한 MLOps 구축기 with Databricks’ 세션을 바탕으로 작성되었습니다.
작성한 내용에 문제가 있을 경우 알려주시면 즉시 수정 또는 삭제하겠습니다.
중고나라 ML팀이 어떻게 MLflow와 Unity Catalog를 활용해
모델 서빙 환경을 자동화하고 효율성을 높였는지에 대한 실전 사례가 소개되었습니다.
특히, 기존 AWS 기반 환경에서 Databricks 플랫폼으로의 전환 과정을 중심으로
데이터 관리, 모델 실험, 배포, 드리프트 대응까지 어떻게 체계화했는지를 자세히 다룹니다.
목차
- 중고나라 ML팀의 역할
- 플랫폼 전환: AWS → Databricks
- MLflow와 Unity Catalog 활용
- 모델 배포 및 드리프트 대응
- Champion-Challenger 전략
- 마무리
중고나라 ML팀의 역할
중고나라 ML팀은 다음과 같은 모델을 운영 중입니다:
- 게시글 검수 자동화
- 사기 탐지 모델
- 고객 신뢰지수 산출
플랫폼 전환: AWS → Databricks
기존 AWS 기반에서 Databricks로 전환하면서 경험한 변화는 다음과 같습니다:
- 서빙 하드웨어로 Inferentia 사용 → SageMaker의 다양한 기능 활용에 제약
- 통합 분석 환경과 드리프트 탐지 설계 난이도 높음
→ Databricks (UC + managed MLflow) 중심으로 전환
MLflow와 Unity Catalog 활용
- Managed MLflow로 실험 관리
- Unity Catalog Volumes를 임시 저장소 및 Model Registry로 사용
- 모델 이름 규칙:
카탈로그.환경.모델명
(e.g. my_model_registry.production.my_model.name) - Delta Table → Transformer Dataset으로 변환
모델 배포 및 드리프트 대응
MLflow와 FastAPI 조합으로 모델을 서빙하고, 다음 전략으로 Drift에 대응:
- RDB vs Opensearch → UC 내 작업 자동화
- 재학습 후 Databricks에서 배포 자동화
Champion-Challenger 전략
모델 버전 관리는 MLflow의 Alias 기능을 적극 활용:
@alias
로 모델 로드 (예:@Champion
,@Challenger
)- 테스트 환경에서는
Challenger
사용 → 통과 시Champion
으로 승격 - 프로덕션 환경에서는
Champion
모델 사용
마무리
중고나라의 발표는 단순한 기술 소개를 넘어서, 실전 서비스에 가까운 MLOps 설계를 보여주었습니다. MLOps 구축을 고민하는 팀에 좋은 참고 사례가 될 수 있을 것 같습니다.
MLflow의 Alias 기능은 알고 있었지만 어떤 식으로 사용하는지에 대한 자세한 사례는 처음이라, 나중에 실제로 적용해볼 수 있다면 좋겠습니다.
모델 이름 규칙의 예시도 처음 봤고 모델 드리프트 라는 것도 처음 들어본 개념이어서, 실제 MLOps 문제들에 대해 더 알게되어 좋았습니다.
메달리온 아키텍처 라는 것을 사용한 사례가 많아서 따로 한 번 찾아서 공부해봐야겠습니다.
'IT' 카테고리의 다른 글
LLM 파인튜닝 실습을 위한 WSL 설치 (0) | 2025.05.07 |
---|---|
spark-operator 설치, prometheus 연동해서 metric 수집 (0) | 2025.04.11 |
쿠버네티스 클러스터에 프로메테우스 설치 (0) | 2025.04.10 |
옵시디언으로 무료 디지털 가든 만들기 (0) | 2025.02.10 |
내 컴퓨터에 달린 GPU로 LLM 모델 돌릴 수 있을지 계산해보는 사이트 (0) | 2025.01.22 |
댓글