MLOps 인프라의 중요성

AI 서비스는 단순히 모델 개발로 끝나지 않습니다. 실제 서비스로 운영되기 위해서는 데이터 관리, 모델 패키징, 배포, 모니터링, 재학습까지 이어지는 전 라이프사이클 관리가 필수적입니다. 따라서 AI 인프라를 어떻게 설계하고 운영하느냐가 곧 서비스의 경쟁력이 됩니다.
롯데는 이러한 인프라를 End-to-End로 안정적이고 유연하게 운영하기 위해 다음 세 가지 전략을 기반으로 접근하고 있습니다.
1) 핵심 역량 내재화
GPU 자원 관리부터 웹 서비스 기술까지, AI 인프라에 필요한 기술을 내부에서 직접 확보
2) 자체 플랫폼 개발
데이터 수집, 모델 학습/배포, AutoML까지 단계별 플랫폼을 직접 구축해 활용
3) 검증된 오픈소스 도구 활용
Kubernetes, Istio, Prometheus 등 오픈소스를 환경에 맞게 통합하여 비용 효율성과 확장성 확보
이를 통해 AI 서비스 전 주기를 포괄하는 End-to-End AI 인프라를 구축하고 있습니다.
Last updated