AI 추론
추론(Inference)

추론이란?
이미 학습을 마친 AI가 실제 상황에서 판단하고 결과를 내놓는 과정
학습 때 익힌 지식을 바탕으로 새로운 데이터에 대한 답변 제공
일상생활 예시
의사가 실제 환자의 X-ray를 보고 진단하는 것과 유사
운전면허를 딴 후 실제 도로에서 운전하는 것
주요 특징
✅ 상대적으로 적은 컴퓨팅 파워: 학습보다는 적지만 여전히 GPU 필요
✅ 빠른 응답 시간: 사용자는 빠른 응답을 기대함 (보통 수 초 이내)
✅ 24시간 가동: 서비스가 항상 제공되어야 함
✅ 안정성 중요: 오류 없이 일관된 결과 제공 필요
GPU 사용량 예시
대형 AI 모델 추론 시
ChatGPT 대화 1회: 1~4대의 GPU 사용 (일시적)
사용자 100명 동시 이용: 수십~수백 대 GPU 필요
중소형 AI 모델 추론 시
이미지 인식 1회: GPU 일부만 사용
경우에 따라 CPU만으로도 가능한 경우 존재
Last updated