Cloud Run과 같은 서버리스 환경을 처음 접하는 엔지니어들이 흔히 갖는 선입견 중 하나는 “온디맨드로 자원을 쓰면 오히려 더 비싸지 않을까?”라는 의구심입니다. 이런 오해가 생기는 데는 몇 가지 이유가 있습니다. 먼저 기존 온프레미스나 VM 기반 환경에서는 월정액 혹은 연 단위 고정 비용에 익숙하다 보니 사용량에 따라 비용이 유동적으로 변하는 구조 자체가 낯설고 예측하기 어렵게 느껴지기 때문입니다.
다음으로 트래픽이 급증할 때 인스턴스가 자동으로 확장되는 스케일아웃(Scale-out) 기능이 오히려 “예상치 못한 비용 폭탄”으로 이어질 수 있다는 막연한 두려움도 한몫합니다. 마지막으로 서버리스 서비스의 단위 요금이VM의 시간당 요금보다 상대적으로 높아 보이다 보니 단순 비교만으로는 서버리스가 비싸 보이는 착시가 생깁니다. 관련해 이번 포스팅에서는 비용 걱정 없이 서버리스의 이점을 누릴 수 있는 Cloud Run의 요금제와 운영 단계에서 비용을 최적화하는 방법에 대해 알아보겠습니다.
과금 방식과 모델
Cloud Run은 사용량 기반 과금(Pay-as-you-go) 방식을 채택하고 있어, 피크 타임을 대비해 자원을 미리 선점해 둘 이유가 전혀 없습니다. 트래픽이 몰릴 때는 자동으로 확장(Scale-out)하고 요청이 없으면 인스턴스 수를 0까지 줄이는(Scale to zero) 기능을 통해 유휴 자원 낭비를 원천적으로 차단할 수 있습니다. 다만 Cloud Run 안에서도 서비스의 비즈니스 로직과 트래픽 특성에 따라 어떤 과금 방식을 선택하느냐에 따라 최종 청구서에 적힌 숫자가 크게 달라집니다. 구글 클라우드는 서비스의 트래픽 패턴에 따라 두 가지 핵심 과금 모델을 제공합니다.
- 요청 기반 과금: 인스턴스가 실제로 요청을 처리하는 동안에만 비용이 발생합니다. 트래픽이 산발적이거나 급격히 변동하는 서비스에 적합하며 요청이 없는 시간에는 비용이 거의 발생하지 않는 Cloud Run의 기본(default) 방식입니다.
- 인스턴스 기반 과금 (CPU 항상 할당): 요청 유무와 관계없이 인스턴스의 전체 생명주기 동안 비용이 발생합니다. 단순히 단가 측면의 이점 외에도 요청 처리 외 시간에도 CPU를 자유롭게 활용할 수 있다는 것이 핵심입니다. 덕분에 OpenTelemetry 같은 백그라운드 모니터링 에이전트 운용, 비동기 처리, 혹은Go의 Goroutine이나 Node.js async 같은 프레임워크를 활용한 복잡한 워크플로 처리가 가능해집니다.
두 모델 중 어느 쪽이 경제적인지는 서비스의 트래픽 패턴을 기준으로 판단합니다. 트래픽이 꾸준하고 유휴 인스턴스가 적은 서비스라면 인스턴스 기반 과금이 반대로 트래픽이 산발적이거나 유휴 시간이 긴 서비스라면 요청 기반 방식이 정답입니다. 구글 클라우드 요금 계산기를 활용하면 실제 트래픽 데이터를 대조하여 어떤 모델이 비용 구조를 획기적으로 개선할지 직접 비교해 볼 수 있습니다.
AI 기반의 지속적인 비용 최적화
Cloud Run을 도입할 때 과금 모델을 신중하게 선택했더라도 시간이 지나면서 서비스의 트래픽 패턴은 바뀌기 마련입니다. 처음에는 트래픽이 산발적이어서 요청 기반 과금이 맞았던 서비스가 이용자가 늘면서 트래픽이 꾸준해지면 인스턴스 기반으로 바꾸는 것이 더 경제적일 수 있습니다. 즉, 비용 최적화는 처음 한 번의 설정으로 끝나는 것이 아니라 서비스가 성장하는 동안 계속 점검하고 조정하는 과정입니다.
예전에는 엔지니어가 직접 수많은 지표를 들여다보며 수작업으로 점검해야 했지만 이제는 생성형 AI가 강력한 무기가 됩니다. 구글 클라우드 콘솔의 Recommender 기능으로 비용 최적화도 AI 기반으로 수행할 수 있습니다. 이 기능은 지난 한 달간의 실제 트래픽 데이터를 자동으로 분석하여 과금 모델 전환이 비용 절감에 유리할 경우 이를 추천해줍니다. 이를 통해 엔지니어는 데이터에 기반한 의사결정을 내릴 수 있으며 앱 업데이트 없이도 정책이나 매개변수를 실시간으로 조정하는 것과 같은 유연한 운영이 가능해집니다.
서버리스의 이점을 누리자!
비용 걱정에서 벗어나면 비로소 서버리스의 진짜 가치가 보이기 시작합니다. 인프라 관리에 쏟던 시간과 자원을 서비스 개발과 품질 개선에 집중할 수 있고 자동 확장과 축소 기능 덕분에 운영 부담도 크게 줄어듭니다. 결국 워크로드 유형에 적합한 과금 모델 선택과 지속적인 비용 최적화를 하면 서버리스 이점을 제대로 누릴 수 있게 됩니다.
더 자세한 Cloud Run 과금 방식과 비용 최적화 방안이 궁금하다면, 메가존소프트 문의포탈을 통해 궁금한 부분을 남겨주세요.




