에이전틱 AI 시대, Vertex AI로 다양한 모델을 활용하는 방법

생성형 AI를 넘어 이제 에이전틱 AI(Agentic AI)가 시장의 화두로 등장했습니다. 물론 AI 에이전트를 배포해 업무의 자동화와 지능화를 본격적으로 추진하고 있는 곳은 많지 않습니다. 하지만 관심은 매우 높습니다. 이번 포스팅에서는 이러한 에이전틱 AI 시대에 기업이 어떻게 AI 에이전트를 활용해 경쟁 우위를 만들어 갈 수 있는지 그리고 이를 위해 다양한 모델을 구글 클라우드 환경에서 어떻게 활용할 수 있는 지에 대해 알아보겠습니다.

멀티 모델을 쓰는 이유

멀티 AI 에이전트 운영에 있어 다양한 모델 활용이 필요하다고 전문가들이 말하는 이유는 무엇일까요? 얼마 전까지만 해도 거대 언어 모델(LLM) 하나가 모든 문제를 해결해 줄 것이라 믿었지만 현실은 달랐습니다. 마치 소프트웨어 아키텍처가 거대한 모놀리식에서 유연한 마이크로서비스로 진화했듯이 AI 모델 역시 역할 분담 쪽으로 나아가고 있습니다.

예를 들어 다양한 기능과 목적의AI 에이전트를 배포해 운영하는 환경에서 전체 계획을 수립하는 오케스트레이터 역할은 Gemini 1.5 Pro나 Claude 3.5 Opus 같은 고성능 모델이 맡습니다. 데이터 추출이나 코딩 같은 실무는 각 분야에 특화된 모델이 수행합니다. 이렇게 역할을 나누면 각 모델이 가장 잘하는 일에 집중하게 되어 성능은 올라가고 교차 검증을 통해 환각 현상은 줄어듭니다. 또한, 질문에 따라 적합한 모델로 처리하는 라우팅 방식을 적용하면 운영 비용도 절감할 수 있습니다.

다양한 모델 활용의 복잡성에서 벗어나기

그렇다면 다양한 모델을 구글 클라우드 환경에서는 어떻게 효율적으로 관리할 수 있을까요? 답은 Vertex AI에 있습니다. 사용자는 Vertex AI라는 단일 창구를 통해 구글의 Gemini 시리즈나 Imagen 같은 자체 모델뿐만 아니라 Anthropic의 Claude, Mistral AI, 그리고Meta의 Llama나 DeepSeek 같은 오픈 소스 모델까지 모두 접근할 수 있습니다.

구글 클라우드의 Vertex AI는 다양한 모델들을 활용하는 두 가지 경로를 제시합니다. 하나는 완전 관리형 서비스인 Vertex AI MaaS(Model as a Service)이고 다른 하나는 Vertex AI Model Garden을 통해 사용자가 직접 인프라와 플랫폼을 관리하는 방식입니다. 이 두 경로는 필요와 조건에 맞게 선택하면 됩니다.

신속한 프로젝트 추진이 필요하다면 MaaS가 최선

MaaS는 인프라 관리 없이 API 호출만으로 최신 모델을 활용하는 방식입니다. GPU 프로비저닝이나 드라이버 설치, 오토스케일링 같은 복잡한 과정은 구글이 모두 맡는 완전 관리형 서비스입니다. 따라서 개발자는 모델 활성화 버튼 하나로 즉시 개발을 시작할 수 있어 제품 출시 속도를 획기적으로 단축할 수 있습니다.

초기 개발 단계나 프로토타이핑이 필요할 때나 인프라 운영 인력이 부족한 스타트업의 경우 MaaS는 좋은 선택이 될 수 있습니다. 사용한 만큼만 비용을 지불하는 종량제 방식이라 경제적이며 보안과 규제 준수 관련 기능이나 서비스를 따로 설정할 필요 없다는 것도 큰 매력입니다.

정밀한 제어와 최적화가 필요하다면 직접 배포가 최선

커스텀 모델이 필요하거나 인프라에 대한 정밀한 제어가 필요하다면 Vertex AI Model Garden을 사용한 원클릭 배포를 활용하는 것이 답입니다. MaaS와 이 방식의 가장 큰 차이는 사용자가 직접 GPU, TPU 하드웨어 자원을 선택할 수 있다는 것입니다.

사용자가 직접 구글 클라우드가 제공하는 GPU나 TPU 같은 하드웨어 자원을 선택하여 성능과 비용을 세밀하게 조절할 수 있습니다. 또한, Vertex AI Model Garden은 사전에 빌드한 컨테이너도 제공합니다. 이를 활용하면 더 높은 수준의 제어권이 사용자에게 주어집니다. 직접 파인튜닝한 모델을 배포해야 하는 경우 컨테이너 기반 서빙이 좋은 선택이 될 수 있습니다. 사용자는 다음과 같은 두 가지 옵션으로 컨테이너를 배포할 수 있습니다.

사전 빌드 된 최적화 컨테이너(Pre-built Optimized Container): 별다른 최적화 작업 없이도 컨테이너를 그대로 배포하기만 해도 고성능의 이점을 누릴 수 있는 반면에 환경 변수나 실행 옵션 같은 것을 원하는 데로 최적화할 수 없습니다.
사용자 정의 컨테이너(Custom Container): 어떤 모델이건, 어떤 프레임워크이건 원하는 대로 패키징하고 각종 설정을 원하는 데로 모두 할 수 있는 옵션입니다.

최고가 아닌 최적의 선택이 필요

정리하자면 에이전틱 AI 시대의 경쟁력은 얼마나 똑똑한 모델을 쓰느냐가 아니라 얼마나 다양한 모델을 효율적으로 조율하느냐에 달려 있습니다. 최고의 방법은 없습니다. 조직 상황에 맞는 최적의 방법만 있을 뿐입니다. 살펴본 바와 같이 구글 클라우드 환경에서는 Vertex AI를 구심점으로 다양한 조건과 목표에 맞게 멀티 모델을 활용할 수 있습니다.

Vertex AI로 다양한 모델을 활용하고 싶다면 메가존소프트 문의포탈을 통해 궁금한 부분을 남겨주세요.

에이전틱 AI 시대, Vertex AI로 다양한 모델을 활용하는 방법

Related Posts