[Google Cloud Next '26 키노트] 에이전틱 엔터프라이즈의 도래, 구글은 AI 인프라를 어떻게 재설계했나?

2026년 구글 클라우드가 나아갈 방향과 고객과의 약속을 소개하는 행사인 Google Cloud Next ’26이 개최되었습니다.
작년 행사에서 에이전트의 가능성을 보여주었던 구글 클라우드는 올 해 어떤 메시지를 앞세우고 있을까요?
한 마디로 말하면 에이전틱 엔터프라이즈 구현을 위한 통합 스택은 이미 준비가 되어 있다(The Platform is Ready)로 요약할 수 있습니다.
Google Cloud Next ’26 기조연설에서 소개한 주요 내용을 토대로 파일럿 단계를 넘어 프로덕션 환경에서 ‘에이전틱 엔터프라이즈’를 어떻게 실현할 수 있는지 정리했습니다.

에이전틱 엔터프라이즈를 위한 ‘통합 스택’의 완성

토머스 쿠리안(Thomas Kurian) 구글 클라우드 CEO는 무대에 서자마자 질문을 던졌습니다. “AI를 기업 전체에 걸쳐 프로덕션으로 옮기려면 어떻게 해야 하는가?”
그의 답은 ‘통합 스택(Unified Stack)’이었습니다. 이 대목에서 우리는 다양한 유형의 AI 가속기, 모델, 데이터, 보안 도구를 이어 붙이는 방식으로는 에이전틱 엔터프라이즈를 실현할 수 있는 환경을 제공하기 어렵다는 구글 클라우드의 전략적 판단을 엿볼 수 있습니다.
올해 기조연설은 다섯 개 레이어로 구성한 에이전틱 엔터프라이즈의 기반 구조를 중심으로 진행되었습니다. 구글 클라우드가 제시하는 통합 스택은 AI Hypercomputer, Agentic Data Cloud, Agentic Defense, Gemini Enterprise Agent Platform, Agentic Taskforce로 구성됩니다. 각 레이어는 독립된 제품이라기 보다 다양한 요소가 유기적으로 연결되어 있습니다. 칩에서 모델, 데이터에서 보안, 플랫폼에서 생산성 도구까지 하나의 흐름으로 연결되는 수직 통합 아키텍처로 설계한 것이 바로 토머스 쿠리안 CEO가 힘주어 말한 통합 스택의 특징입니다.

구글이 직접 쓰고 검증한다, 혁신을 증명하는 ‘고객 제로(Customer Zero)’ 전략

구글 클라우드는 기술이나 제품을 판매하기 보다 경험을 공유하는 것으로 AI 전략의 차별화를 꾀하고 있습니다. 실제로 구글 클라우드는 구글의 다양한 글로벌 서비스에 최신 AI 관련 기술과 아이디어를 적용하고 실제 운영 환경에서 효용성과 가치를 검증한 기술 후 제품화합니다. 기조연설에서도 이점을 강조했습니다.

기조연설 초반에 ‘고객 제로(Customer Zero)’라는 표현이 등장했습니다. 이는 자사 기술을 가장 먼저, 가장 적극적으로 쓰는 사용자가 되겠다는 의미가 담긴 표현인데요. 그 예로 피차이 CEO는 개발, 보안, 마케팅 등 여러 사례를 소개했습니다. 가장 극적으로 변한 것은 코딩입니다. 구글 내부에서 생성하는 신규 코드의 75%를 AI가 작성하고 엔지니어가 승인합니다. 이는 단순한 코드 자동 완성 수준이 아닙니다. 구글은 기획자(Planner), 조율자(Orchestrator), 코더(Coder) 세 가지 역할을 맡는 에이전트 시스템을 구축해 대규모 코드 마이그레이션을 1년 전 대비 6배 빠르게 완료했다고 하네요.

보안 영역에서도 에이전트가 실전를 투입합니다. 보안 운영 센터(SOC) 에이전트가 매달 수만 건의 비정형 위협 보고서를 자동 분류합니다. 이를 통해 위협 대응 시간을 90% 이상 단축했습니다. CodeMender라는 자체 에이전트는 소프트웨어 취약점을 탐지하고 수정 코드까지 직접 작성합니다.

마케팅 분야의 사례도 있습니다. Gemini in Chrome 출시 캠페인에서 마케팅 팀은 수천 가지 크리에이티브 변형을 모델로 생성했습니다. 성과도 좋습니다. 전환율 20% 상승, 제작 기간 70% 단축이라는 결과를 거뒀습니다. 이 사례들을 소개한 이유는 무엇일까요? “이런 제품을 만들었다”보다 “이미 이런 방식으로 일하고 있다”를 강조하려 한 것 같습니다. AI를 ‘파는’ 회사가 아니라 ‘직접 쓰고 검증한 뒤 혁신의 경험을 공유하는’ 회사가 되겠다는 의지를 보여준 것이죠.

수천 개의 에이전트를 어떻게 통제할 것인가?

구글 내부의 혁신 사례를 소개한 후 기조연설의 주제는 자연스럽게 “에이전트를 만들 수 있느냐”가 아니라 “수천 개의 에이전트를 어떻게 관리하느냐”라는 질문으로 넘어 갔습니다. 이에 대한 답으로 피차이 CEO는 Gemini Enterprise Agent Platform을 소개했습니다. 해당 플랫폼은 에이전틱 엔터프라이즈 구현을 지원할 수 있도록 기존 Vertex AI를 재설계한 것입니다. 플랫폼의 기능과 역할이 확장된 것인데요 크게 에이전트를 구축하고(Build), 확장하고(Scale), 통제하고(Govern), 최적화하는(Optimize) 네 가지 요소를 중심으로 재설계했습니다. 각 요소에서 주목할 내용은 다음과 같습니다.

Build: 현업 사용자를 위한 로우코드 기반 Agent Studio와 전문 개발자를 위한 ADK를 함께 제공합니다. Agent Registry는 조직 내 모든 에이전트와 도구를 인덱싱하고 검색·거버넌스 대상으로 관리합니다.
Scale: 장기 실행 에이전트와 수천 개의 에이전트를 즉시 프로비저닝할 수 있는 에이전트 런타임을 지원합니다. 과거 상호작용 내용을 기억하는 Memory Bank가 에이전트에 장기적인 문맥 유지 능력을 부여합니다.
Govern: Agent Identity가 모든 에이전트에 고유 암호화 ID와 인가 정책을 부여합니다. Agent Gateway는 조직 전체의 정책 집행을 위한 중앙 통제 지점 역할을 합니다. 에이전트가 다른 에이전트에 작업을 위임하는 구조도 지원합니다.
Optimize: 실제 배포 전 가상 시나리오로 에이전트를 테스트하는 에이전트 시뮬레이션과 OpenTelemetry 호환 텔레메트리를 통해 에이전트 실행 경로 전체를 시각화하는 에이전트 관측성(Agent Observability) 도구를 제공합니다.

한편, MCP(Model Context Protocol) 네이티브 통합도 눈에 띕니다. 구글은 모든 구글 클라우드 서비스를 MCP 서버로 노출해 어떤 에이전트에서든 접근할 수 있습니다. 에이전트 마켓플레이스(Agent Marketplace)를 통해 Atlassian, Box, ServiceNow, Workday 등 파트너의 에이전트도 Gemini Enterprise 안에서 직접 배포할 수 있습니다. 실제 데모에서 Erica Chong은 가구 리테일러 시나리오를 통해 하나의 프롬프트로 시장 조사 에이전트, 데이터 인사이트 에이전트, 제품 전략 에이전트가 동시에 작동하는 모습을 보여줬습니다. 트렌드 분석부터 재고 매칭, 리브랜딩 전략 수립, 랜딩 페이지 제작, Jira 티켓 생성까지 한 번의 워크플로우로 연결됐습니다.

추론 비용과 속도를 잡아라! TPU 8i와 초거대 클러스터 인프라 전략

Gemini Enterprise Agent Platform이 ‘무엇을 어떻게 할 것인가’에 대한 답을 제시했다면 다음 질문은 자연스럽게 인프라로 이어집니다. 추론의 시대가 되면서 토큰을 얼마나 경제적으로 생성할 것인지에 대한 관심이 높아지고 있습니다. 이번 기조연설에서 AI Hypercomptuer를 소개하며 공개한 구글 클라우드의 추론 워크로드 처리 전략은 매우 선명합니다.

구글은 8세대 TPU에서 역사상 처음으로 훈련과 추론을 별도 칩으로 분리했습니다. 훈련 전용 TPU 8t와 추론 전용 TPU 8i의 투트랙 체계입니다. TPU 8t는 대규모 모델 훈련에 특화했습니다. MXU 내부에 블록 스케일 곱셈을 직접 배치해 VPU 오버헤드를 제거했고 이전 세대 대비 포드당 약 3배의 컴퓨팅 성능을 달성합니다. 칩 간 인터커넥트 대역폭은 Ironwood TPU 대비 2배이며 3D 토러스 토폴로지로 9,600개 TPU를 하나의 슈퍼포드로 연결합니다. FP4 기준 121 엑사플롭스의 컴퓨팅 파워를 제공하고 슈퍼포드 내 공유 고대역 메모리는 2 페타바이트입니다. 와트당 성능은 이전 세대 대비 2배 향상됐습니다. 임베딩 룩업 같은 불규칙한 메모리 접근을 처리하는 SparseCore 가속기도 탑재했습니다.

TPU 8i는 추론과 강화학습(RL)에 특화했습니다. 온칩 SRAM을 전 세대 대비 3배로 늘려 대규모 KV 캐시를 칩 위에 올렸습니다. 이른바 Memory Wall 문제를 해결한 것입니다. 전용 컬렉티브 가속 엔진이 레이턴시를 5배 줄이고, Boardfly 토폴로지로 1,152개 TPU를 단일 포드에 배치해 수백만 개의 에이전트를 거의 제로 레이턴시로 동시 구동합니다. 추론 기준 달러당 성능은 이전 세대 대비 80% 향상됐습니다.
네트워크 측면에서는 Virgo가 등장했습니다. 13만 4천 개 칩을 최대 47 페타비트/초의 논블로킹 대역폭으로 연결합니다. 100만 개 이상의 TPU 칩을 하나의 클러스터로 묶어 수개월이 걸리던 훈련을 수 주로 단축할 수 있습니다.

Virgo는 NVIDIA Vera Rubin NVL72에도 적용돼 단일 데이터 센터에서 최대 8만 개, 멀티 사이트 구성에서 최대 96만 개 GPU를 지원합니다. 스토리지도 재설계했습니다. 관리형 러스터(Managed Lustre)가 업계 최고 수준인 초당 10 테라바이트 스루풋을 지원하고 TPUDirect Storage로 호스트를 거치지 않고 데이터를 가속기에 직접 전달합니다. 구글 Axion CPU도 함께 내세웠습니다. 맞춤형 ARM 기반으로x86 대비 80% 높은 에너지 효율과 2배의 가성비를 제공합니다.

추론 시대의 가속기 전략은 단순한 GPU 확보 경쟁이 아닙니다. 어떤 업무가 훈련 중심인지, 어떤 업무가 대규모 추론인지, 어떤 구간이CPU 오케스트레이션인지, 네트워크와 스토리지가 어디서 병목을 만드는지까지 함께 봐야 합니다. 구글이 TPU, GPU, CPU, 네트워크, 스토리지를 한 묶음으로 설명한 이유가 여기에 있습니다.

“컨텍스트 없는 AI는 추측일 뿐”, 데이터 장벽을 허무는 Agentic Data Cloud

AI 하이퍼컴퓨터 다음 주제는 Agentic Data Cloud로 이어졌습니다. “컨텍스트 없는 추론은 추측에 불과하다.” Kartik Narain이 던진 이 한마디가 세션 전체를 관통하는 인사이트입니다. Agentic Data Cloud는 네 가지 혁신을 담고 있습니다.

Knowledge Catalog: BigQuery의 구조화 데이터와 Google Cloud Storage의 비정형 데이터를 통합 비즈니스 로직으로 매핑합니다. PDF나 이미지가 스토리지에 저장되는 순간 자동으로 태깅·보강 과정을 거쳐 에이전트가 활용할 수 있는 상태로 전환됩니다.
Data Agent Kit: VS Code, Claude Code, Gemini CLI 등 기존 작업 환경에 AI 데이터 사이언스 역량을 직접 통합합니다.
Lightning Engine: 기존 시장 선도 제품 대비 최대 2배의 가격 대비 성능을 제공하며, 실시간 에이전틱 피드백 루프를 지원합니다.
Cross-Cloud Lakehouse: Apache Iceberg 오픈 표준을 기반으로 분석 엔진이 어떤 클라우드의 데이터든 직접 참조합니다. AWS S3에 있는 아이스버그 테이블을 BigQuery에서 마치 네이티브 데이터처럼 저지연 직접 연결로 조회합니다. 데이터 이동이 필요 없습니다. 이그레스 비용도 없습니다.

데이터의 경계가 사라진다는 것은 단순한 기술적 통합을 이야기하는 것이 아닙니다. “데이터가 저장된 위치”가 아니라 “에이전트가 그 의미를 얼마나 잘 조립하느냐”가 더 중요해졌고 경계를 없애야 에이전틱 엔터프라이즈의 의사결정 속도를 높일 수 있다는 의미가 담겨 있습니다.

공격자와 방어자 모두의 손에 쥐어진 AI

데이터 다음 주제는 Agentic Defense로 이어졌습니다. Francis deSouza가 무대에서 언급한 수치는 충격적이었습니다. 취약점 공개부터 악용까지 소요 시간이 마이너스 7일 패치가 나오기 전에 이미 공격이 시작됩니다. 초기 침입에서 2차 위협 그룹 핸드오프까지 걸리는 시간은 8시간에서 22초로 줄었습니다. 사람이 대응하기에는 이미 상황이 종료된 이후일 가능성이 높습니다.

이 속도에 사람이 대응하는 것은 불가능합니다. 구글의 해법은 제미나이 네이티브 에이전틱 SOC(Security Operations Center)입니다. 핵심 에이전트는 세 가지입니다. 기존 30분짜리 조사를 60초 안에 처리하는 분류(Triage) 에이전트, 공격 패턴을 선제적으로 탐색하며 알려지지 않은 위험까지 식별하는 위협 헌팅(Threat Hunting) 에이전트, 보안 공백을 찾아 탐지 규칙을 자동 생성하는 디텍션 엔지니어링(Detection Engineering) 에이전트입니다. 다크웹 인텔리전스도 통합했습니다. 구글 위협 인텔리전스 그룹의 전문성과 최신 제미나이 모델을 결합해 일일 수백만 건의 외부 이벤트를 98% 정확도로 분석합니다.

Agentic Defense 소개 무대에 Wiz 공동 창업자인 Yinon Costica가 직접 등장해 AI 애플리케이션 보호 플랫폼(AI-APP)을 소개하기도 하였습니다. Red, Blue, Green 에이전트 체계가 인상적입니다. Red 에이전트는 조직의 외부 노출면을 지속적으로 스캔하며 취약점을 검증합니다. 잠재적 위험이 아닌 ‘검증된 위험’을 제시합니다. Green 에이전트는 소유자 식별, 수정 제안, 원인 코드 라인 특정까지 자동으로 처리합니다. 이 흐름에서 사람이 개입하는 지점은 ‘승인’뿐입니다.

Wiz의 AI-APP은 코드 작성부터 클라우드 배포, 실제 구동 단계까지 아우르는 보안 가시성도 확보합니다. 동적 AI-BOM(AI-Bill of Materials) 기술을 통해 조직 내에서 사용 중인 모든 AI 모델과 프레임워크를 실시간으로 파악하고 승인되지 않은 쉐도우 AI 사용을 차단합니다. 개발자가 사용하는 IDE와 에이전트 워크플로우에 보안 훅을 직접 삽입해 AI가 생성한 코드에 포함된 취약점이나 비밀 정보 노출도 즉시 스캔합니다.

구글과 Wiz의 결합이 갖는 의미는 ‘범위’에 있습니다. Gemini Enterprise Agent Platform이 자사 에이전트의 보안과 거버넌스를 담당한다면 Wiz는 그 보호를 온프레미스와 멀티클라우드 전체로 확장합니다. AWS, Azure 위의 자산까지 하나의 보안 컨텍스트로 묶는 구조입니다. 구글 클라우드가 주목하는 에이전틱 보안의 핵심은 간단합니다. 공격자가 AI를 쓰는 시대에 방어도 AI로 해야 합니다. 발견-검증-수정의 전 과정이 머신 속도로 작동해야 합니다.

생산성 도구를 중심으로 일어나는 워크플로우 혁신

에이전트 플랫폼을 세우고, 인프라를 깔고, 데이터를 연결하고, 보안으로 감쌌습니다. 그렇다면 이 모든 역량이 직원의 실제 업무 화면에서는 어떻게 작동할까요? 기조연설은 바로 이 질문에 대한 답으로 주제를 옮겼습니다. Google Workspace VP of Product인 Julie Kwon Kim 이 무대에서 묘사한 업무 현장의 현실은 이렇습니다. 하나의 질문에 답하려고15개 탭을 열고, 오래된 이메일에서 편집 중인 슬라이드로, 다시 스프레드시트로 화면을 오갑니다. Workspace Intelligence는 앱 간, 화면 간 전환 없이 작업 흐름이 이어지도로 하겠다는 제안입니다.

Workspace Intelligence는 Gemini의 추론 역량과 최신 임베딩 모델을 결합한 통합 인텔리전스 레이어입니다. 모든 워크스페이스 앱 안에 상주하며, 앱 사이에 흩어진 컨텍스트를 연결합니다. 단순히 앱 안에서 도움을 주는 수준을 넘어 여러 앱을 넘나들며 복잡한 작업을 수행하는 에이전틱 업무 환경을 지향합니다. 데모에서 그 작동 방식이 구체적으로 드러났습니다. 가구 리브랜딩 시나리오에서 킴은 Google Chat의 Ask Gemini를 통해 여러 채팅방에 쏟아지는 대화 속에서 지금 당장 처리해야 할 업무를 자동으로 식별했습니다. 긴급 태스크, 필요한 프레젠테이션 파일, 마감 시한이 한눈에 정리됩니다. 탭 하나 열지 않고도 상황 파악이 끝난 것입니다.

이어서 “지난 분기 지역별 매출 차트가 있는 머천다이징 플레이북을 찾아달라”고 요청하자, 워크스페이스 인텔리전스가 단순 키워드 매칭이 아닌 시맨틱 검색으로 정확한 문서와 차트를 집어 냈습니다. 회의 맥락과 파일 내용을 함께 이해하기 때문에 가능한 결과입니다. 인상적인 장면은 Regional Campaign이라는 스킬을 호출한 부분입니다. 이메일, 채팅, 기존 문서, 외부 HubSpot 데이터를 교차 참조해 브랜드 가이드에 맞는 Google Slides 덱을 자동 생성했습니다. 인용 출처까지 표시됩니다. 완성된 덱은 Gemini Enterprise 화면을 벗어나지 않고 Canvas 모드에서 편집하고 팀에 공유할 수 있습니다.

구글 드라이브는 단순한 파일 저장소를 넘어 프로젝트 관련 이메일, 문서, 채팅 내역을 자동으로 조직화하고 문맥에 맞는 답변을 생성하는 지능형 공간으로 변모합니다. 지메일 AI 인박스는 개인 비서처럼 수신함을 관리하며 중요한 업무를 요약하고 우선순위를 제안합니다. Workspace Skills은 송장 검토, 회의록 요약 등 반복 업무를 ‘스킬’로 등록해 에이전트가 자동 수행하도록 합니다.

기업 현장의 도입 사례도 함께 소개됐습니다. Colgate-Palmolive는 34,000명에게 Google Workspace를 배포하고 Gemini 기반 에이전트로 수십 년치 매출 데이터에서 실행 가능한 인사이트를 추출합니다. Natura는 데이터 기반 보고를 10배 가속했습니다. 대한항공은 22,000명의 글로벌 직원이 AI 에이전트와 도구를 활용해 운항과 고객 서비스 업무를 처리합니다. Walmart는 매장 리더들에게 Pixel Fold 기기를 지급하고 에이전트를 연결해, 이전에 몇 시간이 걸리던 문제 해결을 단 몇 초 만에 수행합니다.

단순 챗봇을 넘어선 비즈니스 파트너, ‘에이전틱 커머스’의 등장

이번 기조연설에서는 에이전틱 커머스(Agentic Commerce)도 비중 있게 다루어졌습니다. Google Cloud GTM COO & VP인 Carrie Tharp이 무대에서 밝힌 핵심 전환은 명확합니다. “에이전틱 시대에 에이전트는 더 이상 도구가 아니다. 비즈니스의 전략적 확장이다.”

구글은 올해 Gemini Enterprise for Customer Experience를 중심으로 고객 여정의 처음부터 끝까지를 에이전트가 어떻게 관여하는지 소개했습니다. 그 중심에 에이전틱 커머스가 있습니다. 관련해 다양한 사례가 소개되었습니다. Papa John’s는 음식 주문 에이전트로 고객의 과거 선호를 기억하고 주문에서 배달까지의 시간을 단축하는 초개인화 시스템을 구축하고 있습니다.

Home Depot의 Magic Apron은 영감에서 조사, 쇼핑, 구매, 실행까지의 고객 여정 전체를 디지털 에이전트가 안내합니다. 욕실 리모델링을 계획 중인 고객에게 필요한 도구와 자재 목록을 작성하고, 작업 절차를 설명하며 관련 상품을 즉시 구매하도록 유도합니다. Reliance는 인도 수백만 고객을 대상으로 쇼핑 에이전트를 운영하며 “생일 파티를 계획해 줘”라고 입력하면 에이전트가 카테고리를 넘나들며 장바구니를 구성해 방문당 매출을 끌어올립니다.

YouTube TV 고객 지원 사례도 라이브 데모로 공개됐습니다. 패트릭 말로(Patrick Marlo) PM이 실제 프로덕션 음성 에이전트에 전화를 걸어 ‘스포츠 전용 플랜 안내→가입 링크 문자 발송→스페인어 즉시 전환→동시 스트리밍 정책 확인’까지 하나의 통화로 처리했습니다. 이 에이전트는 현재 YouTube TV 사용자를 대상으로 운영 중입니다.

에이전틱 커머스가 보여주는 방향은 단순한 챗봇의 진화가 아닙니다. 에이전트는 이제 내부 업무 자동화 도구를 넘어 매출과 전환을 만드는 고객 접점의 실행 주체가 됩니다. 상품 탐색, 추천, 결제, 서비스, 분석이 하나의 에이전틱 레이어로 통합되면서, 고객 접점 자체가 재설계되는 것입니다.

“플랫폼은 준비됐다”, 이제 조직이 응답할 차례

에이전트 플랫폼에서 시작해 인프라, 데이터, 보안, 생산성 도구, 고객 접점까지 기조연설의 모든 주제를 되짚어 본 다음 쿠리안 CEO는 키노트를 마무리하며 “플랫폼은 준비가 됐다(The Platform is Ready)”고 선언했습니다. 이 말에는 기술적 가능성이 아니라 프로덕션 검증을 마쳤다는 자신감이 담겨 있습니다. 에이전틱 엔터프라이즈! 기술은 준비되어 있습니다. 이제 “우리 조직은 준비가 됐는가”라를 점검해야 할 때가 아닐까요?

[Google Cloud Next ’26 키노트] 에이전틱 엔터프라이즈의 도래, 구글은 AI 인프라를 어떻게 재설계했나?