Google I/O 2026이 보여준 Agentic AI의 새로운 기준 ‘Gemini 3.5 Flash’

‘Gemini 3.5 Flash’

요즘 AI 분야는 6개월 뒤도 예측이 어려울 정도입니다.

특히 프론티어 모델 간 경쟁이 치열해지면서 새로운 업데이트가 공개될 때마다 순위가 바뀌면서 시장에서 1등이 어떤 모델인지도 꼽기 어렵습니다. 2026년 5월에도 시장을 뒤흔드는 업데이트가 있었는데요. 바로 Google I/O 2026에서 스포트라이트를 받은 Gemini 3.5 Flash입니다. 관련해 이번 포스팅에서는 구글이 공개한 Gemini 3.5 Flash가 엔터프라이즈의 에이전틱 AI(Agentic AI) 전략에 어떤 긍정적인 영향을 끼칠지 살펴보겠습니다.

Flash라고 무시할 수 없는 이유

Google I/O 2026에서 가장 주목받은 발표는 Gemini 3.5 Flash였습니다. Flash 계열은 그동안 빠르고 비용 효율이 높은 모델의 이미지가 있습니다. 복잡한 추론은 Pro가 빠른 응답과 대량 처리는 Flash가 처리한다고 생각하는 분들이 많을 것입니다. Gemini 3.5 Flash는 이런 인식을 바꿨습니다.

가장 먼저 눈에 들어오는 것은 Pro와 비교할 이유가 없는 수준의 성능입니다. 구글의 발표에 따르면 이전 세대 플래그십 모델인 Gemini 3.1 Pro를 주요 벤치마크에서 앞섭니다. 코딩 능력을 측정하는 Terminal-Bench 2.1에서 76.2%, 실제 에이전트 업무 수행 능력을 측정하는 GDPval-AA에서 1656 Elo, 대규모 도구 사용 신뢰도를 측정하는 MCP Atlas에서 83.6%, 멀티모달 추론을 측정하는 CharXiv Reasoning에서 84.2%를 기록했습니다. 네 가지 모두 Gemini 3.1 Pro를 넘어선 수치입니다. 비교 가능한 프런티어 모델 대비 절반 이하의 비용으로 같은 작업을 처리한다는 점도 함께 발표됐습니다.

여러 단계의 작업을 스스로 처리하는 능력도 발군입니다. 구글은 Gemini 3.5 Flash를 프런티어 모델의 지능에 실행력을 결합한 모델이라고 설명합니다. 단순히 질문에 답하는 모델이 아니라 작업 목표를 이해하고, 절차를 나누고, 도구를 호출해 실제 결과물을 만드는 실행형 모델이라는 것이죠. 멀티턴 대화 구조에서 지시 사항을 끝까지 준수하고, 배경 작업이 실행되는 중에도 논리적 흐름을 유지하며, 복잡한 도구 사용 패턴을 안정적으로 지원합니다.

실제 사례로 본 활용 방향

구글은 공식 발표에 앞서 다양한 산업의 선도 기업과 함께 Gemini 3.5 Flash를 실제 환경에서 검증했습니다. Shopify, Ramp, Salesforce, Databricks, Macquarie Bank, Xero 여섯 개 기업의 사례를 통해 Gemini 3.5 Flash가 어떤 변화를 만들었는지 살펴보겠습니다.

Shopify: 글로벌 커머스 플랫폼 Shopify는 마케팅 캠페인의 성과 분석과 가입자 예측 시스템에 Gemini 3.5 Flash를 서브 에이전트로 통합했습니다. 과거에는 담당자들이 수작업으로 가입자 예측 모델을 구축해야 했습니다. 사람이 검증할 수 있는 가설의 수가 제한적이었고 특정 지역의 데이터 급증 원인을 명확하게 규명하기 어려웠습니다. Gemini 3.5 Flash 기반의 추론 레이어를 적용한 이후로는 매시간 수백 가지의 가설 검증 테스트를 수행할 수 있게 됐습니다. 캐나다 시장에서 발생한 알 수 없는 신규 가입자 급증 현상을 분석할 때 모델은 아프리카와 동남아시아 지역의 가입 패턴을 함께 살폈고 이들 지역이 모두 프랑스어 사용 지역이라는 공통점을 도출해 프랑스에서 진행된 인플루언서 캠페인의 후광 효과였음을 밝혀냈습니다. 복잡한 가설을 지속해서 반영함으로써 실제 데이터 대비 예측 정확도를 목표치인 8% 이내로 진입시키는 성과도 냈습니다.
Ramp: 금융 서비스 기업 Ramp는 복잡한 영수증과 인보이스 처리를 자동화하기 위해 Gemini 3.5 Flash를 메인 모델로 채택했습니다. 기존의 전통적인 OCR 기술은 문서 구조가 조금만 바뀌거나 다국어 문서, 손상된 영수증을 접하면 텍스트 추출 오류가 잦았습니다. 사람의 개입 없이 청구서를 승인하는 자동화율이 낮을 수밖에 없었습니다. Ramp는 1,000개 이상의 다국어·대용량 인보이스 데이터셋을 활용한 벤치마크에서 600개 이상의 품목이 포함된 긴 인보이스나 구겨진 영수증에서도 정확하게 데이터를 추출하는 Smart OCR 시스템을 구축했습니다. 단순히 글자를 읽는 수준을 넘어 과거 패턴에 기반해 특정 필드의 유효성을 검증하는 판단 역량을 보여 줍니다. 다른 모델 대비 훨씬 낮은 비용과 지연 시간으로 대규모 문서 처리가 가능해졌으며 정보 추출과 검증에 걸리는 시간도 절반 이상 단축했습니다.
Salesforce: SaaS 기업인 Salesforce는 자사의 에이전틱 CRM 플랫폼 Agentforce에 Gemini 3.5 Flash를 결합해 기업용 서비스의 신뢰성을 높였습니다. 대형 언어 모델의 확률적 특성으로 인해 발생하는 답변의 불확실성은 기업 환경에서 치명적인 리스크였습니다. 반복 업무 제거와 이기종 데이터 소스의 유기적인 연동을 위해서는 높은 수준의 신뢰성 엔지니어링이 필요했습니다. 고객 서비스 에이전트 벤치마크 테스트에서 Gemini 3.5 Flash는 업무 완료율 100%, 작업 수행율 94%, 상태 유지율 100%를 기록했습니다. 복잡한 도구 사용과 여러 개의 서브 에이전트가 동시에 구동되는 환경에서도 논리의 흐름을 잃지 않고 정확한 행동을 호출합니다. 이를 통해 현장 기술자가 복잡한 복수의 시스템을 클릭하는 대신 자연어 질의만으로 데이터 기반의 솔루션을 즉각 도출할 수 있게 됐습니다.
Databricks: 데이터 분석 플랫폼 Databricks는 플랫폼 네이티브 인텔리전트 에이전트인 Genie Code의 핵심 엔진으로 Gemini 3.5 Flash를 활용합니다. 머신러닝 엔지니어들은 그동안 시스템 경고 확인, 원인 분석, 컨텍스트 연결 같은 반복적이고 소모적인 운영 업무에 많은 시간을 빼앗겼습니다. 모델의 한계로 인해 완전한 자동화가 어려웠던 영역입니다. Databricks는 기상 악화로 서부 해안 항만의 물류가 지체되어 물류 비용이 과소 책정되던 화물 운송 기업 고객의 사례에서 Gemini 3.5 Flash가 문제 원인을 진단하는 단계를 넘어 사내에 고립되어 있던 기존 데이터셋을 스스로 찾아내 결합하는 해결책까지 제시한 것을 확인했습니다. 광범위한 문맥을 추론하는 능력을 바탕으로 모니터링 경보 단계부터 데이터 과학자의 최종 승인을 위한 해결책 준비까지의 과정을 Gemini 3.5 Flash를 기반으로 자동화한 것입니다.
Macquarie Group: 호주 금융 그룹 Macquarie Group은 계좌 개설 과정에서 발생하는 복잡한 법적 문서 검증에 Gemini 3.5 Flash를 도입했습니다. 신탁 자산이나 자급형 퇴직연금(SMSF) 가입 시 제출하는 법적 수탁 증서(Trust Deed)는 100페이지가 넘는 경우가 많고 용어가 복잡해 전문 인력이 검토하는 데 수일이 소요됐습니다. 규제 준수를 위해 정확성을 유지하면서 속도를 높이는 일이 과제였습니다. Macquarie Group은 Google DeepMind와의 긴밀한 협업을 통해 모델의 불확실성과 비결정성을 약 50% 줄였습니다. API 호출 시 일관되고 예측 가능한 고정밀 결과를 얻게 됐다는 의미입니다. 복잡한 법률 용어와 내부 심사 기준을 정확히 이해해 수탁 증서의 정보를 추출하고 검증하는 시간을 절반 이하로 줄였으며, 운영팀이 예외적인 고난도 케이스와 고객 응대에 더 많은 시간을 집중할 수 있는 환경이 만들어졌습니다.
Xero: 글로벌 회계 플랫폼 Xero는 자사의 에이전틱 플랫폼인 Jax에 차세대 Gemini 모델을 적용해 행정 업무 프로세스를 혁신했습니다. 미국 1099 택스 폼과 같은 프리랜서 원천징수 신고 업무는 단순 행정 작업처럼 보이지만 수 주에 걸친 확인 작업이 필요한 복잡한 업무입니다. 기존 모델들은 다단계 워크플로를 수행하는 과정에서 중요 단계를 누락하는 오류를 범해 실무 적용에 한계가 있었습니다. Gemini 3.5 Flash 도입 이후에는 다단계 장기 작업(Long Horizon Task)을 오류 없이 완수하는 성능을 확인했습니다. 사용자가 몇 번의 프롬프트를 입력하면 모델이 상위 수준의 목표를 세부 작업으로 쪼개고 수 주에 걸쳐 전체 프로세스를 스스로 완수합니다. 업무의 자연스러운 순서와 맥락을 직관적으로 이해해 소상공인의 세무 신고 부담을 낮추는 데 기여하고 있습니다.

살펴본 기업들은 속한 산업은 다르지만 공통점이 있습니다. 모두 단발성 질의응답이 아니라 업무 흐름을 AI로 바꾸었다는 것입니다. AI가 검색하고, 비교하고, 판단하고, 필요한 조치를 준비합니다. Gemini 3.5 Flash가 에이전틱 AI 컨셉을 현장에서 실행으로 옮기고 있는 것이죠. 이는 어떤 조직이건 업무 현장에서 실천으로 옮길 수 있습니다. 반복되는 문서 처리, 경고 이후 원인 분석, 고객 정보 조회, 복잡한 승인 흐름, 장기 행정 업무는 업종을 가리지 않고 존재합니다. Gemini 3.5 Flash는 이런 업무에 에이전트를 붙일 때 실용적인 모델 후보가 될 수 있습니다.

멀티 모델 수용을 위한 새로운 선택지

최근 많은 조직이 모델 라우팅 방안을 고려하고 있습니다. 모든 업무에 같은 모델을 쓸 필요는 없다고 보는 곳이 늘고 있는 것인데요.

복잡한 전략 판단에는 더 강력한 모델을 쓰고 반복적인 검토와 분류, 도구 호출이 잦은 에이전트 워크플로에는 Gemini 3.5 Flash 같은 빠르고 경제적인 모델을 배치하는 방식이 현실적입니다. 토큰 비용 최적화 관점에서도 모델 라우팅은 점점 더 중요한 의사 결정 요소가 되고 있습니다. Gemini 3.5 Flash는 이런 흐름 속에서 등장한 새로운 선택지입니다.

한 세대 전 플래그십을 넘어선 지능과 빠른 응답, 비교 모델 대비 절반 이하의 비용, 그리고 장기 호흡 에이전트 워크플로를 실제로 끌고 가는 능력이 한 모델 안에 들어왔습니다. 구글의 새로운 개인 AI 에이전트 Gemini Spark도 같은 모델을 엔진으로 사용합니다. 에이전틱 AI를 PoC에서 운영 단계로 옮기려는 기업이라면 Gemini 3.5 Flash를 진지하게 검토하는 것을 추천합니다.

더 자세한 내용이 궁금하다면 메가존소프트 문의포탈을 통해 궁금한 부분을 남겨주세요.

Google I/O 2026이 보여준 Agentic AI의 새로운 기준 ‘Gemini 3.5 Flash’

‘Gemini 3.5 Flash’

Flash라고 무시할 수 없는 이유

실제 사례로 본 활용 방향

멀티 모델 수용을 위한 새로운 선택지

Related Posts