Skip to content
Google Cloud 프리미어 파트너 메가존소프트
GCP(Google Cloud Platform), GWS(Google Workspace) 도입 컨설팅 및 상담
Google Cloud 프리미어 파트너 메가존소프트
  • Google Cloud
    • Professional Service
    • Implementation Service
    • Managed Service
    • Consolidated Billing Service
    • Cloud Migration Service
  • Google Workspace
    • 소통
      • Gmail
      • Calendar
      • Meet
      • Chat
    • 협업
      • ChromesOS & Google Meet H/W
      • Docs
      • Sheets
      • Slides
      • Forms
      • Sites
      • Drive
    • 데이터인사이트
      • App sheets
      • Connected sheet
    • 보안/관리
      • Vault
      • Management Console
      • Security
    • 가격
  • 일반 고객 사례
    • 일반 고객사례
    • Cloud Migration 고객사례
    • Managed Service 사례
    • Application Development 사례
  • 세미나
  • 블로그
  • Google Cloud
    • Professional Service
    • Implementation Service
    • Managed Service
    • Consolidated Billing Service
    • Cloud Migration Service
  • Google Workspace
    • 소통
      • Gmail
      • Calendar
      • Meet
      • Chat
    • 협업
      • ChromesOS & Google Meet H/W
      • Docs
      • Sheets
      • Slides
      • Forms
      • Sites
      • Drive
    • 데이터인사이트
      • App sheets
      • Connected sheet
    • 보안/관리
      • Vault
      • Management Console
      • Security
    • 가격
  • 일반 고객 사례
    • 일반 고객사례
    • Cloud Migration 고객사례
    • Managed Service 사례
    • Application Development 사례
  • 세미나
  • 블로그

Tag Archives: GoogleCloudPlatform

You are here:
  1. Home
  2. Entries tagged with "GoogleCloudPlatform"

Google Next 2026 GKE – 07 Operating Reinforcement Learning Workloads

Next & SummitBy 유주 조2026-05-12

7편: 강화학습 워크로드 운영 대규모 언어 모델(LLM) 강화학습은 지도학습과 다르게 샘플링, 보상 계산, 학습, 동기화가 한 루프에서 돌아갑니다. 루프가 길어지면 노드 한 곳의 장애가 전체 진행을 멈추고, 수천 노드 규모에서는 중단이 시간 단위로 잦아집니다. Google Cloud Next 2026에서 구글 쿠버네티스 엔진(GKE)은 이 워크로드를 받아내기 위한 분산 학습, 관측, 체크포인트 세 축을 정리했습니다. 본 글은 NVIDIA…

Google Next 2026 GKE – 06 AI Storage Multi-Tier Strategy

Next & SummitBy 유주 조2026-05-12

6편: AI 스토리지 다층 전략 AI/ML 워크로드는 한 가지 스토리지로 처리되지 않습니다. 데이터 준비 단계에서 거대한 원본 데이터셋을 모아두는 곳과 학습 도중 체크포인트를 빠르게 쓰는 곳, 추론 시점에 모델 가중치를 GPU로 끌어올리는 곳은 요구 조건이 다릅니다. 본 글은 구글 쿠버네티스 엔진(GKE)이 제공하는 스토리지 옵션을 워크로드 단계별로 어떻게 매핑하는지 정리합니다. 이 글은 학습 인프라 축에 속합니다…

Google Next 2026 GKE – 05 Accelerator Networking with NCCL, gIB, and A4X

Next & SummitBy 유주 조2026-05-09

5편: 가속기 네트워킹, NCCL과 gIB와 A4X 대규모 학습은 가속기 한 장이 아니라 수백·수천 장이 함께 한 모델을 학습합니다. 이때 GPU 사이의 통신이 학습 시간을 결정합니다. AllReduce 한 단계가 길어지면 매 스텝마다 그만큼이 누적되고, 결국 토큰당 학습 비용이 올라갑니다. AI Hypercomputer는 이 통신 경로를 하드웨어와 소프트웨어 양쪽에서 손봤습니다. 본 글은 GPU-to-GPU 트래픽을 떠받치는 Rail-aligned 토폴로지, NCCL과…

Google Next 2026 GKE – 04 Startup Acceleration and Intent-Based Autoscaling

Next & SummitBy 유주 조2026-05-08

4편: 시작 가속과 의도 기반 오토스케일링 LLM 서빙 Pod의 라이프사이클은 두 시점에서 갈립니다. 새 Pod이 처음 트래픽을 받기까지 걸리는 시간과, 트래픽 변화에 맞춰 복제본 수를 조절하는 판단 시점입니다. 구글 쿠버네티스 엔진(GKE)은 Google Cloud Next 2026에서 이 두 시점을 함께 다루는 기능을 발표했습니다. 컨테이너 이미지와 모델 가중치를 빠르게 끌어오는 시작 가속 기술, 그리고 GPU 사용률 같은…

Google Next 2026 GKE – 03 KV Cache Tiering and Memory Hierarchy

Next & SummitBy 유주 조2026-05-08

3편: KV 캐시 티어링과 메모리 계층화 키-값 캐시(KV 캐시)는 대규모 언어 모델(LLM) 서빙에서 그래픽 처리 장치(GPU) 메모리를 가장 빠르게 갉아먹는 자원입니다. 입력 시퀀스가 길어질수록 self-attention이 저장하는 키와 값의 크기가 비례해 늘어나고, 같은 GPU에 올릴 수 있는 동시 요청 수는 줄어듭니다. 본 글은 이 KV 캐시를 GPU의 고대역폭 메모리(HBM)에서 하위 저장소로 끌어내려 처리량을 끌어올리는 메모리 계층화…

Google Next 2026 GKE – 02 Standardizing LLM Serving with Inference Gateway

Next & SummitBy 유주 조2026-05-07

2편: GKE Inference Gateway로 LLM 서빙 표준화 GKE Inference Gateway는 구글 쿠버네티스 엔진(GKE) 위에서 대규모 언어 모델(LLM) 서빙을 표준화하는 추론 최적화 로드밸런서입니다. Google Cloud Next 2026에서 강조된 이 컴포넌트는 vLLM·TGI·JetStream 같은 모델 서버 위에 얹혀, 일반 HTTP 로드밸런서가 보지 못하는 KV 캐시 점유율, 요청 큐 길이, LoRA 어댑터 가용성 같은 추론 고유 신호를 라우팅 결정에…

Google Next 2026 GKE – 01 Overview, The Big Picture

Next & SummitBy 유주 조2026-05-07

1편 개관: Next 2026 GKE의 큰 그림 Google Cloud Next 2026에서 구글 쿠버네티스 엔진(GKE)은 AI/ML 인프라 자동화를 한 축으로 묶어 발표했습니다. 추론 서빙, 학습 가속, 워크로드 격리, 클러스터 간 통신까지 각 영역에 신기능이 들어왔습니다. 본 글은 시리즈 인덱스로, 이후 본편들이 다룰 신기능 10개를 추론 인프라, 학습 인프라, 보안과 격리, 네트워킹 4축으로 정리합니다.   본편 구성…

구글 클라우드 Cross-Cloud Interconnect: 멀티 클라우드 네트워크의 전략적 아키텍처와 구축 방안

Google CloudBy 유주 조2026-05-06

최근 Enterprise IT 환경은 단일 클라우드 제공업체에 의존하던 시대를 지나, 각 플랫폼의 고유한 강점을 결합하는 멀티 클라우드 시대로 완전히 진입하였으며, 2026년에 이르러 네트워크는 단순한 데이터 전송 통로를 넘어, 인공지능(AI) 에이전트와 핵심 애플리케이션을 연결하고 보호하며 관리하는 중추적인 통합 계층으로 진화했습니다. 이러한 기술적 흐름 속에서 구글 클라우드의 Cross-Cloud Interconnect(CCI)는 구글 클라우드와 아마존 웹 서비스(AWS), 마이크로소프트 애저(Azure), 오라클…

서비스 계정 키(Service Account Key) 유출 방지 및 제로 트러스트 아키텍처 전환 – 2

Google CloudBy 유주 조2026-05-06

Google Cloud의 서비스 계정 키는 애플리케이션이나 서비스가 Google Cloud 리소스에 인증하고 접근할 수 있도록 하는 강력한 자격 증명입니다. 이 키는 만료 기간이 없는 긴 수명의 자격 증명이므로, 유출될 경우 비인가자가 클라우드 환경에 접근하여 데이터를 탈취하거나 리소스를 무단으로 사용해 막대한 비용을 발생시키는 등 심각한 보안 사고로 이어질 수 있습니다. 따라서 서비스 계정 키 유출 시 신속하게…

서비스 계정 키(Service Account Key) 유출 방지 및 제로 트러스트 아키텍처 전환 – 1

Google CloudBy 유주 조2026-05-06

Google Cloud의 서비스 계정 키는 애플리케이션이나 서비스가 Google Cloud 리소스에 인증하고 접근할 수 있도록 하는 강력한 자격 증명입니다. 이 키는 만료 기간이 없는 긴 수명의 자격 증명이므로, 유출될 경우 비인가자가 클라우드 환경에 접근하여 데이터를 탈취하거나 리소스를 무단으로 사용해 막대한 비용을 발생시키는 등 심각한 보안 사고로 이어질 수 있습니다. 따라서 서비스 계정 키 유출 시 신속하게…

→12345→
Google Cloud 프리미어 파트너 메가존소프트
Copyright ⓒ 2022 MegazoneSoft. All Right Reserved.
Go to Top