[kakao monthly newsletter_9월호] VPC & Networking
IPv6-only 서브넷 및 인스턴스 IPv6 전용 서브넷 및 인스턴스가 정식 버전으로 제공됩니다. IPv6 전용 서브넷 추가 IPv6 전용 인스턴스 생성 DNS64 및 NAT64를 사용하여 IPv6 전용 서브넷 및 인스턴스 구성 Docs : https://cloud.google.com/vpc/docs/ipv6-support
IPv6-only 서브넷 및 인스턴스 IPv6 전용 서브넷 및 인스턴스가 정식 버전으로 제공됩니다. IPv6 전용 서브넷 추가 IPv6 전용 인스턴스 생성 DNS64 및 NAT64를 사용하여 IPv6 전용 서브넷 및 인스턴스 구성 Docs : https://cloud.google.com/vpc/docs/ipv6-support
Gemini와 Google ADK를 활용한 Real-time voice agent 개발하기 💡참고 링크 : Build a real-time voice agent with Gemini & ADK 고급 대화형 AI를 구축하는 것은 이제 텍스트를 훨씬 뛰어넘는 수준으로 발전했습니다. 이제 우리는 AI를 사용하여 실시간 음성 기반 에이전트를 만들 수 있지만 이러한 시스템은 낮은 지연 시간의 양방향 통신, 실시간 정보 검색, 복잡한…
2025 Container Management 부문 Leader 선정 Gartner가 3년 연속으로 2025년 Gartner Magic Quadrant™ 컨테이너 관리 부문 리더로 Google을 선정 2025년 Gartner 컨테이너 관리 핵심 기능 보고서에서 Google Cloud는 새로운 클라우드 네이티브 애플리케이션, 기존 애플리케이션의 컨테이너화, AI 워크로드, 엣지 애플리케이션, 하이브리드 애플리케이션 등 모든 주요 사용 사례를 선도했을 뿐만 아니라, 모든 핵심 기능에서 1위를 차지했습니다. Blog…
Storage Insights datasets, 스토리지 지출을 최적화 하는 방법 Cloud Storage Intelligence의 기능 중 하나로 클라우드 스토리지에 저장된 방대한 양의 데이터에 대한 심층적인 가시성을 확보할 수 있도록 돕는 강력하고 자동화된 도구입니다. Storage Insights datasets는 Cloud Storage 데이터에 대한 심층적인 가시성을 확보할 수 있는 강력하고 자동화된 방법을 제공하며, Cloud Storage 객체 및 해당 활동에 대한 포괄적인…
[BigQuery] Save query results to Cloud Storage Google Cloud 콘솔에서 쿼리 결과를 Cloud Storage로 내보낼 수 있습니다. Export format : CSV, JSON (Newline Delimited), Avro, Parquet 중 선택 Compression 유/무 선택 ⚠️ Save query results to Google Drive는 Beta 입니다. Docs : https://cloud.google.com/bigquery/docs/exporting-data Cloud SQL의 Enhanced backups 표준 백업 옵션보다 향상된…
Vertex AI의 Gemini 임베딩 모델 확장 Vertex AI의 가장 강력한 텍스트 임베딩 모델인 gemini-embedding-001의 할당량 및 입력 크기 제한을 상향 조정 Gemini embedding model 사용시 요청당 단일 텍스트 대신 최대 250개의 입력 텍스트를 전송하여 250개의 임베딩을 생성할 수 있으며, 이를 통해 대규모 임베딩 애플리케이션의 처리량이 향상되고 왕복 네트워크 지연 시간이 감소합니다. 또한 대부분의 사용자를…
Networking for AI Data Centers The Networking 101 Google Cloud sheet에 ‘networking for AI Data Centers’가 업데이트 주요 업데이트 Remote Direct Memory Access(RDMA): OS나 CPU의 개입 없이 장치(Computer)간의 메모리에서 메모리로 데이터를 직접 전송하는 기술 인피니밴드(InfiniBand): RDMA 및 클러스터 통신을 위한 고속, 저지연 패브릭 RDMA over Converged Ethernet(RoCE): 이더넷 네트워크를 통해 RDMA 데이터 전송을 가능하게…
GKE Inference Gateway을 통한 고성능 LLM 서빙 구현 GKE와 GKE Inference Gateway를 사용하여 고성능 LLM 서빙을 구현하고 AI관련 메트릭을 인식하는 스마트 라우팅을 통해 기존 로드밸런싱의 한계를 극복 합니다. GKE Inference Gateway for LLM Serving 특장점 지능형 로드 밸런싱: KV-Cache 활용률과 같은 GPU 관련 메트릭을 포함한 백엔드 용량을 파악하여 요청을 최적화하여 라우팅 AI 인식 자원…
AI workloads with the Google Cloud Managed Lustre HPC 및 AI/ML 워크로드를 위해 설계된 완전 관리형 병렬 파일시스템 서비스 주요 특징 초당 최대 1TB/sec 처리량과 1msec 미만의 매우 낮은 지연시간 수백만 IOPS를 지원하며 용량에 비례하여 성능이 확장되고 유연하게 Scale up/down을 지원 최소 18TiB에서 8PiB 이상 Google Cloud가 Lustre 파일 시스템의 배포, 구성, 모니터링, 패치,…