검색 품질 UP! Vertex AI 임베딩 튜닝
검색 품질 UP! Vertex AI 임베딩 튜닝 생성형 AI 모델을 기반으로 한 앱이나 서비스에 대한 사용자 눈 높이가 빠르게 높아지고 있습니다. 빅테크 기업의 상용 서비스를 이용해 본 사용자는 회사에서 제공하는 서비스에도 같은 수준의 사용자 경험을 기대합니다. 그러다 서비스를 구현하는 입장에서 보면 사실 이게 쉽지 않은 일입니다. 생성형 AI 앱의 검색, 답변, 추천 기능을 향상시켜…
검색 품질 UP! Vertex AI 임베딩 튜닝 생성형 AI 모델을 기반으로 한 앱이나 서비스에 대한 사용자 눈 높이가 빠르게 높아지고 있습니다. 빅테크 기업의 상용 서비스를 이용해 본 사용자는 회사에서 제공하는 서비스에도 같은 수준의 사용자 경험을 기대합니다. 그러다 서비스를 구현하는 입장에서 보면 사실 이게 쉽지 않은 일입니다. 생성형 AI 앱의 검색, 답변, 추천 기능을 향상시켜…
토큰 경제 시대, AI 인프라 경쟁력은 속도보다 효율로 이동 중 요즘 기업의 AI 도입 논의에서 빠지지 않는 질문이 있습니다. “이걸 실제 업무에 붙였을 때 비용을 감당할 수 있을까?”라는 질문입니다. 생성형 AI가 등장한 초기만 해도 모델 성능이 가장 큰 관심사였습니다. 모두가 어떤 모델이 더 똑똑한지, 어떤 모델이 더 긴 문맥을 처리하는지, 어떤 모델이 더 어려운 문제를…
DW의 나무를 자연어기반 BI Agent 숲으로 키우는 방법 들어가며 – 사례 소개 Pain Point에서 시작된 프로젝트 폴리인스퍼레이션 (Poly Inspiration, 이하 PI)은 Poly와 CANB라는 두 브랜드의 전국 규모 교육 기관을 운영하는 기업으로서, 매월 방대한 양의 경영 데이터를 분석하여 의사결정에 활용하고 있습니다. 처음 우리에게 들어온 요청은 “데이터 웨어하우스(DW)를 구축해달라”는 것이었습니다. 흩어져 있는 데이터를 모아 분석할…
최근 거대 언어 모델(LLM)을 활용한 다양한 서비스가 등장하고 있습니다. 사용자들이 선호하는 서비스를 보면 더욱 정확하고 신뢰도 높은 답변을 얻기 위한 RAG(Retrieval-Augmented Generation) 기술을 잘 활용하고 있다는 특징이 있습니다. 이번 포스팅에서는 RAG의 개념과 동작 방식을 알아보고 최근 관심을 모으고 있는 멀티 모달 RAG를 소개하겠습니다. RAG 개념 및 선도 기업들의 활용 전략 RAG는 LLM과 벡터…
2024년 금융, 공공, 리테일 등 다양한 산업에서 생성형 AI(Generative AI)의 도입과 상용화가 이루어졌습니다. 그러나 제조 분야는 높은 수준의 품질 기준과 공정 과정에 대한 실험적인 도전이 비교적 쉽지 않아 AI 도입이 어렵다는 인식이 만연하였습니다. AI 시스템을 실제 현장에 적용하려면, AI 시스템의 도입과 통합 과정의 복잡성, 데이터 품질 문제, 초기 투자 비용 등의 어려움을 극복해야 하기 때문입니다.…
Google Cloud Vertex AI GenAI Evaluation: 생성형 AI 모델 평가의 새로운 기준 생성형 AI 모델을 평가하고 이를 바탕으로 모델을 개선하는 작업은 AI 개발자와 AI 서비스 운영자라면 누구나 맞닥뜨리는 과제일 것입니다. 관련해 이번 포스팅 에서는 생성형 AI 모델을 평가하는 것이 왜 중요한지, 어떤 점들이 특히 어렵고, 그 문제들을 해결하기 위해 Google Cloud가 제공하는 Vertex AI…
생성형 AI 시장의 관심은 한동안 가장 큰 모델에 쏠렸습니다. 더 많은 파라미터, 더 큰 컨텍스트, 더 높은 벤치마크 결과가 경쟁의 기준처럼 보였습니다. 기업도 비슷한 고민을 했습니다. 가장 성능이 좋은 모델 하나면 충분할 것처럼 보였습니다. 하지만 AI 투자 방향이 에이전트를 향하면서 모든 업무에 초대형 모델을 쓸 필요가 있을까? 이 질문을 하는 이들이 하나 둘 늘고 있습니다.…
최근 구글 클라우드에서 새롭게 공개된 Gemini 2.0 모델과 Gen AI SDK는 AI 개발 분야에 혁신적인 변화를 가져오고 있습니다. 이번 포스팅에서는 Gemini 2.0과 Gen AI SDK의 활용법과 AI Studio와 Vertex AI의 차이점, 그리고 우리 회사에 맞는 AI 애플리케이션 개발에 적합한 환경을 고르는 기준을 살펴보겠습니다. 결론부터 말하자면 기업의 경우 MVP(Minimum Viable Product, 최소 기능 제품) 수준의…
‘Gemini 3.5 Flash’ 요즘 AI 분야는 6개월 뒤도 예측이 어려울 정도입니다. 특히 프론티어 모델 간 경쟁이 치열해지면서 새로운 업데이트가 공개될 때마다 순위가 바뀌면서 시장에서 1등이 어떤 모델인지도 꼽기 어렵습니다. 2026년 5월에도 시장을 뒤흔드는 업데이트가 있었는데요. 바로 Google I/O 2026에서 스포트라이트를 받은 Gemini 3.5 Flash입니다. 관련해 이번 포스팅에서는 구글이 공개한 Gemini 3.5 Flash가 엔터프라이즈의 에이전틱 AI(Agentic…