여러 프론티어 모델 플랜을 구독하는 사용자가 회사에서 제공하는 AI 서비스를 이용하면 어떤 점을 가장 답답해 할까요?
십중팔구 짧은 대화 위주로만 활용하는 것을 꼽을 것입니다. 개인적으로 사용하는 서비스처럼 나와의 작업 내용을 오래 그리고 많이 기억하며 백그라운드에서 에이전트가 알아서 작업해 원하는 결과를 내놓기를 기대하는 것이죠. 이런 사용자 기대에 맞는 서비스를 제공하는 것은 사실 쉽지 않습니다. 특히 컨텍스트 창이 가득 차면 이전 상태를 잃고, 다음 세션은 다시 백지에서 시작하는 것이 아니라 며칠씩 스스로 일하는 에이전트, 즉 장기 작업 AI 에이전트(Long-running AI Agents)에 대한 사용자 경험을 제공하는 것은 만만치 않은 과제입니다. 다행히 구글 클라우드에서는 장기 작업 에이전트도 도전 가능한 목표입니다. 이에 대해 자세히 알아보겠습니다.
며칠이 걸리는 임무를 완수하기 위한 전제 조건
장기 작업 에이전트가 제대로 작동하려면 세 가지 조건을 갖춰야 합니다.
먼저 에이전트는 잠들 수 있어야 합니다. 컴퓨터가 사용하지 않을 때 슬립 모드로 전환되는 것처럼 필요한 순간에서 깨어나 작업해야 한다는 뜻입니다. 작업 중간에 결재 라인 상에서 사람의 승인을 기다리고, 외부 API 응답을 기다리고, 다른 시스템의 처리를 기다리는 동안에는 실행 모드를 유지할 이유가 없습니다. 자원만 낭비할 뿐입니다. 에이전트는 외부 이벤트가 깨우기 전까지 휴면 상태로 머물러야 합니다.
다음으로 모든 단계에 체크포인트가 있어야 합니다. 작업 상태는 단계가 바뀔 때마다 안정적으로 저장돼야 합니다. 컨테이너가 충돌해도 서버가 다시 배포되고, 사람이 며칠 뒤에 작업을 마쳐도 에이전트는 멈췄던 바로 그 지점에서 이어 갈 수 있어야 합니다. 없던 기억을 지어내거나 거치지 않은 단계를 가정해서는 안 됩니다.
에이전트는 자기 일을 스스로 채점하지 못합니다. 같은 에이전트로 코드를 짜고 같은 에이전트로 검토하면 문제가 생깁니다. 에이전트는 자기 출력을 평가하면 품질을 과대평가하는 경향이 있습니다. 이 문제 해결을 위해 세 개의 에이전트를 활용하는 구조를 요즘 많이 채택합니다. 예를 들어 계획을 세우는 플래너, 결과를 만드는 제너레이터, 결과를 검증하는 별도의 이밸류에이터로 역할을 나누어 품질 과대평가 문제를 최소화할 수 있습니다.
위와 같은 세 가지 전제 조건을 구글 클라우드 환경에서는 바로 만족할 수 있습니다. Gemini Enterprise Agent Platform은 며칠 동안 상태를 유지하는 장기 작업 에이전트를 지원하고 메모리 뱅크(Memory Bank)로 장기 컨텍스트를 관리합니다. Agent Runtime은 최대7일의 작업까지 지원합니다. 그렇다면 여기서 원론적인 질문을 좀 해보겠습니다. 기업은 왜 이런 에이전트를 필요로 할까요?
이커머스 업계가 오랜 기간 열정을 쏟아온 것은 개인화된 맞춤형 사용자 경험(UX)을 제공하는 것이었습니다. 이를 위해 데이터 수집과 분석에 많은 노력을 기울였고 경쟁사 보다 나은 상품 추천 알고리즘 개발에 투자를 아끼지 않았습니다. 이런 혁신의 여정은 이제 새로운 챕터로 넘어가고 있습니다. 소비자의 취향에 맞는 상품을 추천하는 것으로는 AI 시대 사용자 눈높이를 맞출 수 없습니다. 실제로 고객의 기대가 달라지고 있습니다.
가령 고객이 단백질 보충제를 구매한다고 가정해보겠습니다. 고객은 나의 검색 기록이나 구매 이력을 토대로 한 상품 추천에 만족하지 않습니다. “운동을 막 시작했는데, 체중 감량도 하고 싶고 속이 불편하지 않은 제품을 찾고 싶다”와 같은 사용자의 질문에 숨은 의중을 파악해 맥락에 맞는 조언과 함께 적절한 상품을 추천해 주는 것을 바랍니다. 이런 기대를 충족하는 것은 사실 어려운 일입니다. 기술적으로 복잡하기도 하고요. 그렇다면 구글 클라우드는 에이전틱 커머스 시대를 개척하기 위해 어떤 제안을 하고 있을까요?
장기 작업 에이전트가 기업의 실제 업무 환경에 잘 맞는 이유
장기 작업 에이전트의 개념을 듣는 순간 기업 환경에 잘 맞겠다는 생각이 듭니다. 왜 그럴까요? 매일 같이 이루어지는 업무가 어떤 절차를 따라 진행되는지 떠올려 보면 답이 보입니다. 채용, 입사 온보딩, 계약 검토, 대출 심사, 보안 승인, 구매 요청, 장애 대응은 대부분 여러 단계로 나뉩니다. 서명을 받고, 분석을 거치고, 승인을 기다리고, 여러 부서와 외부 기관을 오가며 하나씩 처리해야 합니다. 며칠, 몇 주가 걸리는 일이 흔합니다.
기존 챗봇형 에이전트는 이런 업무 처리에 잘 맞지 않습니다. 컨텍스트 창이 금세 가득 차 세션마다 0에서 다시 시작하면 품질이 떨어집니다. 상태 유지 수단이 없으면 에이전트가 길을 잃고 무언가를 잘 못 처리하거나 도중에 포기합니다. 이런 일이 일어나면 사용자가 다음 날 다시 들어오면 처음부터 설명해야 합니다.
장기 작업 에이전트는 챗봇형 에이전트와 달리 긴 워크플로를 백그라운드에서 대신 처리합니다. 진행 상태를 기억하고 필요한 순간에 사람을 호출합니다. Gemini Enterprise는 조직의 에이전트 활동을 한곳에서 보는 인박스(Inbox)도 제공하는데요. ‘입력 필요’, ‘오류’, ‘완료’처럼 상태를 분류해 보여 줍니다. 그 효과는 분명합니다. 사람이 다음 단계를 챙기는 대신 에이전트가 상태를 추적하니 대기 시간이 줄고 체크리스트와 정책을 따라가니 누락이 줄어 품질이 표준화됩니다. 여러 시스템을 오가지 않고 하나의 에이전트와 대화하니 직원 경험도 좋아집니다.
구체적인 업무 하나를 예로 앞서 설명한 장기 작업 에이전트의 특성을 알아보겠습니다.
신입사원 온보딩으로 본 활용 방안
온보딩은 며칠에서 몇 주가 걸리는 전형적인 장기 작업형 워크플로입니다. 하루 만에 끝나지 않고 여러 부서와 시스템이 얽혀 있습니다. 구글 클라우드는 이 과정을 ADK(Agent Development Kit)와 Gemini Enterprise Agent Platform으로 구현합니다. 흐름은 다음과 같습니다.
- 입사가 확정되면 온보딩 코디네이터 에이전트가 입사자 정보, 부서, 직무, 입사일, 근무 형태를 확인하고, HR 정책 문서와 부서별 가이드를 참고해 준비 목록을 만듭니다.
- IT팀에는 계정과 장비를, 총무팀에는 좌석과 출입카드를, 보안팀에는 교육 배정을 요청합니다. 그리고 환영 패키지를 보낸 뒤 휴면 상태로 전환합니다.
- IT팀이 계정 생성을 완료하거나 신입사원이 서류에 서명하면 외부 이벤트가 에이전트를 깨웁니다. 백엔드에서 서명 확인이 완료되면 다음 단계로 넘어갑니다.
- 보안 권한처럼 민감한 항목은 담당자의 승인을 거칩니다. 코디네이터는 이 일을 혼자 처리하지 않고 계정 생성을 담당하는 전문 서브 에이전트에게 위임합니다.
- 별도의 평가 에이전트가 누락을 확인합니다. 장비 배송 웹훅이 도착하면 다시 깨어나 상태를 갱신하고 마지막으로 첫날 일정과 준비물, 접속 계정, 교육 링크를 정리해 보냅니다.
위 시나리오를 보면 장기 작업 에이전트롸 챗봇형 에이전트를 구분하는 기준이 세 가지라는 것을 알 수 있습니다. 바로 상태를 관리하는 견고한 메모리 스키마, 단계 사이에서 완전히 잠드는 이벤트 기반 휴면 상태 유지, 그리고 전문 에이전트에게 일을 나누는 멀티 에이전트 위임입니다. 이런 특징 덕분에 몇 주를 쉬어도 불필요하게 토큰을 사용하지 않고 컨텍스트도 오염되지 않습니다. 그렇다면 우리 조직에서는 어떤 업무부터 시작해야 할까요?
우리 조직에 맞는 워크플로를 찾는 법
장기 작업 에이전트는 모든 업무에 필요한 것이 아닙니다. 효과가 큰 업무가 따로 있습니다. 여러 날에 걸쳐 진행되고, 여러 시스템과 부서가 참여하며, 결재 라인에 따라 중간 승인이나 검토가 필요하고, 누락이 생기면 품질이나 규정 준수에 문제가 생기며, 담당자가 진행 상태를 계속 추적해야 하는 업무입니다. HR 온보딩, 구매 승인, 계약 검토, 보안 예외 승인, 고객 클레임 처리, 장애 사후 분석, 데이터 접근 권한 신청, 신규 프로젝트 개설 같은 워크플로우가 잘 어울린다고 할 수 있습니다.
우리 조직에 맞게 장기 작업 에이전트를 구현하려면 먼저 반복적인 업무가 무엇인지 목록을 정리합니다. 그리고 해당하는 업무를 단계로 쪼개 각 단계의 입력, 출력, 승인자, 예외 상황, 완료 조건을 정의합니다. 다음으로 에이전트가 맡을 단계와 사람이 반드시 확인할 단계를 나눕니다. 마지막으로 결과를 검증할 별도의 기준을 세웁니다. 이 정리가 끝나고 다음 단계는 구글 클라우드에서 PoC를 통해 효과를 검증해 보는 것입니다. 관련해 지원이 필요하시면 언제든 메가존소프트 문의 포탈을 통해 남겨주세요.





