해해랑달·Founder Analyst2026년 5월 16일읽기 18분에이전틱AI, 침투도역산, 토큰처리량, ARR역전, 웹트래픽, ChatGPT, Claude, ClaudeCode, Anthropic, OpenAI, TPU, Broadcom, HBM, AI데이터센터분기, 해랑달의시각
AI 데이터센터의 분기 후속 — 토큰·트래픽·ARR 세 게이지로 에이전트 경제의 진짜 진도를 측정한다
에이전트는 이미 LLM 산업 매출의 36%를 차지하지만 트래픽 비중은 5% 미만이다. 매출 곡선은 사용자 수가 아니라 토큰을 따라간다.
Anthropic ARR이 4개월 만에 $9B에서 $30B로 3.3배 점프, 같은 기간 웹 트래픽은 2.2%에서 6.0%로만 증가. Claude Code 단일 제품이 6개월 만에 ARR $1B, 14개월 만에 $2.5B 도달.
토큰 가격 하락이 사용량 곱셈을 상회하면 단위경제가 좁아지고 손익 분기점이 2028년에서 2030년으로 밀린다. 메이저 클라우드 자체 모델 강화·중국 오픈소스 코딩 에이전트 동급 성능이 핵심 위험.
TPU 가치사슬(Alphabet·Broadcom·Amazon Bedrock+$8B 직접 투자), 메모리 HBM(SK하이닉스·삼성·마이크론), OpenAI 노출(Microsoft·Oracle). 1차는 토큰 처리량 분기 공시, 2차는 HBM 발주 사이클로 검증.
LLM 산업의 수요를 측정하는 객관적 지표는 셋이다. 각각이 보는 그림이 다르고, 셋을 교차했을 때 비로소 에이전트의 침투도를 역산할 수 있다.
토큰()은 LLM이 텍스트를 처리하는 최소 단위다. GPU·TPU(텐서 처리 장치) 사이클로 직접 환산된다. 토큰 수요는 곧 컴퓨팅 수요이며, 데이터센터 투자 사이클의 발화점이다. Google은 2025년 5월 I/O에서 처음으로 월간 토큰 처리량을 공개했고, 그 후 분기마다 이 수치를 갱신해왔다.
단점은 두 가지다. 첫째, 이 수치는 모델 효율과 추론 깊이에 영향을 받는다. Gemini 2.5 Flash 같은 추론 모델은 동일 요청에 17배 많은 토큰을 소비한다. 둘째, 정의가 일관되지 않는다. Alphabet은 2026년 Q4 어닝콜부터 `across surfaces`(전 채널 합산) 대신 `direct API tokens per minute`(API 직호출 분당)로 보고 기준을 바꿨다. 절대 수치 비교 시 주의가 필요하다.
Similarweb이 도메인 단위로 추적하는 웹 트래픽 점유율은 컨슈머 챗봇 사용자가 어느 플랫폼을 쓰는지를 보여준다. 이 게이지는 일반 사용자의 분포를 정확히 잡아내지만, 결정적 한계가 있다. API 호출, 모바일 앱, 임베디드 통합, 에이전트 워크플로우는 전혀 잡히지 않는다.
바로 이 한계가 분석의 출발점이다. 트래픽으로 측정되는 사용자는 챗봇 사용자이며, 트래픽으로 측정되지 않는 사용자가 곧 에이전트 사용자다. 두 사용자군의 비중과 가치를 역산하기 위해서는 트래픽 외부에서 흐르는 매출 — 즉 ARR을 함께 봐야 한다.
ARR(Annual Recurring Revenue, 연환산 반복 매출)은 사용자가 실제 지불한 매출의 연환산 추정치다. 컨슈머 구독(ChatGPT Plus, Claude Pro), 엔터프라이즈 시트, 그리고 무엇보다 API 토큰 결제가 모두 합산된다. 사용자 한 명이 챗봇 메시지 한 줄을 보내든, 에이전트가 백그라운드에서 1,000만 토큰을 처리하든, 토큰 단가가 곱해지면 매출이 된다.
셋을 교차하면 단순 비례가 깨진다. 이 깨짐의 폭이 곧 에이전트의 침투 깊이다.
Google 계정으로 로그인하면 등급 확인 후 자동으로 열람 권한이 부여됩니다.
Google로 로그인광고 모델로 운영되는 비영리 사이트입니다. 등업제는 활동 기여를 인정하기 위한 시스템입니다.
본 리포트는 정보 제공 목적으로 작성되었으며, 특정 금융상품의 매수 또는 매도를 권유하지 않습니다. 투자 결정은 본인의 판단과 책임 하에 이루어져야 하며, 본 콘텐츠에 포함된 분석과 의견은 작성 시점의 정보를 바탕으로 한 것으로, 향후 변경될 수 있습니다.