해해랑달·Founder Analyst2026년 6월 14일읽기 20분추론 CPU, 에이전틱, 분리형 추론, KV 오프로딩, ARM 서버, LPDDR5X, SOCAMM, CXL DRAM, 한국 메모리, 해랑달의 시각
'추론에 CPU가 이 정도 필요하다'는 주장을 측정된 사실·이해당사자 전망·상쇄 요인으로 분해 — 증거의 3층위와 한국 메모리 파생
정직한 명제는 '추론이 CPU로 이동한다'가 아니라 'CPU는 과소 프로비저닝된 싸지만 치명적인 조율자이고, 어태치는 GPU와 함께 늘며, 에이전틱·RL이 진짜 신규 CPU 수요를 더한다'이다. 한국 수혜는 magnitude 논쟁과 무관하게 어태치 물량만으로 성립하는 CPU 부착 메모리(LPDDR5X·SOCAMM·CXL DRAM)다.
인텔의 'CPU:GPU 1:1 수렴'·Arm의 'GW당 코어 4배'·NVIDIA의 'Vera 1.8배'·카운터포인트의 '2029년 90%'·UBS의 '서버 CPU 1,700억 달러' 전망이 쏟아지며 '추론 시대의 CPU'가 투자 축으로 부상했다. 그러나 이는 측정이 아니라 이해당사자 전망이고, 중립 논문 측정과는 층위가 다르다.
구조적 수혜 — 어태치 물량(ARM·NVIDIA Grace·Vera), 에이전틱·RL 신규 수요(별도 CPU 랙·Arm AGI CPU), 공급발 가격(AMD·인텔). 한국 2차 파생 — 삼성전자·SK하이닉스(LPDDR5X·SOCAMM·CXL DRAM 콘텐츠). 상쇄 요인 — 연산 본체는 GPU 잔존, CPU는 '싼 쪽', 효율화(CPU-free 서빙)·공급발 가격. 모니터링 — 에이전틱·RL 비중, 프로비저닝 비율, 서버 CPU ASP·리드타임, ARM 점유율, CXL 프로덕션화, 한국 메모리 가이던스.
'추론에 CPU가 이 정도 필요한가'라는 질문은 그대로는 답할 수 없다. '추론'이 CPU 강도가 완전히 다른 세 영역을 뭉뚱그리기 때문이다. 세 영역을 분리하면 그 주장이 참인 곳과 과장된 곳이 갈린다.
| 영역 | CPU의 역할 | CPU 강도 |
|---|---|---|
| 주류 토큰 서빙 | 토큰화·커널 런치·요청 스케줄링(제어 평면) | 낮음~중간 — 단, 굶기면 치명적 |
| + | decode측 메모리 계층(CPU DRAM·) 관장 | 메모리 중심 — CPU 연산이 아님 |
| · | 툴 실행·코드 컴파일·검증 샌드박스 | 높음 — 여기서만 '이 정도'가 참 |
직전 판은 세 영역을 '추론'으로 합쳐 2·3번의 강도를 1번에까지 투사했다. 이번 판은 영역별로 증거 수준을 분리해 다룬다.
'추론에 CPU가 얼마나 필요한가'는 영역을 쪼개야 답이 나온다. 주류 토큰 서빙엔 적당히, 분리형엔 메모리로, 에이전틱엔 진짜로. 한 덩어리로 묶는 순간 주장은 과장된다.
Google 계정으로 로그인하면 등급 확인 후 자동으로 열람 권한이 부여됩니다.
Google로 로그인광고 모델로 운영되는 비영리 사이트입니다. 등업제는 활동 기여를 인정하기 위한 시스템입니다.
본 리포트는 정보 제공 목적으로 작성되었으며, 특정 금융상품의 매수 또는 매도를 권유하지 않습니다. 투자 결정은 본인의 판단과 책임 하에 이루어져야 하며, 본 콘텐츠에 포함된 분석과 의견은 작성 시점의 정보를 바탕으로 한 것으로, 향후 변경될 수 있습니다.