현재 메모리 시장은 단순한 가격 상승 국면이 아니라, 구조적 공급 부족 단계에 진입한 것으로 평가됩니다. 다음 수치만 봐도 시장의 비정상성을 짐작할 수 있습니다.
특히 NVIDIA B300 GPU 한 장에는 HBM 8개 × 12단 DRAM = 96개의 DRAM 다이가 탑재되며, DGX B300 시스템 한 대에는 768개의 DRAM 다이가 들어갑니다. AI 가속기 한 장이 일반 PC 수십~수백 대 수준의 메모리를 흡수하는 셈입니다. 여기에 추론(Inference) 단계에서 폭증하는 KV 캐시(Context Memory) 수요까지 더해지면서, NVIDIA는 ICMSP(Inference Context Memory Storage Platform)라는 새로운 스토리지 티어까지 도입한 상태입니다.
기존의 챗봇형 AI는 사용자가 질문할 때만 GPU가 깨어났습니다. 반면 Agentic AI는 업무를 위임받아 스스로 계획하고 실행하는 구조이기 때문에, 인스턴스가 장시간 백그라운드에서 동작합니다. 이 동안 컨텍스트, 중간 추론 결과, 도구 호출 이력 등이 모두 메모리에 상주해야 합니다.
긴 컨텍스트 윈도우를 사용하는 모델일수록 추론 시 KV 캐시가 기하급수적으로 늘어납니다. 동일한 트래픽이라도 컨텍스트 길이가 늘어나면 GPU·HBM 점유 시간이 길어지고, 결과적으로 동일한 처리량을 위해 더 많은 HBM과 DRAM이 필요해집니다.
학습용 GPU 클러스터는 한 번 구축되면 끝이지만, 추론용 인프라는 사용자 트래픽에 비례해 지속적으로 확장해야 합니다. 시장은 이제 “학습 인프라 한 번 사고 끝”이 아니라, “추론 인프라를 매년 더 사야 하는 단계”로 넘어가고 있습니다.
주요 메모리 제조사들은 이익률이 훨씬 높은 HBM과 고용량 DDR5에 캐파를 우선 배정하고 있습니다. 그 결과 스마트폰·PC용 일반 DRAM과 NAND가 구조적으로 부족해지는 ‘크라우드 아웃(Crowd-out)’ 현상이 발생했습니다.
아래는 2025년 말 ~ 2026년 4월 사이에 공개된 주요 발언과 보고서를 정리한 것입니다. 대체로 “2027년 중후반 ~ 2028년”에 공급 부족이 풀릴 것이라는 전망이 우세하며, 일부에서는 더 길게 보는 시각도 있습니다.
| 전망 주체 | 예상 종료 시점 | 핵심 근거 |
|---|---|---|
| Macquarie / Intel CEO | 2028년 이후 | 신규 팹 3곳의 수율 안정화 지연, 누적 대기 수요 |
| IDC / Omdia / Micron | 2027년 후반 | HBM이 일반 DRAM 캐파를 계속 잠식 |
| Nomura / BofA | 2027년 말 ~ 2028년 | 슈퍼사이클 지속, 의미 있는 캐파 증설은 2028년 이후 |
| SEMI | 2028년에도 둔화 가능성 낮음 | 업체들이 증설보다 공정 전환에 집중 |
| Deloitte (시나리오) | 최장 10년 (참고용) | AI 메모리가 일반 메모리 캐파를 구조적으로 잠식한다는 가정 |
정리하면, “2026~2027년은 거의 확정적 호황, 2028년이 첫 번째 분기점”이라는 데에 컨센서스가 형성되어 있습니다. 다만 SEMI와 일부 보고서는 그 분기점에서도 둔화가 강하지 않을 수 있다는 시각을 제시하고 있어, 사이클의 길이가 종전보다 더 길어질 가능성도 함께 열려 있는 상황입니다.
- HBM은 일반 DRAM과 ‘대체재’ 관계입니다. 한 라인을 HBM으로 돌리면 일반 DRAM이 줄어드는 구조이기 때문에, HBM 수요가 늘수록 일반 메모리 부족은 심해집니다.
- HBM은 첨단 패키징(2.5D / 3D, CoWoS급)의 병목에 묶여 있습니다. 단순히 웨이퍼만 늘려서는 출하량이 따라가지 않습니다.
- 신규 팹은 1.5~2년 이상 시간이 걸리며, 초기 수율 안정화에 다시 1년 이상이 소요됩니다. 마이크론의 싱가포르 240억 달러 증설 발표(2026년 1월)도 실효적인 출하량 기여 시점은 2027년 이후로 보는 시각이 우세합니다.
- 주요 업체들이 증설보다 차세대 공정 전환(1β, 1γ 등)에 자금을 투입하고 있어, 단기적 절대 캐파 증가가 제한적입니다.
- 빅테크가 5년 단위 장기공급 계약으로 캐파를 미리 잠그면서, 일반 시장에 풀리는 물량 자체가 줄어들고 있습니다.
이번 사이클의 가장 큰 수혜는 HBM 기술 격차를 가진 업체들에게 집중되고 있습니다. UBS는 NVIDIA 차세대 ‘Rubin(루빈)’ 플랫폼에 탑재될 HBM4 시장에서 SK하이닉스가 약 70% 점유율을 가져갈 것으로 전망했고, 삼성전자 역시 메모리 영업이익이 큰 폭으로 개선될 것이라는 컨센서스가 형성되어 있습니다.
특히 주목할 점은 이번 호황이 대형 메모리 3사에만 머물지 않는 ‘확장형 사이클’이라는 분석입니다. HBM 후공정·테스트 장비, 2.5D / 3D 패키징, 실리콘 인터포저, 첨단 범프 공정 관련 국내 소부장 업체까지 수혜가 확산되고 있습니다. SEMI는 2025년 반도체 테스트 장비 매출 +48%, A&P 장비 +20%를 전망했고, 2026~2027년에도 성장세가 이어질 것으로 보고 있습니다.
- AI 자본지출 페이스 둔화 — 빅테크의 AI 인프라 투자가 ROI 압박으로 인해 둔화될 경우, 사이클이 조기에 꺾일 수 있습니다.
- HBM 가격 협상력 약화 — 후발 업체의 HBM 진입과 캐파 확대가 빨라질 경우, 단가 측면의 조정이 먼저 올 수 있습니다.
- 매크로 리스크 — 관세, 에너지 비용, 환율 등이 엔터프라이즈 IT 수요를 위축시킬 가능성.
- 기술 대체 — 인텔·소프트뱅크의 ‘사이메모리(Saimemory)’처럼 HBM의 전력·비용 구조를 흔들 수 있는 차세대 메모리 개발이 2027~2028년경 가시화될 수 있습니다.
- 재고 사이클 — 채널 재고가 일정 수준을 넘기면 단기 가격 조정이 발생할 수 있습니다. (다만 실수요 자체가 견고하다는 점에서 폭락보다는 단기 조정에 가까울 가능성.)
주요 기관·투자은행·반도체 임원들의 발언을 종합하면, 이번 메모리·스토리지 슈퍼사이클은 최소 2027년 후반, 보수적으로 2028년까지 이어질 것이라는 컨센서스가 형성되어 있습니다.
그 핵심 동력은 단순한 경기 반등이 아니라 Agentic AI와 추론 워크로드가 만들어낸 새로운 메모리 수요 구조이며, 이것이 과거 사이클과의 본질적 차이입니다.
HBM·고용량 DDR5 등 AI 메모리에 캐파가 우선 배정되면서, 일반 DRAM·NAND의 부족은 사이클 종료 이후에도 일정 부분 잔존할 가능성이 있습니다.
'AI' 카테고리의 다른 글
| 텐센트는 게임 회사만이 아니다: 1,200개 기업을 거느린 거대 투자 지주회사의 또 다른 얼굴 (0) | 2026.05.16 |
|---|---|
| Cerebras(CBRS) IPO 첫날 68% 폭등, 엔비디아 대항마라고 부를 수 있을까 (1) | 2026.05.16 |
| 2026 베이징 모터쇼 완벽 정리독일차의 위기, AI 전기차의 시대,그리고 중국 자동차의 미래 (0) | 2026.05.15 |
| 디퓨전 모델(Diffusion Model)의 모든 것: 노이즈가 그림이 되는 과정과 정확도 향상 전략 (0) | 2026.05.15 |
| AI 연산의 정체는 결국 행렬 곱셈입니다: LLM·추천시스템·벡터검색 핵심 연산 완전 정복 (0) | 2026.05.15 |