반응형
SMALL

gpu 2

에이전틱 AI 시대, GPU 독주는 끝났다 — 6:3:1로 재편되는 AI 인프라 패러다임

에이전틱 AI 시대, GPU 독주는 끝났다 — 6:3:1로 재편되는 AI 인프라 패러다임학습에서 추론·실행으로 무게 중심이 옮겨가면서 CPU와 스토리지가 다시 주인공으로 돌아왔다. 그런데 이 6:3:1이라는 숫자, 기준이 '전력(W)'이라는 점을 놓치면 안 된다. 데이터센터의 진짜 제약은 그리드이기 때문이다.지난 2~3년간 AI 인프라 투자의 90% 이상은 사실상 GPU 한 곳으로 쏠렸다. 하지만 2026년 들어 이 공식이 빠르게 깨지고 있다. AI가 단발성 응답에서 스스로 계획하고 도구를 호출하며 여러 단계를 실행하는 에이전트로 진화하면서, 워크로드의 성격 자체가 변했기 때문이다. 결과적으로 데이터센터의 전력 예산(W)을 기준으로 GPU·CPU·스토리지의 무게중심이 대략 6:3:1 수준으로 재조정될 것..

AI 2026.05.10

CPU·GPU·GPGPU·TPU·NPU 한 방에 정리:AI 가속기 완전 가이드 (그리고 NVIDIA에서 벗어나려는 중국)

AI 인프라 · 반도체CPU·GPU·GPGPU·TPU·NPU 한 방에 정리:AI 가속기 완전 가이드 (그리고 NVIDIA에서 벗어나려는 중국)"AI에 GPU 쓴다"는 말, 절반은 맞고 절반은 틀리다. 진짜는 GPGPU다. 그리고 구글의 TPU, 폰 속의 NPU, 화웨이 어센드까지 — AI 칩의 세계는 생각보다 훨씬 복잡하다."GPU 모르는 사람이 어디 있어?" 다들 이렇게 생각한다. 게임할 때 그래픽카드, ChatGPT 돌릴 때 NVIDIA 칩, 끝. 그런데 사실 우리가 AI에서 말하는 그 GPU는 정확히 말하면 GPGPU다. 그래픽 출력 단자조차 없는 모델도 많다.거기다 구글은 TPU를 따로 만들었고, 폰과 노트북에는 NPU가 들어가 있다. 미국이 첨단 GPU 수출을 막자 중국은 어센드·캠브리콘·비렌 ..

AI 2026.05.10
반응형
LIST