예전 서버에서 네트워크 카드는 조연이었습니다. CPU가 계산을 하고, 네트워크 카드는 그 결과를 바깥으로 내보내는 통로 역할만 했습니다. 그런데 AI 학습과 추론이 들어오면서 그림이 바뀌었습니다. GPU 한 장으로는 큰 모델을 다 못 돌리니, 수백 장에서 수천 장의 GPU를 묶어 한 덩어리처럼 굴립니다. 이때 GPU들은 끊임없이 서로 데이터를 주고받아야 합니다.
바로 여기서 문제가 생깁니다. GPU 하나하나는 어마어마하게 빨라졌는데, 그 GPU들을 잇는 길이 좁으면 결국 길에서 막힙니다. 비싼 GPU가 데이터를 기다리며 노는 시간이 길어지는 것입니다. 에이전틱 AI는 여러 단계를 오가며 도구를 호출하고 중간 결과를 주고받기 때문에, 이 통신량이 한층 더 늘어납니다. GPU를 아무리 늘려도 네트워크가 못 따라오면 효율이 떨어진다는 것, 이것이 요즘 데이터센터 설계의 핵심 고민입니다.
그래서 네트워크 카드가 더 똑똑해지고, 더 빨라지고, 심지어 작은 컴퓨터까지 품게 되었습니다. 그 진화의 단계마다 새 이름이 붙었습니다. 이름의 계보를 따라가 보겠습니다.
가장 깔끔하게 정리하는 방법은 우체국에 빗대는 것입니다. 네트워크 카드의 일은 결국 데이터라는 우편물을 서버 안팎으로 나르는 일이니까요.
오프로드(Offload)가 뭔가요?
본체 CPU가 하던 일을 다른 전용 칩에게 떠넘기는 것을 오프로드라고 합니다. 식당으로 치면 주방장(CPU)이 설거지와 재료 손질까지 다 하던 것을, 보조 인력(DPU)에게 넘기고 주방장은 요리에만 집중하는 것입니다.
서버 CPU 코어의 상당 부분이 정작 애플리케이션이 아니라 네트워크 처리, 암복호화, 스토리지 입출력 같은 인프라 잡일에 쓰입니다. 이 잡일을 DPU로 넘기면 비싼 CPU 코어를 진짜 일에 쓸 수 있습니다. 이것이 DPU가 등장한 근본 이유입니다.
여기까지 보면 NIC, SmartNIC, DPU는 진화의 단계라 구분이 명확합니다. 그런데 진짜 혼란은 다음에 있습니다. 3단계 DPU를 회사마다 다른 이름으로 부른다는 점입니다. 본질은 같은데 브랜드가 다른 것입니다. 그래서 이름을 볼 때는 세 가지를 구분해야 헷갈리지 않습니다.
이 셋을 섞어 쓰니 헷갈리는 것입니다. 예를 들어 BlueField는 카테고리(DPU)가 아니라 NVIDIA의 브랜드 이름이고, 그 안의 BlueField-3가 실제 제품명입니다. 아래 표에 미국 업체부터 중국 업체까지 이 세 가지를 나란히 정리했습니다.
| 회사 | 카테고리 이름 | 브랜드 이름 | 실제 제품 예시 |
|---|---|---|---|
| NVIDIA미국 | DPU | BlueField | BlueField-3, BlueField-4 |
| Intel미국 | IPU | (별도 브랜드 없음) | Mount Evans, E2100 |
| AMD미국 | DPU | Pensando | Pensando Salina |
| AWS미국 | DPU | Nitro | Nitro 시스템(세대별) |
| 알리바바중국 | CIPU | 神龙shén lóng · 선룽 | CIPU(神龙 아키텍처 기반) |
| 텐센트중국 | DPU | 水杉 · 银杉shuǐ shān · yín shān · 수이산 · 인산 | 水杉(2x50G), 银杉(2x100G) |
| 화웨이중국 | DPU | (스토리지·서버 내장) | 智能网卡(zhì néng wǎng kǎ · 즈넝왕카 · 스마트NIC) 기반 DPU |
알리바바의 CIPU는 또 뭔가요?
CIPU는 Cloud Infrastructure Processing Unit, 클라우드 인프라 처리 장치의 약자입니다. 알리바바 클라우드가 2022년에 발표한 자체 칩으로, DPU나 IPU와 본질적으로 같은 일을 합니다. 인프라 잡일을 떠맡아 본체 CPU를 가볍게 하는 것입니다.
다만 알리바바는 여기에 한 가지를 더 강조합니다. 범용 상용 DPU가 여러 고객을 다 만족시키려다 보니 효율을 일부 양보하는 데 비해, CIPU는 자사 클라우드 운영체제(飞天 · fēi tiān · 페이톈)에 딱 맞춰 깊게 최적화했다는 것입니다. 이름을 따로 붙인 데는 이런 차별화 의도가 깔려 있습니다.
네 미국 회사부터 중국 3사까지 하는 일은 본질적으로 같습니다. 인프라 잡일을 별도 칩에 떠넘겨 본체 CPU를 가볍게 만드는 것입니다. NVIDIA는 2020년 BlueField로 DPU라는 이름을 사실상 표준으로 만들었고, AMD는 펜산도(Pensando)를 인수해 합류했으며, AWS의 Nitro는 이 분야의 원조 격입니다. 중국에서는 알리바바가 CIPU, 텐센트가 水杉(수이산)과 银杉(인산), 화웨이가 자사 스토리지·서버에 DPU를 녹여 넣는 식으로 각자의 길을 갔습니다. 그런데 부르는 이름은 DPU, IPU, Nitro, CIPU로 제각각입니다. 왜 이렇게 갈렸을까요.
사실 처음 이 분야를 개척한 멜라녹스(Mellanox, 현재 NVIDIA에 인수됨)는 IPU라는 이름을 먼저 썼습니다. 그런데 IPU는 다른 회사들이 전혀 다른 용도로 이미 쓰고 있던 이름이기도 했습니다. 그래픽코어(Graphcore)는 AI 학습용 칩을 IPU라고 불렀고, 인텔은 과거에 이미지 처리 장치를 IPU라고 부른 적이 있었습니다. 혼동이 너무 심해지자, 2020년 여름 무렵 주요 업체들이 DPU라는 새 이름으로 모이기 시작했습니다. 그런데 인텔만은 IPU를 고수했습니다. 자사 전략상 차별화를 위해서였습니다. 그래서 오늘날까지 DPU와 IPU가 같은 물건을 가리키며 공존하게 된 것입니다.
이름이 다르면 호환도 안 되나요?
아쉽게도 그렇습니다. NVIDIA의 DOCA, AMD 펜산도의 P4, 인텔 IPU의 개발 도구는 서로 호환되지 않습니다. 하드웨어가 비슷해도 프로그래밍하는 방식이 다르다는 뜻입니다.
그래서 한 번 특정 회사의 DPU를 도입하면 그 회사 생태계에 묶이는 일종의 잠금 효과가 생깁니다. 이름 통일이 안 된다는 것은 단순한 마케팅 문제가 아니라, 멀티벤더 환경의 실질적인 장벽이기도 합니다.
이제 가장 헷갈리는 SuperNIC(Super Network Interface Card) 차례입니다. 이름만 보면 SmartNIC의 상위 버전, 그러니까 DPU와 비슷한 무언가일 것 같습니다. 그런데 그렇지 않습니다. SuperNIC은 DPU와 목적 자체가 다릅니다. 핵심 키워드는 데이터가 흐르는 방향입니다.
정리하면 이렇습니다. DPU가 데이터센터 살림을 맡는 집사라면, SuperNIC은 GPU 군단을 한 호흡으로 움직이게 만드는 통신병입니다. NVIDIA가 SuperNIC이라는 새 이름을 따로 만든 이유가 여기 있습니다. AI 학습이 폭증하면서 GPU 간 통신이라는 영역이 워낙 중요해지자, 이걸 전담하는 카드를 별도 범주로 묶어 부르기 시작한 것입니다.
SuperNIC의 대표 제품인 NVIDIA ConnectX-8은 GPU 서버 사이에 최대 800Gb/s의 연결 속도를 제공합니다. PCIe 6세대를 지원하고, 카드 안에 PCIe 스위치까지 품고 있어 서버 설계를 단순하게 만들어 줍니다. 여기서 핵심 기술이 RoCE입니다.
RoCE(로키)가 뭔가요?
RoCE는 RDMA over Converged Ethernet의 약자입니다. 풀어 쓰면 융합 이더넷 위에서 쓰는 RDMA라는 뜻입니다. 여기서 RDMA(Remote Direct Memory Access)는 한 서버가 다른 서버의 메모리에 CPU를 거의 거치지 않고 직접 접근하는 기술입니다. 중간 단계를 건너뛰니 그만큼 빠르고 지연이 적습니다.
원래 이 RDMA는 인피니밴드(InfiniBand)라는 특수 네트워크에서 주로 쓰였습니다. RoCE는 이 빠른 방식을 일반 이더넷 위에서도 쓸 수 있게 만든 것입니다. 특수 장비 없이 익숙한 이더넷으로 인피니밴드급 성능을 노리는 셈입니다. AI 클러스터가 RoCE에 주목하는 이유가 바로 이것입니다.
한 가지 더 흥미로운 점이 있습니다. 같은 BlueField 칩이 부르는 이름에 따라 다른 제품이 됩니다. BlueField-3 DPU는 인프라 살림용이고, BlueField-3 SuperNIC은 GPU 통신용입니다. 같은 가문에서 나왔지만 맡은 일이 다른 형제인 셈입니다. NVIDIA의 AI 네트워크 플랫폼인 Spectrum-X는 이 SuperNIC과 전용 스위치를 한 묶음으로 결합해, 이더넷 위에서 AI 트래픽을 안정적으로 흘리도록 설계돼 있습니다.
복잡했던 이름들을 한자리에 모아 정리해 보겠습니다. 어두운 배경에 정리했으니 캡처해 두고 헷갈릴 때 꺼내 보셔도 좋습니다.
이 이름들을 단순한 마케팅 용어로 넘기면 곤란합니다. 반도체 쪽에서 일하다 보면, 이 명칭의 갈래가 곧 메모리와 스토리지 수요가 어디로 움직이는지를 가리키는 신호라는 게 보입니다.
DPU와 SuperNIC이 늘어난다는 것은 서버 한 대 안에 빠른 처리를 받쳐 줄 고성능 메모리와 NVMe 스토리지가 더 촘촘하게 들어간다는 뜻입니다. 800G급 통신이 표준이 되면 그 데이터를 받아 둘 그릇도 함께 커져야 합니다. 카드 이름이 다섯 갈래로 나뉘는 흐름의 끝에는, 결국 메모리와 스토리지 가치사슬의 재편이 있습니다. 한국 반도체 입장에서 놓치면 안 되는 대목입니다.
이름이 많은 이유는 두 가지입니다. 진화 단계가 갈리면서(NIC에서 DPU로), 그리고 회사마다 다르게 부르면서(DPU, IPU, Nitro)입니다.
그리고 SuperNIC은 그 계보 바깥의 별종입니다. 인프라 살림이 아니라 GPU 간 통신이라는 다른 목적을 위해 따로 태어난 이름입니다.
다음에 서버 카탈로그에서 이 단어들을 마주치면, 진화 단계인지, 회사 브랜드인지, 아니면 방향이 다른 SuperNIC인지부터 구분해 보시면 됩니다.
'AI' 카테고리의 다른 글
| 엔비디아 CUDA 생태계가 무서운 이유, 책상 위 AI 슈퍼컴퓨터로 직접 확인한 락인의 정체 (0) | 2026.05.31 |
|---|---|
| GPU TPU NPU PPU, 칩 이름은 왜 자꾸 늘어날까: 진짜 구조 차이일까, 마케팅일까 (1) | 2026.05.30 |
| 대구 광부의 손자에서 OpenAI 410억 달러 베팅까지, 손정의와 소프트뱅크 60년 총정리 (1) | 2026.05.24 |
| 알리바바 판구(Pangu) 스토리지 해부: 신화 속 도끼는 어떻게 데이터센터의 척추가 되었나 (0) | 2026.05.19 |
| HBM은 왜 이렇게 부족할까: 웨이퍼·수율·수요가 만드는 공급의 벽 (0) | 2026.05.19 |