2025년까지만 해도 모든 관심이 GPU에 쏠려 있었습니다. 그러나 에이전틱 AI(Agentic AI)가 본격화되자 상황이 달라졌습니다. 추론(Inference), 도구 호출(Tool Use), 메모리 관리, 워크플로 오케스트레이션 등 수많은 작업이 GPU가 아닌 CPU 위에서 돌아가야 하기 때문입니다. 한편 미국의 수출 제재에 묶인 중국은 외산 CPU 의존도를 낮추기 위해 ARM, x86을 넘어 RISC-V 기반 서버 CPU까지 자체 개발에 박차를 가하고 있습니다.
지난 2~3년간 AI 인프라 투자의 90% 이상은 GPU에 집중되었습니다. LLM을 학습시키는 데에는 행렬 곱셈을 대규모로 병렬 처리할 수 있는 GPU가 절대적으로 유리했기 때문입니다. 그러나 2026년에 접어들며 시장의 무게중심이 조금씩 이동하고 있습니다.
에이전트는 단순히 토큰을 생성하는 데 그치지 않습니다. 사용자의 요청을 분해하고, 외부 API를 호출하고, 데이터베이스를 조회하고, 파일을 읽고 쓰고, 다른 에이전트와 통신합니다. 이 모든 작업은 범용 컴퓨팅 자원, 즉 CPU의 영역입니다. 한 번의 GPU 추론이 끝나면 수십 번의 CPU 작업이 뒤따른다고 보면 됩니다.
2025년 중국 데이터센터 프로세서 시장에서 CPU는 여전히 33.78%의 점유율로 가장 큰 비중을 차지하고 있습니다. AI 가속기/ASIC이 21.85% CAGR로 가장 빠르게 성장하고는 있지만, CPU는 데이터센터의 신경계 역할을 그대로 유지하고 있습니다. 에이전틱 AI는 오히려 이 신경계의 부하를 늘리고 있습니다.
첫째, 추론 워크로드의 분산입니다. 학습은 GPU가, 추론은 점차 CPU가 일부 담당하는 방향으로 이동하고 있습니다. 양자화된 소형 모델은 CPU만으로도 충분히 서비스 가능합니다.
둘째, 도구 호출과 오케스트레이션입니다. LangChain, AutoGen 같은 에이전트 프레임워크는 본질적으로 CPU 워크로드입니다.
셋째, 메모리와 컨텍스트 관리입니다. 벡터 DB 조회, 임베딩 검색, 캐시 관리는 모두 CPU 중심 작업입니다.
넷째, 데이터 전처리와 후처리가 폭증하고 있습니다. 멀티모달 데이터의 디코딩, 인코딩, 필터링은 GPU의 일이 아닙니다.
다섯째, 비용입니다. GPU는 비싸고 부족합니다. CPU로 처리할 수 있는 일을 굳이 GPU에 태우는 것은 낭비입니다.
중국은 세계 최대의 서버 시장입니다. 2023년 기준 중국 한 나라에만 420만 대 이상의 서버가 설치되었습니다. 전 세계 서버 설치의 약 34%가 아시아 태평양에 집중되어 있고, 그중에서도 중국이 단연 압도적입니다.
문제는 이 서버를 굴리는 CPU가 거의 전부 미국산이었다는 점입니다. Intel Xeon과 AMD EPYC이 시장의 90% 이상을 차지하고 있었고, ARM 기반 외산 칩도 대부분 미국·영국 IP에 의존하고 있었습니다. 미국의 수출 통제가 강화되면서 중국은 다음과 같은 삼중고에 빠졌습니다.
- 고성능 서버 표준
- 수출 제재 대상
- 최신 칩 수입 차단
- 소프트웨어 호환성 최고
- 모바일 표준, 서버 확장 중
- 고가의 라이선스 비용
- 지정학적 리스크 존재
- 차세대 IP 접근 제한 가능성
- 라이선스 비용 0원
- 수출 제재 무관
- 완전한 설계 자유
- 생태계 미성숙
중국 정부의 답은 명확했습니다. '국산 자주 가능(国产自主可控)' 정책 아래 모든 가능한 카드를 동시에 쓰는 것입니다. 자체 ARM 라이선스 활용, x86 합작 우회, 그리고 장기적으로는 RISC-V 전환입니다.
중국 서버 CPU는 단일 진영이 아닙니다. ISA(명령어 집합)별로 최소 6개 패밀리가 동시에 경쟁하고 있습니다. 각자 다른 출신, 다른 전략, 다른 강점을 가지고 있습니다.
| 제조사 | 대표 제품 | 아키텍처 | 주요 용도 |
|---|---|---|---|
| Huawei (HiSilicon) | Kunpeng 920 / 920 V200 | ARM v8 | 서버 · 클라우드 · 통신 |
| Hygon (海光) | C86 시리즈, 7000번대 | x86 | 일반 서버 · 데스크톱 |
| Phytium (飞腾) | FT-S2500, S5000C, FTC870 | ARM | 정부 · 공공 · 워크스테이션 |
| Loongson (龙芯) | 3C6000, 3D5000, 3A6000 | LoongArch | 정부 · 교육 · 임베디드 |
| Zhaoxin (兆芯) | KH-4000, KX-7000 | x86 | 데스크톱 · 일반 서버 |
| Sunway (申威) | SW26010-Pro | SW (Alpha 계열) | 슈퍼컴퓨팅 (Sunway TaihuLight) |
| Alibaba T-Head | Yitian 710, XuanTie C950 | ARM / RISC-V | 클라우드 · AI · 에이전트 |
Huawei가 자회사 HiSilicon을 통해 개발한 서버 CPU 라인입니다. 2019년 출시 당시 64코어, DDR4 8채널, PCIe 4.0, 100GbE RoCE 통합 등 당시 Intel과 AMD의 주력 제품을 기술적으로 추월하는 사양으로 화제가 되었습니다. 화웨이의 TaiShan 서버 라인과 Huawei Cloud의 핵심 컴퓨팅 자원으로 쓰이고 있으며, Kunpeng 920 V200은 이전 세대 대비 메모리 대역폭 60%, IO 대역폭 66%, 네트워크 대역폭 4배를 끌어올렸습니다.
중국 서버 CPU 시장에서 Kunpeng 시리즈는 단일 라인업으로는 가장 큰 점유율인 약 10%를 차지하고 있습니다. 다만 ARM ISA 의존이라는 한계 때문에 화웨이도 장기적으로는 자체 ISA 또는 RISC-V로의 다변화를 모색하고 있는 것으로 알려져 있습니다.
Hygon은 AMD와의 합작 벤처에서 출발한 x86 호환 CPU 제조사입니다. 초기 모델은 AMD의 1세대 Zen 아키텍처(Naples)에 중국 전용 암호화 기능을 더한 형태였습니다. 2025년 발표된 4.0GHz C86 프로세서는 중국의 IT 국산화 전략이 '쓸 수 있는' 단계에서 '경쟁력 있는' 단계로 넘어갔음을 보여주는 상징적 제품입니다.
최근에는 7000번대(7165, 7185), 73XX, 74XX 시리즈가 차이나유니콤을 중심으로 통신 3사 서버에 빠르게 도입되고 있습니다. 74XX 시리즈는 DDR5까지 지원하기 시작했습니다. x86 호환성을 그대로 유지한다는 점이 가장 큰 강점이지만, 동시에 미국 IP 의존이라는 약점도 안고 있습니다.
Phytium은 정부, 공공기관, 국책 사업 중심으로 자리잡은 ARM 기반 CPU 제조사입니다. 미국 Entity List에 올라 있지만, 중국 내수 시장만으로 FeiTeng 시리즈 누적 1,000만 대 출하를 돌파했습니다. 64코어 Tengyun S2500과 ARM Neoverse N2급 성능을 표방하는 FTC870이 대표 제품입니다.
2025년 양산된 S5000C-E는 SPEC CPU 2006 정수 단일코어 31.9점, 부동소수점 37.7점, 듀얼 소켓 환경에서 정수 2540점을 기록하며 DDR5까지 지원합니다. 중국 양회(两会) 등 국가 핵심 행사의 인텔리전트 컴퓨팅 인프라에도 투입된 바 있습니다.
Loongson은 중국에서 가장 '순수한 자주(自主)'를 표방하는 CPU 회사입니다. ARM도 x86도 아닌 자체 ISA LoongArch를 사용합니다. LoongArch가 MIPS에서 파생되었다는 평가도 있지만, 중국 내부에서는 독자 ISA로 분류됩니다.
주력 제품인 3C6000은 2026년 본격 양산을 앞두고 있으며, 32코어 3D5000은 두 개의 칩렛(chiplet)으로 구성된 130~170W 데이터센터 칩입니다. 16코어 3D7000(7nm)도 2026년 샘플을 목표로 하고 있어, 중급 라이젠과의 멀티스레드 경쟁이 예상됩니다. 정부, 학교, 톈궁(天宫) 우주정거장 등 자주성이 가장 중요한 영역에 우선 배치되고 있습니다.
알리바바는 두 개의 칩 라인을 동시에 운영하는 독특한 전략을 취하고 있습니다. Yitian 710은 5nm 공정의 128코어 ARM 서버 CPU로, 알리바바 클라우드 내부 워크로드의 80%가 이 칩으로 이전되었으며 연간 1억 2천만 달러의 에너지 비용을 절감했다고 발표한 바 있습니다.
그리고 다른 한 축이 RISC-V 기반의 XuanTie(玄铁) 시리즈입니다. C910 → C920 → C930을 거쳐, 2026년 3월 발표된 XuanTie C950은 RISC-V 서버 CPU의 게임 체인저로 평가받고 있습니다.
2026년 3월 24일, 상하이에서 열린 알리바바 다모학원(DAMO Academy)의 RISC-V 생태계 컨퍼런스는 단순한 신제품 발표회가 아니었습니다. RISC-V가 마이크로컨트롤러와 IoT 칩의 영역을 벗어나 본격적으로 서버급 컴퓨팅에 진입했음을 알리는 자리였습니다.
5nm 공정 · 3.2GHz · 8-instruction 디코딩 · 16단 파이프라인 · 1,000개 이상 비순차 명령 윈도우 · RVA23.1 표준/옵션 확장 전부 지원 · CoVE 기밀 컴퓨팅 네이티브 · 메모리 대역폭 C920 대비 4배
단일 코어 점수
성능 향상
C950이 특별한 이유는 단순한 사양 때문이 아닙니다. 대규모 매개변수 모델을 CPU만으로 네이티브 실행할 수 있는 최초의 RISC-V 칩이라는 점입니다. 다모학원은 C950에 자체 개발한 AI 가속 엔진(XuanTie Tensor Processing Engine, TPE)을 통합했습니다. TPE는 FP16부터 INT4/FP8, 그리고 마이크로 스케일링 포맷인 MXFP8, MXFP4, RVFP4까지 지원하며, TPE 한 개당 8 TOPS의 성능을 냅니다.
이 구조 위에서 C950은 Qwen3-235B(2,350억 파라미터)와 DeepSeek V3-671B(6,710억 파라미터) 같은 초대형 모델을 GPU 없이 CPU 단독으로 구동할 수 있다고 합니다. MySQL, Redis, Nginx, OpenSSL 같은 일반 클라우드 워크로드에서는 주류 제품 대비 30% 이상의 성능 우위를 보입니다.
물론 냉정한 평가도 있습니다. SPECint2006이 이미 SPEC 컨소시엄에서 퇴역시킨 벤치마크라는 점, 단일 코어 70점은 Apple M1(2020년 출시)과 비슷한 수준이라는 점은 짚고 넘어가야 합니다. Intel Xeon 6이나 AMD EPYC Turin과 직접 비교하면 여전히 격차가 존재합니다. 그러나 RISC-V가 마침내 '서버 후보군'에 진입했다는 사실 자체가 산업적으로 큰 의미를 가집니다.
중국의 RISC-V 베팅은 기술적 선택이라기보다 전략적 선택에 가깝습니다. ARM도 좋고 x86도 좋지만, 둘 다 미국·영국 IP에 묶여 있다는 점이 중국 입장에서는 치명적인 약점입니다.
ARM의 아키텍처 라이선스는 수천만 달러에서 수억 달러에 이르고, 출하 칩 한 개당 별도의 로열티가 부과됩니다. 알리바바, 화웨이, 텐센트처럼 연간 수백만 개 단위로 칩을 출하하는 빅테크에게는 누적 비용이 막대합니다. 반면 RISC-V는 로열티 프리, 라이선스 프리입니다. 누구나 무료로 ISA를 사용해 칩을 설계할 수 있습니다.
2022년 이후 미국은 중국에 고성능 ARM 코어 IP의 수출도 제한하기 시작했습니다. ARM 자체가 영국 회사이지만, 핵심 IP는 미·영에서 개발되며 미국 수출 통제(EAR) 적용을 받습니다. 알리바바와 텐센트는 자사의 하드웨어 공급업체에 향후 RISC-V로 전환할 것을 명시적으로 권고하고 있습니다.
RISC-V는 모듈러 ISA입니다. 코어 설계자가 자신의 워크로드에 맞춰 명령어 확장을 자유롭게 추가할 수 있습니다. 알리바바가 C950에 AI 추론용 명령어와 기밀 컴퓨팅(CoVE) 명령어를 통합할 수 있었던 것도 RISC-V이기 때문에 가능했습니다.
RISC-V 시장 규모
예상 시장 규모
연평균 성장률(CAGR)
디바이스 출하 전망
중국 데이터센터 프로세서 시장에서 RISC-V는 22.35% CAGR로 성장 중이며, 같은 시장에서 x86은 47.25% 점유율을 유지하고는 있지만 그 자리를 지속적으로 잠식당하고 있습니다. 알리바바 다모학원, 화웨이, 텐센트 외에도 중국과학원의 샹산(XiangShan) CPU, 베이징 오픈소스 칩 연구원(BOSC)의 16코어 RISC-V 등 다수의 프로젝트가 동시 다발적으로 진행 중입니다.
중국 서버 CPU 국산화의 진행 속도를 가장 적나라하게 보여주는 지표가 통신 3사의 서버 조달 비율입니다. 차이나텔레콤은 신규 도입하는 156,000대 서버 중 67.5%를 'G-시리즈'(중국산 CPU 탑재)로 조달하기로 했습니다. 불과 4년 전인 2020년에는 이 비율이 19.9%에 불과했습니다.
이렇게 빠르게 전환할 수 있었던 배경에는 'Made in China 2025' 정책과 '3-5-2 계획'이 있습니다. 3-5-2는 정부 부처와 공공 영역에서 30%, 50%, 70%로 단계적으로 외산 CPU를 대체하고 2027년까지 민감 시스템에서 x86을 완전히 제거한다는 목표입니다. 정부 데이터센터의 70% 이상을 국산 부품으로 채워야 한다는 규정 역시 강력한 수요를 만들고 있습니다.
여기에 텐센트가 발표한 TencentOS Server V3는 화웨이 Kunpeng, Hygon, Phytium FeiTeng을 모두 지원하는 통합 운영체제입니다. 즉, 어플리케이션 레이어에서 ISA를 추상화해 중국 빅테크가 어떤 국산 CPU 위에서도 워크로드를 돌릴 수 있도록 만든 것입니다. 이는 ARM, x86, LoongArch, RISC-V가 동시에 공존하는 중국식 멀티 ISA 전략의 소프트웨어 기반입니다.
지금까지의 흐름은 분명 인상적이지만, 중국 서버 CPU가 곧바로 Intel과 AMD를 대체할 수 있다고 보는 것은 무리입니다. 여러 측면에서 격차가 남아 있습니다.
첫째, 공정 기술입니다. 알리바바 C950은 5nm 공정으로 제작되었지만, TSMC의 최신 N3E와는 거리가 있습니다. SMIC의 7nm가 양산 가능한 최선이고, 5nm 이하는 아직 외부 파운드리에 의존해야 합니다.
둘째, 메모리 인터페이스입니다. Huawei Kunpeng 920, Hygon 73XX, Zhaoxin KH-4000, Loongson 3C6000은 여전히 DDR4를 사용합니다. 글로벌 시장은 이미 DDR5로 넘어왔고, AI 워크로드는 메모리 대역폭에 매우 민감합니다. Phytium S5000C, Hygon 74XX, Huawei Kunpeng 920 V200, Zhaoxin KX-7000이 DDR5를 지원하기 시작했지만, 보급에는 시간이 걸립니다.
셋째, 소프트웨어 생태계입니다. RISC-V는 RVA23.1 프로파일을 통해 표준화가 진척되고 있지만, ARM이나 x86만큼 성숙한 컴파일러, 디버거, 라이브러리, 검증 자산을 갖추기까지는 더 많은 시간이 필요합니다.
넷째, 단일 칩 성능입니다. C950의 SPECint2006 70점은 RISC-V로서는 기록적이지만, 최신 Intel·AMD 서버 칩은 같은 벤치마크에서 단일 코어 100점 이상을 기록합니다. 멀티 코어 확장성, 캐시 일관성, NUMA 동작 등에서도 차이가 납니다.
에이전틱 AI는 컴퓨팅의 무게중심을 GPU 단독에서 'GPU + CPU'의 균형으로 되돌리고 있습니다. 추론, 도구 호출, 오케스트레이션, 메모리 관리는 결국 CPU의 일이고, 에이전트의 시대에 이 작업들의 비중은 폭발적으로 늘어납니다. 즉, 범용 컴퓨팅의 르네상스가 시작된 것입니다.
그리고 그 변곡점에서 중국은 외산 의존의 사슬을 끊어내려는 가장 큰 실험을 진행 중입니다. ARM의 비싼 라이선스 비용도, x86의 수출 제재도 우회하기 위한 답이 RISC-V입니다. 알리바바 XuanTie C950은 이 실험이 마침내 '쓸 만한' 단계에 진입했음을 보여주는 신호탄입니다.
한국 입장에서도 이 흐름은 중요합니다. 글로벌 클라우드 인프라가 단일 ISA(x86 또는 ARM) 중심에서 멀티 ISA로 다변화되면, 메모리, 패키징, 시스템 IP 등 한국이 강점을 가진 영역의 기회 구조가 함께 바뀌기 때문입니다. RISC-V는 단순한 기술 선택이 아니라 향후 10년의 글로벌 컴퓨팅 지정학을 결정짓는 변수입니다.
'AI' 카테고리의 다른 글
| AI 시대의 진짜 주인공은 대만? (0) | 2026.05.12 |
|---|---|
| 동수서산(東數西算), 중국이 사막에 AI를 심는 이유 (0) | 2026.05.12 |
| 세레브라스(Cerebras) 심층분석 (0) | 2026.05.11 |
| AI 무게 중심 전쟁 ─ 머스크의 "깡통폰" vs 빅테크의 "온디바이스 AI", 정반대로 가는 두 미래 (0) | 2026.05.11 |
| 양자컴퓨터란? 큐비트의 중첩과 얽힘을 그림으로 이해하기 (0) | 2026.05.11 |