중국 AI 업계, 무료의 시대 저문다. Doubao 유료화·알리바바 클라우드 34% 인상이 보내는 신호

marvin-jung 2026. 5. 16. 21:37

SMALL

베이징 현지 관찰AI 인프라 분석2026.05

베이징에서 일하면서 가장 최근에 체감한 변화가 있습니다. "중국 AI는 무료 또는 헐값이다"라는 공식이 더 이상 통하지 않습니다. ByteDance의 Doubao는 월 68·200·500위안짜리 유료 구독을 테스트 중이고, 알리바바·바이두·텐센트 등 주요 클라우드 사업자들은 AI 컴퓨팅과 스토리지 가격을 일제히 올리고 있습니다. 단순한 요금 조정이 아니라고 봅니다. 중국 AI 산업의 경쟁축이 '모델 성능 자랑'에서 '추론(Inference) 인프라 효율'로 옮겨가는, 분명한 변곡점입니다.

한눈에 보는 가격 변화

68~500¥

Doubao 유료 플랜
월 구독 테스트 가격대

~34%

알리바바 클라우드
AI 컴퓨팅 인상폭

~30%

알리바바 CPFS
AI 스토리지 인상

5~30%

바이두 클라우드
AI 서비스 인상

ByteDance Doubao, '무료 + 유료 분리형'으로 전환

ByteDance는 자사 생성형 AI 서비스 Doubao에서 PPT 생성, 데이터 분석, 영상 생성 등 고연산 기능을 중심으로 월 68위안(약 1만 3천원), 200위안, 500위안 수준의 구독형 유료 모델을 테스트하고 있는 것으로 알려졌습니다.

핵심 포인트는 단순한 유료화가 아니라는 점입니다. 기존 무료 서비스는 그대로 두되, 비용을 가장 많이 발생시키는 헤비 사용자 전용 기능만 떼어내 프리미엄으로 과금하는 구조입니다. 사용자 베이스는 유지하면서 인프라 부담이 큰 영역만 수익화하는, 전형적인 Freemium 전환 신호로 읽힙니다.

DeepSeek 등장 이후 중국 생성형 AI 사용량은 급증했지만, 그만큼 GPU 클러스터와 데이터센터 운영 비용도 급격히 누적되었습니다. 무료를 계속 유지하려면, 어딘가에서 비용을 회수해야 합니다.

클라우드 빅3, 가격 인상 도미노

알리바바 클라우드 최대 34% 인상

GPU 기반 AI 컴퓨팅 서비스는 기존 대비 5~34% 인상, AI용 병렬 파일 스토리지(CPFS)는 약 30% 수준의 가격 인상이 적용되는 것으로 확인됩니다. 인상폭이 가장 공격적인 곳입니다.

바이두 클라우드 5~30% 인상

AI 연산 관련 서비스 가격을 약 5~30% 수준 인상한다고 발표했습니다. 추론 단가 정상화 흐름에 본격 합류한 모습입니다.

텐센트 클라우드 무료 베타 종료

직접적인 가격 인상보다는 일부 무료 공개 베타 AI 서비스를 종료하는 방식으로 움직이고 있습니다. 무료 정리부터 시작해 점진적으로 유료 전환 수순을 밟는 패턴으로 보입니다.

왜 지금, 가격이 오를 수밖에 없나

그동안 중국 AI 시장은 사용자 확보를 위한 무료·저가 경쟁이 극심했습니다. 그런데 2025년 하반기 들어 DeepSeek과 Doubao 사용량이 단기간에 폭증하면서, 사업자 입장에서 'GPU 클러스터 증설 + 데이터센터 투자' 부담이 한계점에 다다랐습니다.

인프라 비용을 끌어올리는 세 가지 요인

Long Context (장문맥) 기반 AI의 확산. 한 번의 요청에 처리해야 할 토큰이 기하급수적으로 늘어났습니다. 컨텍스트 32K가 일반화되고 100K, 1M까지 확장되면서 KV Cache 부담이 폭증합니다.
AI Agent 시대의 도래. 사용자가 한 번 명령하면 Agent가 내부적으로 수십~수백 번의 모델 호출을 일으킵니다. 토큰 처리량은 사용자가 보는 화면의 몇 배에서 수십 배로 늘어납니다.
멀티모달 처리 부담. 영상·이미지 생성, 음성 합성 등은 GPU·메모리·스토리지 모든 계층에 동시에 부담을 줍니다.

여기에 GPU 가격은 떨어질 기미가 없고, 고성능 SSD·HBM·고속 네트워크 장비 비용도 만만치 않습니다. 한마디로 '무료로 운영하면 적자가 누적되는 구조'가 되어버린 겁니다. 가격 인상은 그 구조가 더 이상 무료로 흡수되지 않는다는, 시장이 보내는 명확한 신호입니다.

경쟁의 축이 바뀌고 있다

그동안 중국 AI 경쟁은 새 모델 공개 속도, 벤치마크 점수, 파라미터 수 같은 'LLM 성능 자체'를 두고 벌어졌습니다. 그러나 최근 흐름은 분명히 다릅니다. 진짜 승부처가 모델에서 인프라로 이동하고 있습니다.

~2024년의 경쟁	2025~26년의 경쟁
벤치마크 점수	실서비스 토큰 처리 효율
모델 공개 속도	GPU 사용률(Utilization)
파라미터 수 자랑	Inference Latency 최적화
무료 사용자 확보	스토리지·메모리 계층 비용 절감

요약하면, 'AI를 만드는 회사'에서 'AI를 효율적으로 굴리는 회사'가 이기는 게임으로 바뀌고 있습니다. 똑같은 모델을 누가 더 싸게, 빠르게, 안정적으로 서빙하느냐가 경쟁력의 본질이 되어가고 있습니다.

현지에서 본 다음 단계, GPU 그 너머

ODCC 2025 현장에서

지난 2025년 9월, 베이징국제회의중심에서 열린 ODCC(开放数据中心大会)에 嘉宾(VIP 게스트)으로 참석한 자리에서 가장 인상 깊었던 점이 있습니다. 발표자들이 GPU 다음으로 가장 자주 언급한 단어가 'Storage', 'Memory', 'Network'였다는 것입니다.

한국에서 흔히 'AI 인프라' 하면 GPU만 떠올리기 쉬운데, 중국 데이터센터 업계는 이미 그 너머를 보고 있습니다. KV Cache를 HBM에 둘지 GDDR에 둘지 SSD에 둘지, Long Context 토큰을 어떻게 압축·저장할지, 그 데이터를 GPU까지 얼마나 빠르게 전달할지. 이런 'GPU 주변의 효율'이 추론 단가를 좌우하는 시대로 진입한 것입니다.

이번 가격 인상 도미노는 결국 같은 메시지를 던지고 있습니다. 중국 AI 업계의 진짜 승부는 모델 발표 무대가 아니라, 데이터센터 한 평방미터당 얼마나 많은 토큰을 처리해내느냐에서 갈릴 것이라고 봅니다. 추론 시대에는 GPU 한 장의 성능보다, 전체 스택의 효율이 압도적으로 중요해집니다.

맺으며, 한국 반도체에는 어떤 신호인가

사실 한국에는 글로벌 LLM 챔피언이라고 부를 만한 모델이 없습니다. 우리가 일상에서 쓰는 ChatGPT, Claude, Gemini, 그리고 이번 글에 등장한 DeepSeek과 Doubao까지 모두 외산입니다. 그래서 중국의 AI 가격 인상 뉴스를 "남의 동네 이야기"로 흘려보내기 쉽습니다.

그런데 시각을 살짝만 돌리면, 이 변화는 한국과 의외로 가깝습니다. 클라우드 사업자들이 AI 서비스 가격을 올린다는 건, 뒤집어 말하면 그만큼 AI 인프라에 더 많이 투자한다는 뜻입니다. GPU 한 장 더 사고, HBM 한 단 더 쌓고, 고성능 SSD를 더 많이 깐다는 의미입니다. 중국이 LLM 경쟁의 무대라면, 한국은 그 무대를 떠받치는 메모리와 스토리지의 공급자 위치에 서 있습니다. 이 흐름이 길어질수록 한국 반도체 산업, 특히 메모리에 가는 신호는 분명히 긍정적이라고 봅니다.

사용자 입장에서도 메시지가 있습니다. ChatGPT Plus나 Claude Pro를 결제하는 한국 사용자가 빠르게 늘고 있는데, OpenAI도 Anthropic도 같은 추론 비용 압력에서 자유롭지 않습니다. "중국이 먼저 올렸다"는 건 어쩌면 "우리가 쓰는 서비스도 곧 비슷한 길을 갈 것이다"의 다른 표현일 수 있습니다. LLM을 만들지 못해도 LLM을 둘러싼 흐름은 결국 한국에도 도달합니다. 그 방향이 어디인지, 중국 시장이 지금 먼저 보여주고 있습니다.

다음 글에서 다뤄보면 좋을 연계 주제

1. CXMT의 HBM3 양산 시도, 중국 메모리는 AI 자립을 이룰 수 있을까

가격 인상의 본질은 결국 GPU와 메모리 비용입니다. 중국이 HBM을 자체 공급할 수 있게 되는 시점이 오면, 이 가격 곡선 자체가 다시 한번 흔들립니다. 현지에서 보는 CXMT·SMIC의 진척도를 정리해보고 싶습니다.

2. KV Cache, HBM에 둘 것인가 SSD에 둘 것인가

추론 비용의 절반 이상이 KV Cache 처리에서 결정된다는 분석이 많습니다. 메모리 계층을 어떻게 설계하느냐가 곧 단가 경쟁력. 이전 KV Cache 글의 후속편 격으로 한 번 더 깊이 들어가볼 만합니다.

3. Doubao Pro 500위안 vs ChatGPT Plus 20달러, 누가 더 비싼가

단순 환산으로는 Doubao가 비싸 보이지만, 중국 평균 임금과 시장 구조를 함께 봐야 진짜 그림이 나옵니다. 한중 AI 구독료 비교는 그 자체로 흥미로운 주제입니다.

4. 추론 폭증 시대, 중국 데이터센터의 진짜 병목은 전력이다

GPU를 사도 전기가 부족하면 못 돌립니다. 중국 서부 지역(西部) 데이터센터 이전과 풍력·수력 연계 인프라가 왜 이렇게 빠르게 깔리고 있는지, 그 배경을 정리해볼 만합니다.

'AI' 카테고리의 다른 글

Sora가 떠나는 자리, 중국의 영상 AI는 폭발한다 (0)	2026.05.16
휴머노이드 로봇은 정말 사람의 일자리를 대체할까: 2026년 현장이 보여주는 진짜 답 (0)	2026.05.16
평행이론을 검색한다면? HNSW(Hierarchical Navigable Small World) 완전 정복, AI 시대의 핵심 검색 엔진 (0)	2026.05.16
2026 휴머노이드 로봇 패권전쟁: 중국이 글로벌 90%를 가져간 진짜 이유 (1)	2026.05.16
텐센트는 게임 회사만이 아니다: 1,200개 기업을 거느린 거대 투자 지주회사의 또 다른 얼굴 (0)	2026.05.16

현재글중국 AI 업계, 무료의 시대 저문다. Doubao 유료화·알리바바 클라우드 34% 인상이 보내는 신호

S전자 반도체 중국 기술주재원 Marvin Jung

S전자 반도체 중국 기술주재원 Marvin Jung의 중국과 AI 기술이야기 블로그입니다.

인공지능, hsk단어, 중국AI, 중국어공부, 가능보어, ai인프라, 중국어표현, 중국어문법, 중국어어휘, LLM, 중국어단어, AI스토리지, AI반도체, 중국어기초, 베이징주재원, 메모리반도체, 중국어독학, 중국어회화, 중국생활, 중국문화,

Today :
Yesterday :

S전자 반도체 중국 기술주재원 Marvin Jung