월 구독 테스트 가격대
AI 컴퓨팅 인상폭
AI 스토리지 인상
AI 서비스 인상
ByteDance는 자사 생성형 AI 서비스 Doubao에서 PPT 생성, 데이터 분석, 영상 생성 등 고연산 기능을 중심으로 월 68위안(약 1만 3천원), 200위안, 500위안 수준의 구독형 유료 모델을 테스트하고 있는 것으로 알려졌습니다.
핵심 포인트는 단순한 유료화가 아니라는 점입니다. 기존 무료 서비스는 그대로 두되, 비용을 가장 많이 발생시키는 헤비 사용자 전용 기능만 떼어내 프리미엄으로 과금하는 구조입니다. 사용자 베이스는 유지하면서 인프라 부담이 큰 영역만 수익화하는, 전형적인 Freemium 전환 신호로 읽힙니다.
DeepSeek 등장 이후 중국 생성형 AI 사용량은 급증했지만, 그만큼 GPU 클러스터와 데이터센터 운영 비용도 급격히 누적되었습니다. 무료를 계속 유지하려면, 어딘가에서 비용을 회수해야 합니다.
GPU 기반 AI 컴퓨팅 서비스는 기존 대비 5~34% 인상, AI용 병렬 파일 스토리지(CPFS)는 약 30% 수준의 가격 인상이 적용되는 것으로 확인됩니다. 인상폭이 가장 공격적인 곳입니다.
AI 연산 관련 서비스 가격을 약 5~30% 수준 인상한다고 발표했습니다. 추론 단가 정상화 흐름에 본격 합류한 모습입니다.
직접적인 가격 인상보다는 일부 무료 공개 베타 AI 서비스를 종료하는 방식으로 움직이고 있습니다. 무료 정리부터 시작해 점진적으로 유료 전환 수순을 밟는 패턴으로 보입니다.
그동안 중국 AI 시장은 사용자 확보를 위한 무료·저가 경쟁이 극심했습니다. 그런데 2025년 하반기 들어 DeepSeek과 Doubao 사용량이 단기간에 폭증하면서, 사업자 입장에서 'GPU 클러스터 증설 + 데이터센터 투자' 부담이 한계점에 다다랐습니다.
- Long Context (장문맥) 기반 AI의 확산. 한 번의 요청에 처리해야 할 토큰이 기하급수적으로 늘어났습니다. 컨텍스트 32K가 일반화되고 100K, 1M까지 확장되면서 KV Cache 부담이 폭증합니다.
- AI Agent 시대의 도래. 사용자가 한 번 명령하면 Agent가 내부적으로 수십~수백 번의 모델 호출을 일으킵니다. 토큰 처리량은 사용자가 보는 화면의 몇 배에서 수십 배로 늘어납니다.
- 멀티모달 처리 부담. 영상·이미지 생성, 음성 합성 등은 GPU·메모리·스토리지 모든 계층에 동시에 부담을 줍니다.
여기에 GPU 가격은 떨어질 기미가 없고, 고성능 SSD·HBM·고속 네트워크 장비 비용도 만만치 않습니다. 한마디로 '무료로 운영하면 적자가 누적되는 구조'가 되어버린 겁니다. 가격 인상은 그 구조가 더 이상 무료로 흡수되지 않는다는, 시장이 보내는 명확한 신호입니다.
그동안 중국 AI 경쟁은 새 모델 공개 속도, 벤치마크 점수, 파라미터 수 같은 'LLM 성능 자체'를 두고 벌어졌습니다. 그러나 최근 흐름은 분명히 다릅니다. 진짜 승부처가 모델에서 인프라로 이동하고 있습니다.
| ~2024년의 경쟁 | 2025~26년의 경쟁 |
|---|---|
| 벤치마크 점수 | 실서비스 토큰 처리 효율 |
| 모델 공개 속도 | GPU 사용률(Utilization) |
| 파라미터 수 자랑 | Inference Latency 최적화 |
| 무료 사용자 확보 | 스토리지·메모리 계층 비용 절감 |
요약하면, 'AI를 만드는 회사'에서 'AI를 효율적으로 굴리는 회사'가 이기는 게임으로 바뀌고 있습니다. 똑같은 모델을 누가 더 싸게, 빠르게, 안정적으로 서빙하느냐가 경쟁력의 본질이 되어가고 있습니다.
지난 2025년 9월, 베이징국제회의중심에서 열린 ODCC(开放数据中心大会)에 嘉宾(VIP 게스트)으로 참석한 자리에서 가장 인상 깊었던 점이 있습니다. 발표자들이 GPU 다음으로 가장 자주 언급한 단어가 'Storage', 'Memory', 'Network'였다는 것입니다.
한국에서 흔히 'AI 인프라' 하면 GPU만 떠올리기 쉬운데, 중국 데이터센터 업계는 이미 그 너머를 보고 있습니다. KV Cache를 HBM에 둘지 GDDR에 둘지 SSD에 둘지, Long Context 토큰을 어떻게 압축·저장할지, 그 데이터를 GPU까지 얼마나 빠르게 전달할지. 이런 'GPU 주변의 효율'이 추론 단가를 좌우하는 시대로 진입한 것입니다.
이번 가격 인상 도미노는 결국 같은 메시지를 던지고 있습니다. 중국 AI 업계의 진짜 승부는 모델 발표 무대가 아니라, 데이터센터 한 평방미터당 얼마나 많은 토큰을 처리해내느냐에서 갈릴 것이라고 봅니다. 추론 시대에는 GPU 한 장의 성능보다, 전체 스택의 효율이 압도적으로 중요해집니다.
사실 한국에는 글로벌 LLM 챔피언이라고 부를 만한 모델이 없습니다. 우리가 일상에서 쓰는 ChatGPT, Claude, Gemini, 그리고 이번 글에 등장한 DeepSeek과 Doubao까지 모두 외산입니다. 그래서 중국의 AI 가격 인상 뉴스를 "남의 동네 이야기"로 흘려보내기 쉽습니다.
그런데 시각을 살짝만 돌리면, 이 변화는 한국과 의외로 가깝습니다. 클라우드 사업자들이 AI 서비스 가격을 올린다는 건, 뒤집어 말하면 그만큼 AI 인프라에 더 많이 투자한다는 뜻입니다. GPU 한 장 더 사고, HBM 한 단 더 쌓고, 고성능 SSD를 더 많이 깐다는 의미입니다. 중국이 LLM 경쟁의 무대라면, 한국은 그 무대를 떠받치는 메모리와 스토리지의 공급자 위치에 서 있습니다. 이 흐름이 길어질수록 한국 반도체 산업, 특히 메모리에 가는 신호는 분명히 긍정적이라고 봅니다.
사용자 입장에서도 메시지가 있습니다. ChatGPT Plus나 Claude Pro를 결제하는 한국 사용자가 빠르게 늘고 있는데, OpenAI도 Anthropic도 같은 추론 비용 압력에서 자유롭지 않습니다. "중국이 먼저 올렸다"는 건 어쩌면 "우리가 쓰는 서비스도 곧 비슷한 길을 갈 것이다"의 다른 표현일 수 있습니다. LLM을 만들지 못해도 LLM을 둘러싼 흐름은 결국 한국에도 도달합니다. 그 방향이 어디인지, 중국 시장이 지금 먼저 보여주고 있습니다.
'AI' 카테고리의 다른 글
| Sora가 떠나는 자리, 중국의 영상 AI는 폭발한다 (0) | 2026.05.16 |
|---|---|
| 휴머노이드 로봇은 정말 사람의 일자리를 대체할까: 2026년 현장이 보여주는 진짜 답 (0) | 2026.05.16 |
| 평행이론을 검색한다면? HNSW(Hierarchical Navigable Small World) 완전 정복, AI 시대의 핵심 검색 엔진 (0) | 2026.05.16 |
| 2026 휴머노이드 로봇 패권전쟁: 중국이 글로벌 90%를 가져간 진짜 이유 (1) | 2026.05.16 |
| 텐센트는 게임 회사만이 아니다: 1,200개 기업을 거느린 거대 투자 지주회사의 또 다른 얼굴 (0) | 2026.05.16 |