Inference chiếm 80% GPU spend — kỷ nguyên training kết thúc

Fri, 15 May 2026 22:30:00 +0700

Thị trường inference vượt 50 tỷ đô năm 2026. Tỷ lệ chi tiêu GPU đã đảo ngược: 80% inference, 20% training. Con số này kể từ năm 2022 đã thay đổi hoàn toàn cách tính toán ROI cho hạ tầng AI.

Nguyên lý nền tảng: khi một thị trường chuyển từ training-dominant sang inference-dominant, động lực cạnh tranh thay đổi. Trước đây, ai có GPU nhiều nhất để huấn luyện mô hình lớn nhất, người đó dẫn đầu. Song giờ đây, ai phục vụ inference nhanh nhất và rẻ nhất, người đó chiếm thị phần. DeepSeek V4-Pro $0.30/MTok, Qwen3.6 Plus rẻ hơn Claude Opus 30 lần — giá inference đang rơi tự do, giảm 1000 lần so với 2022. H100 giảm giá 94% so với mức đỉnh.

Gpu on Lộc Đặng

Inference chiếm 80% GPU spend — kỷ nguyên training kết thúc