VESSL AI 뉴스

GPU 부족? 노는 GPU는 많아요 — 베슬AI가 문제를 해결하는 법

VESSL AI

|2026년 6월 24일|10분 소요

이 글은 AI타임스에 실린 베슬AI 박준우 GTM 리더 인터뷰(2026년 6월 20일, 김해원 기자)를 정리한 거예요. GPU 쇼티지의 진짜 원인과 베슬AI가 푸는 방식을 짚어볼게요.

핵심 요약

GPU 쇼티지의 진짜 문제는 물량 부족만이 아니에요. 비싸게 확보한 GPU도 제대로 못 쓰는 비효율이 더 큰 손실이에요.
베슬AI는 전 세계에 흩어진 유휴 GPU를 실시간으로 연결하는 네오클라우드예요. 전 세계 10여 개 데이터센터와 협력하고 있어요.
북미 H100 온디맨드 기준, 하이퍼스케일러 평균이 시간당 약 7달러인데 베슬AI는 3.28달러로 2배가량 저렴해요.
이제 중요한 건 최신 GPU 자체가 아니라 초당 토큰을 얼마나 안정적으로 생산하느냐예요. 토크노믹스(Tokenomics) 시대로 가고 있어요.
현재 5,000장 규모에서 연내 1만 장, 차세대 5만 장까지 확보해 국내 최대 인프라를 구축할 계획이에요.

지구촌 전체가 극심한 GPU 공급 부족(shortage) 상태에 빠졌어요. 단기간에 공급을 늘릴 수 없는 구조라, 인프라 시장에는 기존 자원을 아껴 나눠 쓰는 일종의 '아나바다' 바람이 불고 있어요. 전 세계에 흩어진 유휴 GPU를 발굴해 실시간으로 연결하는 네오클라우드 기업 베슬AI의 박준우 GTM 리더를 만나, 쇼티지의 현실과 해법을 들었어요.

쇼티지보다 무서운 건, 확보한 GPU를 100% 못 쓰는 현실

베슬AI는 지금의 쇼티지를 단순히 물량이 부족한 문제로만 보지 않아요. 비싼 돈을 들여 칩을 확보하고도 제대로 활용하지 못하는 경우가 허다하다는 거예요.

박준우 리더는 "엔비디아 블랙웰의 경우 지금 발주를 넣으면 짧게는 6개월, 길게는 1년 이상을 기다려야 한다"라며 "AWS나 GCP 같은 하이퍼스케일러에 의존하자니 최소 3년 약정에 32노드 단위의 대규모 장기 계약이 요구된다"라고 말했어요.

이 구조는 단기·소규모 물량이 필요한 대다수 기업의 수요를 받아주지 못해요. 그러다 보니 '노는 GPU'가 양산되고, 어렵게 확보한 GPU마저 하나에 모든 작업을 몰아넣다 보니 비효율이 반복돼요.

전 세계 유휴 GPU를 연결하는 '네오클라우드'

바로 이 지점을 파고든 게 베슬AI의 네오클라우드예요. 전 세계에서 유휴 GPU를 찾아 중개하는, 일종의 '에어비앤비' 모델이에요. 특정 클라우드나 데이터센터에 종속되지 않는 자유도와 네트워크 역량을 핵심 무기로 삼아요.

박 리더는 "이 사업의 핵심은 절대적인 GPU 수량이 아니라 고객이 필요한 시점에 그 모델이 있어야 하는 것"이라며 "하이퍼스케일러나 CSP들도 이미 물량을 가동 중이거나 특정 GPU가 부족하면 대응이 안 되는데, 그 공백을 채우는 것"이라고 설명했어요.

현재 베슬AI는 미국 실리콘밸리에 지사를 두고 글로벌 시장을 선제적으로 개척했어요. 그 결과 전 세계 10여 개 데이터센터와 협력하며 주요 하이퍼스케일러와 국내외 CSP사를 공급망에 편입시켰어요. 최근에는 하이퍼스케일러 쪽에서 먼저 문의가 오는 경우도 늘고 있어요. 하이퍼스케일러는 유휴 자원을 프리세일즈(pre-sales)로 빠르게 처리하고, 베슬AI는 물량을 조기에 확보하는 윈윈 구조가 만들어지는 거예요.

H100을 절반 가격에 — 공급·가격 경쟁력

이렇게 쌓인 공급사 풀은 규모의 경제로 이어져 가격 경쟁력을 만들어요. 박 리더는 "글로벌 반도체 리서치 전문 세미애널리시스(SemiAnalysis) 랭킹 상위권인 GPU 클라우드 기업 대다수와 협업할 만큼 공급사 풀이 많다"라며 "플랫폼 내 거래량이 많아질수록 고객에게 더 합리적인 가격을 제공할 수 있는 구조"라고 설명했어요.

실제 북미 시장의 엔비디아 H100 온디맨드 비용을 비교하면 차이가 분명해요.

구분	H100 온디맨드 (시간당)
하이퍼스케일러 평균	약 $7
베슬AI	$3.28

하이퍼스케일러의 절반 수준, 2배가량 저렴해요. 게다가 분산된 인프라 덕분에 레이턴시(지연) 이슈를 최소화해 신속한 서빙이 가능하고, 보안 거버넌스도 기존 하이퍼스케일러 수준을 상회한다는 평가를 받고 있어요.

연내 1만 장, 차세대 5만 장 — 영토 확장

베슬AI는 현재 운용 중인 5,000장 규모의 가용 총량을 넘어, 연내 1만 장, 차세대 5만 장의 GPU를 확보해 국내 최대 인프라를 구축할 계획이에요.

여기에는 엔비디아의 A100·H100·B300·GB200뿐 아니라 구글의 TPU와 국산 NPU까지 포함돼 있어요. 차세대 '베라 루빈(Vera Rubin)'도 협상 단계예요. 나아가 공급망 리스크에 유연하게 대처하기 위해 자체 데이터센터 직접 구축이나 상면 임대(공간 대여) 방식의 영토 확장도 적극적으로 검토하고 있어요.

박 리더는 "AI 시대 인프라 쇼티지는 예견된 미래"라며 "앞으로도 공급자와 수요자 사이를 유기적으로 연결해 주는 해법으로 글로벌 네오클라우드 시장의 대표 주자가 될 것"이라고 말했어요.

마무리

지금 필요한 GPU가 시장에 없거나, 하이퍼스케일러의 장기 약정이 부담스러우신가요. 정확한 조건이 없어도 괜찮아요. 지금 워크로드 상황만 알려주시면 현실적인 옵션부터 제안드릴게요.

GPU 도입 상담하기

GPU별 가격은 VESSL Cloud 가격 페이지에서 확인할 수 있고, VESSL Cloud 콘솔에서 바로 시작해 볼 수도 있어요.

자주 묻는 질문

GPU가 그렇게 부족하다는데, 베슬AI는 어떻게 물량을 확보하나요?

베슬AI는 직접 GPU를 대량으로 사들이는 대신, 전 세계에 흩어진 유휴 GPU를 찾아 실시간으로 연결하는 네오클라우드 모델이에요. 현재 전 세계 10여 개 데이터센터와 협력하고, 주요 하이퍼스케일러와 국내외 CSP사를 공급망에 편입시켰어요. 특정 클라우드에 종속되지 않아 고객이 필요한 시점에 필요한 모델을 맞추는 데 강점이 있어요.

H100을 하이퍼스케일러의 절반 가격에 쓸 수 있다는 게 정말인가요?

북미 시장의 엔비디아 H100 온디맨드 기준으로, 하이퍼스케일러 평균이 시간당 약 7달러인데 베슬AI는 3.28달러예요. 약 2배 저렴한 셈이에요. 공급사 풀이 넓고 플랫폼 거래량이 많아질수록 규모의 경제로 더 합리적인 가격을 제공할 수 있는 구조라서 가능해요.

최신 GPU가 꼭 필요하지 않다는 건 무슨 뜻인가요?

핵심은 GPU 모델 자체가 아니라 내 서비스가 필요한 초당 토큰을 얼마나 안정적으로 생산하느냐예요. B200 수십 장이 필요한 무거운 작업도 A, B 시리즈 칩을 조합하면 대등한 성능을 낼 수 있어요. 여기에 스토리지 성능과 네트워크 속도까지 받쳐줘야 전체 효율이 나오는데, 베슬AI는 이 삼박자를 함께 맞춰요.

베슬AI는 어떤 GPU를 제공하나요?

엔비디아의 A100·H100·B300·GB200을 비롯해 구글 TPU와 국산 NPU까지 폭넓게 다뤄요. 차세대 베라 루빈도 협상 단계예요. 현재 5,000장 규모에서 연내 1만 장, 차세대 5만 장까지 확보를 계획하고 있어요.

어떻게 시작하면 되나요?

필요한 GPU나 워크로드 조건이 명확하지 않아도 괜찮아요. 지금 상황만 알려주시면 현실적인 옵션부터 제안드릴게요. 상담을 신청하시거나, VESSL Cloud 콘솔에서 바로 둘러볼 수 있어요.

참고