NVIDIA Blackwell

NVIDIA B200

VESSL Cloud에서 NVIDIA Blackwell B200 물량을 예약하세요. 192GB HBM3e와 8 TB/s 대역폭, FP4 가속으로 최신 대형 모델 학습과 실시간 추론을 할 수 있어요.

NVIDIA B200 — Blackwell GPU on VESSL Cloud
NVIDIA B200
GPU 메모리
192GB HBM3e
메모리 대역폭
8 TB/s

기술 사양

아키텍처
Blackwell
GPU 메모리
192GB HBM3e
메모리 대역폭
8 TB/s
NVLink
1.8 TB/s
FP8 (텐서)
9 PFLOPS
FP4 (텐서)
18 PFLOPS
최대 TDP
1,000W
노드당 GPU
8 (HGX B200)

*희소성(sparsity) 적용 시 이론상 최대 성능이며 NVIDIA 공식 사양 기준이에요. 노드 구성에 따라 달라질 수 있어요.

요금 및 이용 안내

NVIDIA B200문의 후 이용 가능
문의하기

B200은 어디에 쓰면 좋을까요?

최신 대형 모델 사전학습

FP4 · FP8 처리량과 1.8 TB/s NVLink로 조 단위 파라미터 모델의 사전학습을 단일 Blackwell 클러스터에서 진행할 수 있어요.

높은 처리량 추론

192GB HBM3e와 FP4 가속으로 큰 모델로 많은 요청을 동시에 처리하고, 대규모 배포에서 Hopper보다 토큰당 비용을 낮춰요.

멀티모달 · 생성형 비디오

텍스트-비디오, 3D 생성, 대형 멀티모달 학습처럼 메모리·연산이 동시에 무거운 워크로드도 HGX B200 한 노드에서 처리할 수 있어요.

어떤 NVIDIA GPU가 맞을까요?

H100
Hopper
H200
Hopper
B200
현재 보고 있는 모델
B300
Blackwell
아키텍처HopperHopperBlackwellBlackwell
GPU 메모리80GB HBM3141GB HBM3e192GB HBM3eup to 288GB HBM3e
메모리 대역폭3.35 TB/s4.8 TB/s8 TB/s8 TB/s
FP8 (텐서)3,958 TFLOPS3,958 TFLOPS9 PFLOPS10 PFLOPS
이용 방식최저 $2.39/시간문의 후 이용 가능문의 후 이용 가능문의 후 이용 가능
추천 용도가성비 학습·추론긴 문맥·대형 모델 추론FP4 최신 대형 모델 학습초대형 모델·동시 요청이 많은 추론

앞서가는 팀들이 VESSL Cloud를 선택한 이유

기다림 없이 바로 시작

여러 클라우드의 GPU를 한곳에 모아둬서, 할당량이나 복잡한 절차 없이 바로 시작할 수 있어요.

한 대부터 클러스터 규모까지

고속 InfiniBand로 묶은 HGX 노드로, GPU 한 대부터 대규모 멀티 노드 클러스터까지 필요한 만큼 늘릴 수 있어요.

쓴 만큼만 투명하게

스팟·온디맨드·예약형까지, 쓴 만큼만 내는 종량제예요.

엔터프라이즈 보안도 문제없어요

SOC 2 Type II 인증에 상용 AI 전담 지원까지 갖춰서, 엔터프라이즈 규모에서도 안심하고 쓸 수 있어요.

자주 묻는 질문

NVIDIA B200은 어떻게 이용하나요?

Blackwell 물량은 문의 후 배정해 드려요. 팀에 문의하시면 일정에 맞춰 B200 물량을 확보해 드려요.

B200 메모리는 얼마인가요?

B200은 GPU당 192GB HBM3e에 최대 8 TB/s 대역폭, 1.8 TB/s NVLink를 제공해요. H100 대비 메모리는 약 2.4배, 대역폭은 2배가 넘어요.

B200과 B300은 뭐가 다른가요?

B300(Blackwell Ultra)은 메모리가 최대 288GB HBM3e로 늘었고(B200은 192GB), FP4 연산 성능이 약 1.5배 높아요. 가장 큰 모델과 동시 요청이 많은 추론에 적합해요.

B200은 H200과 비교하면 어떤가요?

B200은 한 세대 앞선 Blackwell이에요. FP4 가속, 192GB HBM3e, 8 TB/s 대역폭으로 Hopper H200(141GB, 4.8 TB/s)을 뛰어넘어요. 최신 대형 모델 학습이나 대규모 추론에서 토큰당 비용을 낮추는 게 중요하다면 B200을 보세요.

B200 클러스터 전체를 예약할 수 있나요?

네. 8장 단위 HGX B200 노드를 고속 InfiniBand로 묶어, 단일 노드부터 대규모 멀티 노드 클러스터까지 확장해 드려요.

GPU 확보,
스트레스는 이제 그만.

클릭 몇 번으로 전 세계 GPU를 내 컴퓨터처럼. 투명한 요금으로 지금 바로 시작해보세요.

  • 5분 만에 개발 환경 세팅
  • 대규모 멀티 노드까지 확장
  • 검증된 보안 안정성
  • 한국어 기술 지원