NVIDIA Blackwell

NVIDIA B200

VESSL Cloud에서 NVIDIA Blackwell B200 물량을 예약하세요. 192GB HBM3e와 8 TB/s 대역폭, FP4 가속으로 최신 대형 모델 학습과 실시간 추론을 할 수 있어요.

물량 예약하기

NVIDIA B200

GPU 메모리: 192GB HBM3e
메모리 대역폭: 8 TB/s

기술 사양

아키텍처: Blackwell
GPU 메모리: 192GB HBM3e
메모리 대역폭: 8 TB/s
NVLink: 1.8 TB/s
FP8 (텐서): 9 PFLOPS
FP4 (텐서): 18 PFLOPS
최대 TDP: 1,000W
노드당 GPU: 8 (HGX B200)

*희소성(sparsity) 적용 시 이론상 최대 성능이며 NVIDIA 공식 사양 기준이에요. 노드 구성에 따라 달라질 수 있어요.

요금 및 이용 안내

NVIDIA B200문의 후 이용 가능

문의하기

B200은 어디에 쓰면 좋을까요?

높은 처리량 추론

192GB HBM3e와 FP4 가속으로 큰 모델로 많은 요청을 동시에 처리하고, 대규모 배포에서 Hopper보다 토큰당 비용을 낮춰요.

멀티모달 · 생성형 비디오

텍스트-비디오, 3D 생성, 대형 멀티모달 학습처럼 메모리·연산이 동시에 무거운 워크로드도 HGX B200 한 노드에서 처리할 수 있어요.

어떤 NVIDIA GPU가 맞을까요?

	H100 Hopper	H200 Hopper	B200 현재 보고 있는 모델	B300 Blackwell
아키텍처	Hopper	Hopper	Blackwell	Blackwell
GPU 메모리	80GB HBM3	141GB HBM3e	192GB HBM3e	up to 288GB HBM3e
메모리 대역폭	3.35 TB/s	4.8 TB/s	8 TB/s	8 TB/s
FP8 (텐서)	3,958 TFLOPS	3,958 TFLOPS	9 PFLOPS	10 PFLOPS
이용 방식	최저 $2.39/시간	문의 후 이용 가능	문의 후 이용 가능	문의 후 이용 가능
추천 용도	가성비 학습·추론	긴 문맥·대형 모델 추론	FP4 최신 대형 모델 학습	초대형 모델·동시 요청이 많은 추론

앞서가는 팀들이 VESSL Cloud를 선택한 이유

기다림 없이 바로 시작

여러 클라우드의 GPU를 한곳에 모아둬서, 할당량이나 복잡한 절차 없이 바로 시작할 수 있어요.

한 대부터 클러스터 규모까지

고속 InfiniBand로 묶은 HGX 노드로, GPU 한 대부터 대규모 멀티 노드 클러스터까지 필요한 만큼 늘릴 수 있어요.

쓴 만큼만 투명하게

스팟·온디맨드·예약형까지, 쓴 만큼만 내는 종량제예요.

엔터프라이즈 보안도 문제없어요

SOC 2 Type II 인증에 상용 AI 전담 지원까지 갖춰서, 엔터프라이즈 규모에서도 안심하고 쓸 수 있어요.

자주 묻는 질문

NVIDIA B200은 어떻게 이용하나요?

Blackwell 물량은 문의 후 배정해 드려요. 팀에 문의하시면 일정에 맞춰 B200 물량을 확보해 드려요.

B200 메모리는 얼마인가요?

B200은 GPU당 192GB HBM3e에 최대 8 TB/s 대역폭, 1.8 TB/s NVLink를 제공해요. H100 대비 메모리는 약 2.4배, 대역폭은 2배가 넘어요.

B200과 B300은 뭐가 다른가요?

B300(Blackwell Ultra)은 메모리가 최대 288GB HBM3e로 늘었고(B200은 192GB), FP4 연산 성능이 약 1.5배 높아요. 가장 큰 모델과 동시 요청이 많은 추론에 적합해요.

B200은 H200과 비교하면 어떤가요?

B200은 한 세대 앞선 Blackwell이에요. FP4 가속, 192GB HBM3e, 8 TB/s 대역폭으로 Hopper H200(141GB, 4.8 TB/s)을 뛰어넘어요. 최신 대형 모델 학습이나 대규모 추론에서 토큰당 비용을 낮추는 게 중요하다면 B200을 보세요.