NVIDIA B200
VESSL Cloud에서 NVIDIA Blackwell B200 물량을 예약하세요. 192GB HBM3e와 8 TB/s 대역폭, FP4 가속으로 최신 대형 모델 학습과 실시간 추론을 할 수 있어요.

- GPU 메모리
- 192GB HBM3e
- 메모리 대역폭
- 8 TB/s
기술 사양
- 아키텍처
- Blackwell
- GPU 메모리
- 192GB HBM3e
- 메모리 대역폭
- 8 TB/s
- NVLink
- 1.8 TB/s
- FP8 (텐서)
- 9 PFLOPS
- FP4 (텐서)
- 18 PFLOPS
- 최대 TDP
- 1,000W
- 노드당 GPU
- 8 (HGX B200)
*희소성(sparsity) 적용 시 이론상 최대 성능이며 NVIDIA 공식 사양 기준이에요. 노드 구성에 따라 달라질 수 있어요.
요금 및 이용 안내
B200은 어디에 쓰면 좋을까요?
최신 대형 모델 사전학습
FP4 · FP8 처리량과 1.8 TB/s NVLink로 조 단위 파라미터 모델의 사전학습을 단일 Blackwell 클러스터에서 진행할 수 있어요.
높은 처리량 추론
192GB HBM3e와 FP4 가속으로 큰 모델로 많은 요청을 동시에 처리하고, 대규모 배포에서 Hopper보다 토큰당 비용을 낮춰요.
멀티모달 · 생성형 비디오
텍스트-비디오, 3D 생성, 대형 멀티모달 학습처럼 메모리·연산이 동시에 무거운 워크로드도 HGX B200 한 노드에서 처리할 수 있어요.
어떤 NVIDIA GPU가 맞을까요?
| H100 Hopper | H200 Hopper | B200 현재 보고 있는 모델 | B300 Blackwell | |
|---|---|---|---|---|
| 아키텍처 | Hopper | Hopper | Blackwell | Blackwell |
| GPU 메모리 | 80GB HBM3 | 141GB HBM3e | 192GB HBM3e | up to 288GB HBM3e |
| 메모리 대역폭 | 3.35 TB/s | 4.8 TB/s | 8 TB/s | 8 TB/s |
| FP8 (텐서) | 3,958 TFLOPS | 3,958 TFLOPS | 9 PFLOPS | 10 PFLOPS |
| 이용 방식 | 최저 $2.39/시간 | 문의 후 이용 가능 | 문의 후 이용 가능 | 문의 후 이용 가능 |
| 추천 용도 | 가성비 학습·추론 | 긴 문맥·대형 모델 추론 | FP4 최신 대형 모델 학습 | 초대형 모델·동시 요청이 많은 추론 |
앞서가는 팀들이 VESSL Cloud를 선택한 이유
기다림 없이 바로 시작
여러 클라우드의 GPU를 한곳에 모아둬서, 할당량이나 복잡한 절차 없이 바로 시작할 수 있어요.
한 대부터 클러스터 규모까지
고속 InfiniBand로 묶은 HGX 노드로, GPU 한 대부터 대규모 멀티 노드 클러스터까지 필요한 만큼 늘릴 수 있어요.
쓴 만큼만 투명하게
스팟·온디맨드·예약형까지, 쓴 만큼만 내는 종량제예요.
엔터프라이즈 보안도 문제없어요
SOC 2 Type II 인증에 상용 AI 전담 지원까지 갖춰서, 엔터프라이즈 규모에서도 안심하고 쓸 수 있어요.
자주 묻는 질문
NVIDIA B200은 어떻게 이용하나요?
Blackwell 물량은 문의 후 배정해 드려요. 팀에 문의하시면 일정에 맞춰 B200 물량을 확보해 드려요.
B200 메모리는 얼마인가요?
B200은 GPU당 192GB HBM3e에 최대 8 TB/s 대역폭, 1.8 TB/s NVLink를 제공해요. H100 대비 메모리는 약 2.4배, 대역폭은 2배가 넘어요.
B200과 B300은 뭐가 다른가요?
B300(Blackwell Ultra)은 메모리가 최대 288GB HBM3e로 늘었고(B200은 192GB), FP4 연산 성능이 약 1.5배 높아요. 가장 큰 모델과 동시 요청이 많은 추론에 적합해요.
B200은 H200과 비교하면 어떤가요?
B200은 한 세대 앞선 Blackwell이에요. FP4 가속, 192GB HBM3e, 8 TB/s 대역폭으로 Hopper H200(141GB, 4.8 TB/s)을 뛰어넘어요. 최신 대형 모델 학습이나 대규모 추론에서 토큰당 비용을 낮추는 게 중요하다면 B200을 보세요.
B200 클러스터 전체를 예약할 수 있나요?
네. 8장 단위 HGX B200 노드를 고속 InfiniBand로 묶어, 단일 노드부터 대규모 멀티 노드 클러스터까지 확장해 드려요.
다른 GPU도 살펴보기
워크로드가 다르다면, 메모리·처리량·예산에 맞는 GPU를 골라보세요.
최대 288GB HBM3e를 갖춘 Blackwell Ultra예요. 가장 큰 모델과 동시 요청이 많은 추론 서빙을 위한 GPU예요.
자세히 보기H100과 같은 Hopper 연산에 141GB HBM3e를 더해, 여러 GPU로 쪼개지 않고 긴 문맥 LLM과 더 큰 모델을 실행할 수 있어요.
자세히 보기학습·파인튜닝·추론 어떤 작업에도 잘 맞는 검증된 GPU예요. 가성비가 가장 좋고, 시간당 $2.39부터예요.
자세히 보기