NVIDIA B300
VESSL Cloud에서 NVIDIA B300(Blackwell Ultra) 물량을 예약하세요. 최대 288GB HBM3e와 FP4 가속으로 가장 큰 모델을 올리고, 많은 요청을 동시에 받아 추론을 서빙할 수 있어요.

- GPU 메모리
- up to 288GB HBM3e
- 메모리 대역폭
- 8 TB/s
기술 사양
- 아키텍처
- Blackwell
- GPU 메모리
- up to 288GB HBM3e
- 메모리 대역폭
- 8 TB/s
- NVLink
- 1.8 TB/s
- FP8 (텐서)
- 10 PFLOPS
- FP4 (텐서)
- 20 PFLOPS
- 최대 TDP
- 1,400W
- 노드당 GPU
- 8 (HGX B300)
*희소성(sparsity) 적용 시 이론상 최대 성능이며 NVIDIA 공식 사양 기준이에요. 노드 구성에 따라 달라질 수 있어요.
요금 및 이용 안내
B300은 어디에 쓰면 좋을까요?
초대형 모델 학습
GPU당 최대 288GB HBM3e와 1.8 TB/s NVLink로 조 단위 파라미터 모델도 덜 쪼개고 통신 부담도 줄여 메모리에 올릴 수 있어요.
추론 · 긴 문맥 서빙
Blackwell Ultra의 거대한 HBM3e면 큰 KV 캐시도 통째로 올리고, B200 대비 약 1.5배 FP4 처리량으로 reasoning · agentic 워크로드를 동시에 많이 받아 서빙해요.
추론 서버 통합
GPU당 메모리와 FP4 처리량이 크니, 같은 서빙 용량을 더 적은 GPU로 감당해 대규모 배포의 토큰당 비용을 낮춰요.
어떤 NVIDIA GPU가 맞을까요?
| H100 Hopper | H200 Hopper | B200 Blackwell | B300 현재 보고 있는 모델 | |
|---|---|---|---|---|
| 아키텍처 | Hopper | Hopper | Blackwell | Blackwell |
| GPU 메모리 | 80GB HBM3 | 141GB HBM3e | 192GB HBM3e | up to 288GB HBM3e |
| 메모리 대역폭 | 3.35 TB/s | 4.8 TB/s | 8 TB/s | 8 TB/s |
| FP8 (텐서) | 3,958 TFLOPS | 3,958 TFLOPS | 9 PFLOPS | 10 PFLOPS |
| 이용 방식 | 최저 $2.39/시간 | 문의 후 이용 가능 | 문의 후 이용 가능 | 문의 후 이용 가능 |
| 추천 용도 | 가성비 학습·추론 | 긴 문맥·대형 모델 추론 | FP4 최신 대형 모델 학습 | 초대형 모델·동시 요청이 많은 추론 |
앞서가는 팀들이 VESSL Cloud를 선택한 이유
기다림 없이 바로 시작
여러 클라우드의 GPU를 한곳에 모아둬서, 할당량이나 복잡한 절차 없이 바로 시작할 수 있어요.
한 대부터 클러스터 규모까지
고속 InfiniBand로 묶은 HGX 노드로, GPU 한 대부터 대규모 멀티 노드 클러스터까지 필요한 만큼 늘릴 수 있어요.
쓴 만큼만 투명하게
스팟·온디맨드·예약형까지, 쓴 만큼만 내는 종량제예요.
엔터프라이즈 보안도 문제없어요
SOC 2 Type II 인증에 상용 AI 전담 지원까지 갖춰서, 엔터프라이즈 규모에서도 안심하고 쓸 수 있어요.
자주 묻는 질문
NVIDIA B300은 어떻게 이용하나요?
B300(Blackwell Ultra) 물량은 문의 후 배정해 드려요. 팀에 문의하시면 일정에 맞춰 물량을 확보해 드려요.
B300 메모리는 얼마인가요?
HGX B300(Blackwell Ultra)은 GPU당 최대 288GB HBM3e로 확장돼요. 노드 구성과 가용 물량은 팀에 문의해 주세요.
B200과 B300은 뭐가 다른가요?
B300(Blackwell Ultra)은 메모리가 최대 288GB HBM3e로 늘었고(B200은 192GB), FP4 연산 성능이 약 1.5배 높아요. 가장 큰 모델과 동시 요청이 많은 추론 서빙을 위해 만들어졌어요.
B300은 학습용인가요, 추론용인가요?
둘 다예요. FP4/FP8 가속과 최대 288GB HBM3e 덕분에 최신 대형 모델 학습과 처리량은 높고 응답은 빠른 추론 서빙 모두에 강해요.
B300 클러스터 전체를 예약할 수 있나요?
네. 8장 단위 HGX B300 노드를 고속 InfiniBand로 묶어, 단일 노드부터 대규모 멀티 노드 클러스터까지 확장해 드려요.
다른 GPU도 살펴보기
워크로드가 다르다면, 메모리·처리량·예산에 맞는 GPU를 골라보세요.
192GB HBM3e와 FP4 가속을 갖춘 Blackwell이에요. 최신 대형 모델 학습과 높은 처리량 추론에 맞아요.
자세히 보기H100과 같은 Hopper 연산에 141GB HBM3e를 더해, 여러 GPU로 쪼개지 않고 긴 문맥 LLM과 더 큰 모델을 실행할 수 있어요.
자세히 보기학습·파인튜닝·추론 어떤 작업에도 잘 맞는 검증된 GPU예요. 가성비가 가장 좋고, 시간당 $2.39부터예요.
자세히 보기