NVIDIA H200
NVIDIA H200 SXM은 141GB HBM3e 메모리를 탑재했어요. H100과 동일한 Hopper 연산 성능에 더 크고 빠른 메모리를 더해, 여러 GPU로 쪼개지 않고 긴 문맥(context) LLM과 대형 모델을 실행할 수 있어요.

- GPU 메모리
- 141GB HBM3e
- 메모리 대역폭
- 4.8 TB/s
기술 사양
- 아키텍처
- Hopper
- GPU 메모리
- 141GB HBM3e
- 메모리 대역폭
- 4.8 TB/s
- NVLink
- 900 GB/s
- FP16/BF16 (텐서)
- 1,979 TFLOPS
- FP8 (텐서)
- 3,958 TFLOPS
- 최대 TDP
- 700W
- 노드당 GPU
- 8 (HGX H200)
*희소성(sparsity) 적용 시 이론상 최대 성능이며 NVIDIA 공식 사양 기준이에요. 노드 구성에 따라 달라질 수 있어요.
요금 및 이용 안내
H200은 어디에 쓰면 좋을까요?
긴 문맥 · 대형 모델 추론
141GB HBM3e면 70B급 모델과 큰 KV 캐시도 단일 GPU에 올라가, 여러 GPU로 쪼개지 않고 더 긴 문맥(context)을 서빙해요.
메모리를 많이 쓰는 학습 · 파인튜닝
더 큰 배치(batch)와 더 긴 시퀀스가 메모리에 들어가고, 4.8 TB/s 대역폭이 Hopper FP8 텐서 코어에 데이터를 끊김 없이 공급해요.
H100에서 그대로 업그레이드
H100과 동일한 CUDA · PyTorch · NeMo 스택이라, 메모리가 부족하던 워크로드를 코드 수정 없이 그대로 옮겨 실행할 수 있어요.
어떤 NVIDIA GPU가 맞을까요?
| H100 Hopper | H200 현재 보고 있는 모델 | B200 Blackwell | B300 Blackwell | |
|---|---|---|---|---|
| 아키텍처 | Hopper | Hopper | Blackwell | Blackwell |
| GPU 메모리 | 80GB HBM3 | 141GB HBM3e | 192GB HBM3e | up to 288GB HBM3e |
| 메모리 대역폭 | 3.35 TB/s | 4.8 TB/s | 8 TB/s | 8 TB/s |
| FP8 (텐서) | 3,958 TFLOPS | 3,958 TFLOPS | 9 PFLOPS | 10 PFLOPS |
| 이용 방식 | 최저 $2.39/시간 | 문의 후 이용 가능 | 문의 후 이용 가능 | 문의 후 이용 가능 |
| 추천 용도 | 가성비 학습·추론 | 긴 문맥·대형 모델 추론 | FP4 최신 대형 모델 학습 | 초대형 모델·동시 요청이 많은 추론 |
앞서가는 팀들이 VESSL Cloud를 선택한 이유
기다림 없이 바로 시작
여러 클라우드의 GPU를 한곳에 모아둬서, 할당량이나 복잡한 절차 없이 바로 시작할 수 있어요.
한 대부터 클러스터 규모까지
고속 InfiniBand로 묶은 HGX 노드로, GPU 한 대부터 대규모 멀티 노드 클러스터까지 필요한 만큼 늘릴 수 있어요.
쓴 만큼만 투명하게
스팟·온디맨드·예약형까지, 쓴 만큼만 내는 종량제예요.
엔터프라이즈 보안도 문제없어요
SOC 2 Type II 인증에 상용 AI 전담 지원까지 갖춰서, 엔터프라이즈 규모에서도 안심하고 쓸 수 있어요.
자주 묻는 질문
H200도 지금 쓸 수 있나요?
H200은 문의 후 이용할 수 있어요. 현재 가용 물량과 가격은 팀에 문의해 주세요. 일정에 맞춰 필요한 수량을 확보해 드려요.
H100과 H200은 뭐가 다른가요?
둘 다 Hopper 연산 성능(FP16 1,979 / FP8 3,958 TFLOPS)은 같지만, H200은 141GB HBM3e에 4.8 TB/s, H100은 80GB HBM3에 3.35 TB/s예요. H200이 더 큰 모델·배치(batch)·문맥(context)에 유리해요.
H200 메모리는 얼마인가요?
H200 SXM은 141GB HBM3e에 대역폭 4.8 TB/s예요. H100보다 용량은 약 76% 더 많고, 대역폭은 약 43% 더 넓어요.
H200 멀티 노드 학습이 가능한가요?
가능해요. 8장 단위 HGX H200 노드를 고속 InfiniBand로 묶어 분산 학습을 하고, 자동 체크포인트도 지원해요.
H200과 Blackwell B200 중 뭘 골라야 하나요?
H200은 지금 대형 모델 추론에 쓰기 좋은 대용량 메모리 Hopper 옵션이에요. FP4 가속과 192GB 이상이 필요한 최신 대형 모델 작업이라면 Blackwell B200/B300을 보세요. 문의하시면 선택을 도와드릴게요.
다른 GPU도 살펴보기
워크로드가 다르다면, 메모리·처리량·예산에 맞는 GPU를 골라보세요.
학습·파인튜닝·추론 어떤 작업에도 잘 맞는 검증된 GPU예요. 가성비가 가장 좋고, 시간당 $2.39부터예요.
자세히 보기192GB HBM3e와 FP4 가속을 갖춘 Blackwell이에요. 최신 대형 모델 학습과 높은 처리량 추론에 맞아요.
자세히 보기최대 288GB HBM3e를 갖춘 Blackwell Ultra예요. 가장 큰 모델과 동시 요청이 많은 추론 서빙을 위한 GPU예요.
자세히 보기