기술 사양
H100 NVIDIA H100 SXM | H200 NVIDIA H200 SXM | |
|---|---|---|
| 아키텍처 | Hopper | Hopper |
| GPU 메모리 | 80GB HBM3 | 141GB HBM3e |
| 메모리 대역폭 | 3.35 TB/s | 4.8 TB/s |
| NVLink | 900 GB/s | 900 GB/s |
| FP16/BF16 (텐서) | 1,979 TFLOPS | 1,979 TFLOPS |
| FP8 (텐서) | 3,958 TFLOPS | 3,958 TFLOPS |
| 최대 TDP | 700W | 700W |
| 노드당 GPU | 8 (HGX H100) | 8 (HGX H200) |
*희소성(sparsity) 적용 시 이론상 최대 성능이며 NVIDIA 공식 사양 기준이에요. 노드 구성에 따라 달라질 수 있어요.
Hopper는 어디에 쓰면 좋을까요?
대규모 LLM 학습 · 파인튜닝
검증된 Hopper 스택과 FP8 텐서 코어, 고속 InfiniBand로 70B~400B급 모델까지 멀티 노드로 학습할 수 있어요. 자동 체크포인트도 기본이에요.
높은 처리량 LLM 추론
H200의 141GB HBM3e면 70B급 모델도 단일 GPU에 올라가고, H100 FP8 가속으로 토큰 처리량은 높이고 응답 지연은 낮춰요.
연구 · HPC
성숙한 CUDA · PyTorch · JAX · NeMo 생태계 위에서, 실험·과학 계산·일정이 촉박한 연구 워크로드를 필요할 때 바로 실행할 수 있어요.
앞서가는 팀들이 VESSL Cloud를 선택한 이유
기다림 없이 바로 시작
여러 클라우드의 GPU를 한곳에 모아둬서, 할당량이나 복잡한 절차 없이 바로 시작할 수 있어요.
한 대부터 클러스터 규모까지
고속 InfiniBand로 묶은 HGX 노드로, GPU 한 대부터 대규모 멀티 노드 클러스터까지 필요한 만큼 늘릴 수 있어요.
쓴 만큼만 투명하게
스팟·온디맨드·예약형까지, 쓴 만큼만 내는 종량제예요.
엔터프라이즈 보안도 문제없어요
SOC 2 Type II 인증에 상용 AI 전담 지원까지 갖춰서, 엔터프라이즈 규모에서도 안심하고 쓸 수 있어요.
자주 묻는 질문
VESSL Cloud에서 NVIDIA H100 가격은 얼마인가요?
H100 SXM(80GB)은 온디맨드 시간당 $2.39부터예요. 예약형으로 약정하면 최대 15%까지 더 저렴해요. cloud.vessl.ai에서 대기 없이 바로 시작할 수 있어요.
H100과 H200은 뭐가 다른가요?
둘 다 Hopper 연산 성능은 같지만, H200은 더 빠른 HBM3e 메모리를 141GB(H100은 80GB HBM3) 탑재하고 대역폭이 4.8 TB/s예요. 더 큰 모델, 더 큰 배치(batch), 더 긴 문맥(context)에 유리해요.
H200도 지금 쓸 수 있나요?
H200 물량은 문의 후 이용할 수 있어요. 현재 가용 물량과 가격은 팀에 문의해 주세요.
H100 · H200 멀티 노드 학습이 가능한가요?
가능해요. 8장 단위 HGX 노드를 고속 InfiniBand로 묶어 분산 학습을 할 수 있고, 자동 체크포인트도 지원해요.
예약형이나 학술 할인이 있나요?
3개월 이상 예약형은 최대 15% 할인과 물량 보장을 제공해요. 연구실과 대학은 학술 할인도 받을 수 있으니 문의해 주세요.
