Därför bare metal för GPU-laster
Moln-GPU:er delar PCIe-lanes, minnesbandbredd och värd-CPU med andra hyresgäster. För långa träningskörningar, realtidsinferens och renderingspipelines visar sig den belastningen som ojämn genomströmning och längre jobbtider. En bare metal-GPU-server ger dig hela maskinen — PCIe-topologin, CPU-pinningen, NVMe-arrayen, nätverksgränssnittet.
Du installerar din egen OS-image, din egen CUDA-stack, din egen scheduler — eller så provisionerar vi Ubuntu LTS med NVIDIA-drivers och CUDA färdigt att köra. Kör Docker, Kubernetes, Slurm, Proxmox eller vad du vill, utan begränsningar. Varje server inkluderar IPMI/iLO så du kan installera om, starta om, konsol-logga in och övervaka hårdvarustatus 24/7.
GPU-konfigurationer
Standardkonfigurationer — anpassade bygg på förfrågan.
RTX A4000 / 16 GB
Instegsnivå — ML-inferens, lätt träning, virtuella arbetsstationer
- GPU: 1× NVIDIA RTX A4000 (16 GB GDDR6, 6144 CUDA-kärnor)
- CPU: Intel Xeon / AMD EPYC, 8 kärnor
- RAM: 64 GB DDR4 ECC
- Lagring: 2× 960 GB NVMe SSD
- Bandbredd: 1 Gbps obegränsad
- OS: Ubuntu 22.04 LTS / Windows Server / valfritt
RTX A5000 / 24 GB
Proffsnivå — träning av medelstora modeller, renderingsfarmer
- GPU: 1× NVIDIA RTX A5000 (24 GB GDDR6, 8192 CUDA-kärnor)
- CPU: Intel Xeon / AMD EPYC, 16 kärnor
- RAM: 128 GB DDR4 ECC
- Lagring: 2× 1,92 TB NVMe SSD
- Bandbredd: 1 Gbps obegränsad
- OS: Ubuntu 22.04 LTS / Windows Server / valfritt
RTX A6000 / 48 GB
Avancerad nivå — finjustering av stora modeller, flerströmsrendering
- GPU: 1× NVIDIA RTX A6000 (48 GB GDDR6 ECC, 10752 CUDA-kärnor)
- CPU: AMD EPYC, 32 kärnor
- RAM: 256 GB DDR4 ECC
- Lagring: 2× 3,84 TB NVMe SSD
- Bandbredd: 10 Gbps
- OS: Ubuntu 22.04 LTS / Windows Server / valfritt
NVIDIA A100 / 80 GB
Datacenter-nivå — LLM-träning och inferens med hög genomströmning
- GPU: 1–8× NVIDIA A100 80 GB HBM2e (PCIe eller SXM4 NVLink)
- CPU: Dubbla AMD EPYC, upp till 128 kärnor
- RAM: 512 GB – 2 TB DDR4 ECC
- Lagring: 4× 7,68 TB NVMe SSD
- Bandbredd: 10–25 Gbps
- OS: Ubuntu 22.04 LTS med CUDA + NCCL förinstallerat
NVIDIA H100 / 80 GB
Flaggskeppsnivå — transformerträning, frontier-skala inferens
- GPU: 1–8× NVIDIA H100 80 GB HBM3 (PCIe eller SXM5 NVLink)
- CPU: Dubbla AMD EPYC Genoa, upp till 192 kärnor
- RAM: 1–2 TB DDR5 ECC
- Lagring: 8× 7,68 TB NVMe SSD (RAID)
- Bandbredd: 25–100 Gbps
- OS: Ubuntu 22.04 LTS med CUDA + NCCL + NeMo-stack
Anpassat bygge
Beskriv arbetslasten — vi spec:ar maskinen
- Multi-GPU NVLink-topologier
- L4, L40 / L40S, RTX 4090 finns också
- Privat nätverksinterconnect (10/25/100 GbE)
- NVMe-oF eller Ceph-lagring
- Colocation av kundägd hårdvara
- Reserverad kapacitet och längre kontrakt
Vanliga arbetslaster
AI- och ML-träning
Träna, finjustera och utvärdera transformer-, diffusions- och vision-modeller. Använd PyTorch, JAX, TensorFlow eller vilket ramverk du vill. NVLink-anslutna A100/H100-noder för flergpu-jobb som behöver snabb all-reduce.
Inferens i skala
Servera LLM:er, bildgenerering, tal- och embedding-modeller med förutsägbar latens. Triton Inference Server, vLLM, TGI, llama.cpp — du väljer runtime, vi tillhandahåller hårdvaran.
3D-rendering och VFX
OptiX, RTX-accelererad path tracing, Blender Cycles, Redshift, V-Ray och Octane. Renderingsfarmer skalar linjärt över våra A5000- och A6000-noder.
Videotranskodning
NVENC/NVDEC hårdvarukodare för live- och VOD-pipelines — H.264, H.265/HEVC och AV1. Flera samtidiga strömmar per GPU med hög kvalitet.
Vetenskaplig beräkning / HPC
CUDA-, OpenACC- och HIP-laster — molekyldynamik, strömningsmekanik, genomik, finansiella simuleringar. Ta med din egen MPI-stack eller Slurm-klustret.
Virtuella arbetsstationer
Remote GPU-desktops via NICE DCV, Parsec eller HP Anyware. Designers och ingenjörer ansluter varifrån som helst — det tunga jobbet stannar på servern.
Hostade i Sverige
Alla GPU-servrar är fysiskt placerade i våra svenska datacenter, drivna av nordisk vatten- och vindkraft — bland Europas elnät med lägst koldioxidintensitet. EU-datalokalisering, GDPR-anpassad drift, redundant ström och kyla, on-site teknik dygnet runt.
Nätverk: multi-homed transit via Tier-1-operatörer, IPv4 + IPv6, privat peering mot NetNod, STHIX och Equinix. Sub-millisekund RTT till Stockholm, låga ensiffriga ms till Frankfurt, Amsterdam och Helsingfors.
Vanliga frågor
Har du en arbetslast i åtanke?
Berätta modellstorlek, ramverk och genomströmning du behöver — vi återkommer med en konfiguration och ett pris.
Hör av dig →