Miert XCP-ng, es miert nem VMware
A Nortinia infrastrukturaja kb. 100 virtualis gepet jelent tobb fizikai hoston, plusz Kubernetes klasztereket es support szolgaltatasokat. A hipervizor valasztas dontes volt, nem default. Ket evvel ezelott a kerdes igy hangzott: VMware vSphere, Proxmox VE vagy XCP-ng? XCP-ng nyert. Itt a miert.
A koltsegszamitas
VMware vSphere Standard licenc 2024-ben kb. 400 EUR / socket / ev. Egy tipikus dual-socket Xeon hostnal ez 800 EUR/ev/host. Hat hostnal: 4 800 EUR/ev csak a hipervizor licencre, vCenter kulon. A Broadcom-felvasarlas (2024) ota a per-core pricing es a minimum komitmentek tovabb romlottak.
XCP-ng: 0 EUR licencdij. A Vates (XCP-ng szallitoja) kinal fizetos support csomagot (Pro: 1 250 EUR/ev/host), ami az SLA-nkhoz nem kell — a Xen Project es a Vates community elerheto, es a havi 1-2 kerdest ott megoldjuk.
Net megtakaritas: kb. 4 800 EUR/ev csak a licencen, plusz a vCenter (~2 000 EUR/ev) megspoorolva.
A licenc-szuverenitas
A Broadcom-felvasarlas utan tobb hires storyt olvastunk arrol, hogy a perpetual licencek subscription-only modellre konvertalodtak, es egyes ugyfeleknek 5x-osere ugrott a kiadasa. Ez technikai kockazat: ha holnap a szallito atformazza a feltetelket, mi tehetjuk-e. Nyilt forrasu hipervizoral ez a kockazat nem letezik. A Xen Project (es az XCP-ng) Linux Foundation kerete alatt fut, a Vates a fenntarto, de fork lehetseges ha mindenki elment.
A Xen biztonsagi modell
A Xen Type 1 (bare metal) hipervizor: a dom0 (Linux) management VM, a domU-k a vendegek. A KVM-hez kepest a Xen kisebb attack surface-szel rendelkezik: nincs a kernelben futo kvm modul, a hipervizor es a host OS szepen elvalik. AWS evek ota Xenen futtatta az EC2-ot (most Nitro), pont emiatt a szigetelesi modellert.
A gyakorlatban: az utolso 5 evben 0 CVE kerult elo, ami egy Nortinia productionos workloadot kompromittalt volna a Xen-en keresztul. (Volt ket Xen security advisory, mindketto patch-elve a hetes patch ciklusunkban.)
Snapshot teljesitmeny
A Xen xen-vbd snapshot copy-on-write a Storage Repository szinten. Egy 100 GB-os VM snapshotja: ~2 masodperc. Visszaallitas: ~5 perc (a SR-en at lemasolasos restore). Ez napi backup jobokat tett lehetove (xe vm-export cron) — VMware-nel a kornyezetunkben hasonlo snapshot 8-15 masodperc, restore 7-10 perc.
A 3 hianyzo VMware feature
Mit vesztettunk VMware-rol attervessel? Harom dolgot:
- vMotion (live migration GUI) — XCP-ng
xe vm-migrateparancssorbol mukodik, de a vSphere drag-and-drop UX-e jobb. Megepitettuk a NIP-en sajat "Migrate VM" gombbal, lekepezi axe vm-migrate-et. Megoldva. - DRS (Distributed Resource Scheduler) — VMware automatikusan kiegyenliti a terhelest a hostok kozott. XCP-ng-nek nincs ilyen. Megepitettuk a sajatunkat:
nip-balancercron, ami 15 percenkent nezi a host load-okat, es ha egyik >80%, javasol egy migration tervet az on-callnak (nem automatikus, mert nem akarjuk a hajnal 3-as meglepetest). Megoldva. - Fault Tolerance (FT, lockstep) — egy VM masodpercre pontos masolata egy masik hoston, instant failover. Ezt nem epitettuk meg. Helyette: a kritikus workloadok Kubernetes-en futnak (replikas), ahol a pod-failover beepitett. Az egyetlen valodi single-instance VM (Postgres primary) high availabilityet PG streaming replicaval oldjuk meg, nem hipervizor-szinten.
Miert nem Proxmox
Proxmox VE is nyilt forrasu, KVM-alapu, kituno community. Megnezetuk. Ket ok miatt nem valtunk:
- KVM vs Xen attack surface — szubjektiv, de a Xen modell kisebb. AWS-i precedens.
- Tarolas integralhatosaga — XCP-ng a XOSAN/XOSTOR-ral (Vates sajat distributed storage) jol egyutt mukodik, mi viszont sajat Ceph-tunk van, es a Xen
XAPI-jat egyszerubb volt belekoturkalni, mint a Proxmoxpveproxy-jat. Tortenelmi ok, ma valoszinuleg ujragondolnam.
Mit nem valtanank meg most
Ket ev XCP-ng utan: a dontes jo volt. Az evi ~7 000 EUR megtakaritas (licenc + vCenter + support) eleg, hogy egy +1 mernok 1 napjat fedezze hetente, amennyiben szukseg lenne a xe CLI ismeretere. Eddig nem kellett.