In de dynamische technologische omgeving van vandaag worden dienstverleners zoals cloud service providers (CSP’s), managed service providers (MSP’s), software-as-a-service (SaaS) providers en enterprise private cloud operators geconfronteerd met een groot aantal uitdagingen in het moderne datacenter.
Het enorme landschap van technologieën die bepalen wat een modern datacenter is en hoe het efficiënt werkt, evolueert snel, waarbij kostenbeheer al snel een voortdurende zorg wordt voor alle dienstverleners. Hieronder staan vijf best practices voor CSP’s om het moderne datacenter te schalen.
1. Vloeistofkoeling gebruiken om de prestaties te verbeteren
In de afgelopen drie decennia heeft het datacenterlandschap een gestage groei doorgemaakt, voornamelijk gestimuleerd door de snel toenemende vraag naar AI-servertechnologieën. Toch blijft de uitdaging van milieuduurzaamheid een belangrijke zorg. Nieuwe servers, uitgerust met de nieuwste CPU’s en GPU’s, naderen de grenzen van luchtkoeling, waardoor er behoefte is aan een innovatieve benadering van vloeistofkoeling. Deze technologie helpt de microprocessors en versnellers binnen hun ontwerplimieten te houden. Bovendien worden CSP’s geconfronteerd met een hardnekkig probleem rondom het stroombudget van datacenters, wat hen ertoe zou moeten aanzetten om vloeistofkoeling te overwegen als middel om de efficiëntie van het stroomverbruik (PUE) te verbeteren en tegelijkertijd het HVAC-koelingsvermogen te minimaliseren.
Veel datacenters hebben een stroombudget van 10 tot 12 kilowatt per rack, wat al een aanzienlijke uitdaging vormt voor racks gevuld met servers, GPU-servers en opslagsystemen. Nieuwe AI-geoptimaliseerde systemen kunnen echter tot wel 10 kW per server verbruiken, wat het totale vermogen per rack kan opstuwen naar 100 kilowatt. Een bewezen oplossing zoals vloeistofkoeling maakt het mogelijk om servers met een hogere dichtheid en GPU-versnelde servers te gebruiken. De externe warmtewisselaar van vloeistofkoeling is bovendien veel efficiënter dan conventionele HVAC-koeling. Het is belangrijk om de infrastructuur voor vloeistofkoeling vooraf te plannen, nog voordat het rack wordt geleverd. Samenwerken met een ervaren partner op het gebied van vloeistofkoeling op rackniveau is cruciaal voor het realiseren van een efficiënt datacenter.
De komende generatie krachtige infrastructuur voor vloeistofkoeling is klaar om de taak van ondersteuning van CSP’s in het datacenter op zich te nemen. Nieuwe oplossingen van Supermicro zijn ontworpen en getest om CPU’s en GPU’s met hoge dichtheid en een hoog thermisch ontwerpvermogen (TDP) te ondersteunen. Deze oplossingen hebben strenge validatie- en testprocedures ondergaan op verschillende niveaus, waaronder systeem-, rack- en clusterevaluaties, om het hoogste niveau van consistentie en betrouwbaarheid te garanderen.
2. Leveranciers en tijdige technologische vernieuwingen
De grootste constante in het technologische landschap is groei. Toch blijkt het wachten op de nieuwste en beste technologie een weinig effectieve strategie, aangezien er voortdurend nieuwe technologieën en verbeteringen worden gepresenteerd. Door strategisch in te spelen op belangrijke technologische overgangen en een weldoordachte upgrade- of migratiestrategie te implementeren, kun je de voordelen voor de koper maximaal benutten.
Bovendien gaat de uitbreiding van diensten en de gelijktijdige groei van technologie niet altijd gepaard met een toename van personeel en middelen. Het is essentieel voor CSP’s om samen te werken met een betrouwbare leverancier die geavanceerde servers, opslag- en netwerkoplossingen biedt, die vooraf zijn getest en in een rack zijn geassembleerd met de juiste softwarestack. Deze samenwerking kan helpen om enkele van de uitdagingen die een datacenter met zich meebrengt te verlichten, wat resulteert in een snellere inzet van nieuwe diensten of verbeteringen van bestaande diensten. Als leider in het leveren van rack-scale oplossingen aan CSP’s van alle groottes, heeft Supermicro aanzienlijke ervaring op het gebied van productontwikkeling, toeleveringsketenlogistiek, service en ondersteuning, en dimensionering en testen. Het is van cruciaal belang om toegang te hebben tot een leverancier met diepgaande partnerschappen die kan helpen bij het delen van transitieplannen, kostenimpact en problemen met de toeleveringsketen.
Daarnaast biedt een gedesaggregeerde of modulaire server- en rackbenadering de mogelijkheid om specifieke componenten of servers te upgraden zonder het gehele chassis of alle componenten te hoeven vervangen. Nieuwe generaties servers, die veel meer werk per watt kunnen verrichten, vereisen mogelijk ook meer vermogen. Het ontwerp van een nieuw datacenter mag niet beperkt worden door de stroomvereisten van racks bij de installatie van de eerste servers en racks. Door nauw samen te werken met een leverancier zoals Supermicro, kunnen CSP’s beter inzicht krijgen in de benodigde criteria en middelen voor de toekomstige technologieën in hun datacenter.
3. Op de hoogte blijven van de nieuwste serverontwerpen
Om kostenbeheer te ondersteunen, kan het gebruik van nieuwe technologieën de prestaties verbeteren tegen lagere kosten. Afhankelijk van de vereiste SLA’s (Service Level Agreements), de codebasis en het verwerkingsniveau van de matrix, kunnen AI-workloads bijvoorbeeld op CPU’s of GPU’s worden uitgevoerd. Sommige workloads kunnen zelfs van de CPU naar een aanvullende gegevensverwerkingseenheid (DPU) worden verplaatst, die tegelijkertijd fungeert als netwerkinterface en gegevensverwerkingseenheid.
Sommige workloads profiteren echter van een aangepaste aanpak met een veld-programmeerbare poortmatrix (FPGA). De introductie van CXL 2.0 (Compute Express Link) voegt een extra laag toe aan de geheugenhiërarchie, die direct onder DRAM maar boven SSD’s is geplaatst. Dit maakt ook het concept van gepoold geheugen mogelijk, dat flexibel kan worden toegewezen aan een van de CPU’s in een systeem, en vermindert het probleem van gestrand geheugen, dat aan een CPU is gekoppeld maar niet volledig wordt benut. Deze nieuwe technologieën kunnen de workload en softwarestack van de beoogde dienst verbeteren. Het testen van nieuwe technologieën in een proof-of-concept (POC)-omgeving, voordat ze op grote schaal worden ingezet, is daarbij essentieel. Samenwerken met een hardwarepartner voor vroege POC-testen met deze nieuwe technologieën is cruciaal voor het behalen van concurrentievoordelen ten opzichte van je concurrenten.
Hoewel het eerste gesprek wellicht draait om de keuze van de juiste server(s) voor de beoogde workloads, zal het gesprek al snel verschuiven naar integratie op rackschaal. Naarmate het aantal racks op een locatie toeneemt, wordt het essentieel om de werking en beperkingen van het hele datacenter te begrijpen. Het datacenter moet als een geïntegreerd geheel worden gezien, waarbij onderwerpen zoals de scheiding van koude en warme gangpaden, geforceerde luchtkoeling, de grootte van koelers en ventilatoren, en elektrische distributie allemaal een rol spelen. De discussie over koeltechnologieën moet vroeg in het proces plaatsvinden, omdat de fysieke infrastructuur van het datacenter afhankelijk zal zijn van de keuze van het CSP voor lucht- of vloeistofkoeling.
4. Meting, beheer en de toeleveringsketen
Om de efficiëntie van je huidige datacenter nauwkeurig te beoordelen, moet je instrumenten gebruiken om het CPU-, opslag- en netwerkgebruik te meten. Er zijn ook tools beschikbaar om dit op clusterniveau te doen. Deze tools kunnen waardevolle informatie opleveren over waar zich bestaande knelpunten voordoen en waar over- of onderbezetting niet optimaal is. Daarnaast kan ook de temperatuur van de CPU’s en servers worden gemeten, wat potentiële problemen kan identificeren voordat de problemen storingen veroorzaken.
Een datacenter voor een cloud provider wordt waarschijnlijk door veel klanten tegelijk gebruikt en daarom is er een taakbeheerplanner nodig om de efficiëntie van de activiteiten van het datacenter te handhaven. Met eindige bronnen kan het zijn dat niet aan alle verzoeken voor computing, opslag of netwerken kan worden voldaan en dat jobs of applicaties moeten worden ingepland of ingepast naarmate de vereiste bronnen meer beschikbaar komen of totdat aanvullende software kan worden aangeschaft.
In termen van het beheren van de toeleveringsketen wordt gezegd dat het identificeren van “de zwakste schakel” bij het beheren van leveranciers optimaal is. Hoewel we geen hiërarchie of kaste in de toeleveringsketen voorstaan, is het vereenvoudigen van de toeleveringsketen voor belangrijke leveranciers een ideale best practice voor bestelling, installatie en ondersteuning. Eén leverancier die servers, opslag, netwerken, softwareoplossingen van derden en rackintegratie kan leveren en zelfs unieke hardware van derden kan integreren in één systeem is ideaal.
5. Productie-expertise en ervaring in het bouwen van een CSP
Het is een industrieel geheim dat bijna alle grote original equipment manufacturers (OEM’s) de productie, het ontwerp en de toeleveringsketen van hun producten hebben uitbesteed aan original design manufacturers (ODM’s) en contact manufacturers (CM’s). De OEM’s richten zich voornamelijk op de marketing en verkoop van deze producten. Het is waardevol om te werken met een bedrijf dat al zijn producten ontwerpt, van chassis tot moederborden en voedingen, en ze produceert op locaties die geografisch dicht bij de locatie van de klant liggen. Vanuit het perspectief van de klant betekent dit dat een leverancier van datacenters veel flexibeler kan zijn, snellere levertijden kan bieden en uiteindelijk de totale eigendomskosten kan verlagen door minder tussenpersonen, sneller transport en schaalvoordelen.
Net als het invoeren van nieuwe technologieën in het datacenter, kan het een riskante beslissing zijn om alles op één leverancier te zetten. Het selecteren van een leverancier van datacenteroplossingen is niet het moment of de plaats om het op de werkplek te leren of om samen te werken met een bedrijf dat meer gericht is op zijn eigen managed service-aanbiedingen of het maken van laptops. In plaats daarvan is het werken met een B2B-bedrijf zoals Supermicro, dat zich specifiek richt op het datacenter en al tientallen jaren werkt met serviceproviders en grootschalige HPC-clusters van servers, en oplossingen aandrijft voor de grootste hyperscalers, OEM’s en ondernemingen, van groot voordeel voor CSP’s.
De efficiënte exploitatie van een datacenter als CSP vereist een zeer nauwgezette planning en een nauwe samenwerking met full-service providers. Er moeten verschillende beslissingen worden genomen die van invloed zijn op de opstarttijden, SLA’s en algehele efficiëntie van het datacenter. Of je nu een publiek gedeeld datacenter of een on-premises datacenter ontwerpt en implementeert, plan zorgvuldig, verdiep je in en begrijp de server- en racktechnologie en verken het enorme landschap van nieuwe technologieën en oplossingen die het datacenter de komende jaren draaiende zullen houden.
Michael McNerney, Vice President Marketing & Netwerkbeveiliging, Supermicro