Of het nu gaat om infrastructuur, security, toegankelijkheid, kosten, compatibiliteit of schaalbaarheid, het handmatige beheer van data storage is altijd een uitdaging geweest. Een uitdaging waar developers al lang mee te maken hebben.
Tegen 2024 zal de jaarlijkse hoeveelheid gecreëerde, vastgelegde, gekopieerde en verbruikte ongestructureerde data naar verwachting 149 zettabytes overschrijden. Voor bedrijven – en vooral voor developers – is de explosie van ongestructureerde data niet zomaar een eenvoudig probleem.
De uitdaging van datagroei
Het inrichten van storage is van oudsher een handmatig, tijdrovend proces met hoge aanloopkosten en veel giswerk. Als je te veel opslagcapaciteit inricht, betaal je meer dan je zou moeten. Als je te weinig inricht, kom je zonder opslagcapaciteit te zitten.
Nu organisaties steeds meer data genereren, is het correct inrichten van storage belangrijker dan ooit. Ongestructureerde data – waar de meeste groei wordt verwacht – heeft normaal gesproken file systems, directories of buckets nodig om data op te slaan. Vroeger hadden de systemen die werden gebruikt om deze ongestructureerde data op te slaan diverse beperkingen. Ze waren bijvoorbeeld niet erg schaalbaar en het kostte storage beheerders veel tijd en aandacht. Tegenwoordig is dit niet meer haalbaar. Moderne datasystemen moeten transparant en zonder disruptie kunnen opschalen en beschikbaar zijn zonder menselijke tussenkomst.
De behoefte aan moderne data systemen wordt verder versterkt door de tekortkomingen van de traditionele disk-based storage systemen. HDD’s zijn niet energie-efficiënt, bezetten veel ruimte in het datacenter en hebben hoge kosten voor workloads die gebruikmaken van ongestructureerde data. Moderne all-Flash storage platforms voor ongestructureerde data kunnen al deze problemen oplossen. Wanneer ze dit combineren met infrastructuur en applicatie automatisering, kunnen organisaties overal gebruikmaken van een ‘Cloud Operating model’.
De belofte van storage automation voor developers
Developers en applicatie teams hoeven niet te weten hoe de fysieke infrastructuur achter hun applicaties er uitziet. Wat ze wel belangrijk vinden, zijn Service Level Agreements (SLAs) en de juiste resources tot hun beschikking hebben om te voldoen aan hun behoeften op het gebied van prestaties, schaalbaarheid en databescherming. Ze hebben infrastructuur nodig die lineair schaalt en resources die onmiddellijk worden geleverd, met slechts een paar regels code, een API-call of een paar kliks. Ze willen overal de self-service cloud-ervaring – en wie kan ze dat kwalijk nemen?
Flexibiliteit, wendbaarheid en snelheid zijn voor moderne organisaties net zo belangrijk als prestaties en betrouwbaarheid. Automatisering is essentieel om handmatige storage management weg te nemen. Als eerste stap zouden bedrijven gebruik moeten maken van Infrastructure as Code in plaats van handmatige processen.
Met Infrastructure as Code kunnen ontwikkel- en operationele teams automatisch resources beheren, monitoren en inrichten, zonder dat ze daarvoor hardware en besturingssystemen handmatig moeten configureren. Door hardware- en software-infrastructuur op te splitsen in modulaire componenten kunnen developers deze naar behoefte makkelijk combineren en automatiseren. Daarnaast hoeven ze zich geen zorgen te maken over configuratieafwijking (‘configuration drift’) door menselijke fouten. Moderne Infrastructure as Code-oplossingen zorgen er voor dat de actuele configuratie aansluit op de vereisten van policies en verschillende services. Voor developers betekent dit consistente resultaten en minder fouten, handmatige implementaties en inconsistenties.
Met geautomatiseerde Infrastructure as Code kunnen developers veel voorkomende beheertaken op verschillende manieren vereenvoudigen. Zo kunnen de initiële workloads worden afgehandeld aan de hand van AI-gestuurde aanbevelingen of kunnen alle devices binnen de organisatie tegelijk worden voorzien van nieuwe resources. Gebruikers kunnen zelf een keuze maken uit een catalogus van policy-gebaseerde mogelijkheden, waarbij de infrastructuur automatisch schaalt en zich aanpast aan de behoefte van het bedrijf.
De flexibiliteit die dit biedt, is essentieel nu veel organisaties uitbreiden naar hybride cloud modellen en container orchestration tools zoals Kubernetes. Om te kunnen blijven concurreren, moeten bedrijven de nieuwe data services ondersteunen waar hun klanten om vragen. Developers willen Platform-as-a-Service gebruiken en cloud vendor lock-in vermijden, maar hebben vaak niet de operationele expertise om verschillende diensten te beheren. Moderne Database-as-a-Service-oplossingen maken het mogelijk om via een enkele API-call verschillende dataservices uit elke cloud te gebruiken, zelfs als gebruikers niet weten hoe ze een bepaalde database, message queue of analyseoplossing moeten implementeren.
Infrastructure as Code – automatisering
Om te voldoen aan de behoeften van zakelijke gebruikers en hun klanten, is het absoluut noodzakelijk dat dataplatforms zich ontwikkelen in de richting van ‘as Code’ en automatisering. Infrastructure as Code kent natuurlijk een aantal uitdagingen, zoals het samenvoegen van nieuwe frameworks met bestaande technologie en de complexiteit van migraties, maar die wegen niet op tegen de voordelen, zoals de verbeterde samenwerking tussen IT-teams, het gemak van automatisering en de snelheid die hiermee mogelijk is. Alleen door Infrastructure as Code en automatisering te omarmen kunnen developers innoveren op de snelheid die tegenwoordig van ze wordt verwacht.
Marco Bal, Principal Systems Engineer, Pure Storage