Programmering

Hva egentlig lagring i overskala egentlig betyr

La oss være klare: Hyperscale handler ikke om hvor stor du er.

Organisasjoner trenger ikke være enorme for å utnytte hyperskalaløsninger. Men det er nøyaktig hva mange IT-infrastrukturer, operasjoner og devops-proffer tenker når de først lærer om hyperscale.

Den rådende troen er at hyperskalearkitektur er ment for ekstremt store infrastrukturer - som de som drives av LinkedIn, Amazon eller Netflix - fordi den skaleres til tusenvis av forekomster og petabytes med data. Som det viser seg, er det bedre å tenke på overskala som å beskrive en nærme seg heller enn størrelse. Det handler om automatisering, orkestrering og bygging av IT som skaleres intelligent når og når virksomheten trenger det. Hyperscale-distribusjoner kan og bør starte i liten grad, og skaleres på ubestemt tid. De bør også tillate deg å uavhengig skalere bare den delen av infrastrukturen som trenger den, noe som er i motsetning til en annen fremvoksende datasentertendens, hyperkonvergens.

Forvirret ennå? I så fall er du ikke alene. La oss dykke litt dypere.

Definere hyperscale

Konseptet med å bygge en hyperskalaarkitektur er gjørmete av mange tangensielle begreper. Spesielt ser vi kunder forvirret om hyperkonvergerte, hyperscale (eller web-skala), konvergerte, programvaredefinerte og råvarebaserte infrastrukturer.

La oss ta et øyeblikk for å avklare definisjoner på disse ingrediensbetingelsene:

  • Programvaredefinert: Infrastruktur der funksjonaliteten er helt frakoblet fra den underliggende maskinvaren og er både utvidbar og programmatisk. Les dette innlegget for å få mer informasjon om programvaredefinert lagring spesielt.
  • Råvarebasert: Infrastruktur bygget oppå råvare eller industristandard infrastruktur, vanligvis en x86 rackmontert eller bladserver. Som vi har skrevet tidligere, må du ikke blande vare med billig.
  • Konvertert: En skaleringsarkitektur der server-, lagrings-, nettverks- og virtualiserings- / containeriseringskomponenter er bundet sammen som en forhåndstestet, forhåndsintegrert løsning. Komponenter er fremdeles forskjellige i denne arkitekturen.
  • Hyperkonvergerte: En utskalningsarkitektur som tar konvergerte infrastrukturer et skritt videre ved å kombinere programvaredefinerte komponenter på toppen av maskinvare, pakket som en enkelt løsning - ofte et enkelt apparat. Komponenter er ikke lenger forskjellige.
  • Overskala: En utskalningsarkitektur som også er programvaredefinert og varebasert, men der server-, lagrings-, nettverks- og virtualiserings- / containeriseringsressursene forblir separate. Hver komponent er distinkt og kan skaleres uavhengig.

Oppsummert, tenk på hyperkonvertert infrastruktur som den moderne, logiske ekstremen av konvergerte systemer, mens hyperscale er den moderne, logiske ekstremen av hvordan vi har bygget datasentre i 30 år. Begge er fornuftige for spesifikke miljøer, som vist nedenfor.

Overskala og hyperkonvergerte

Hos Hedvig streber vi etter å levere en lagringsløsning som kan skreddersys fleksibel for enhver arbeidsmengde, fra private skyer, inkludert Docker og OpenStack, til store datadistribusjoner som kjører Hadoop eller NoSQL til mer tradisjonell servervirtualisering, katastrofegjenoppretting, sikkerhetskopiering og arkivering. Hedvig Distribuert lagringsplattform virtualiserer og samler flash og spinnende disk i en serverklynge eller sky, og presenterer den som et enkelt, elastisk lagringssystem som er tilgjengelig via fil-, blokk- eller objektgrensesnitt.

Hedvig Distribuert Lagringsplattform består av tre komponenter:

  • Hedvig Storage Service: En patentert distribuert-systemmotor som skalerer lagringsytelse og kapasitet med hylle-x86- og ARM-servere. Hedvig Storage Service kan kjøres lokalt eller på offentlige skyer som AWS, Azure og Google. Den leverer alle lagringsalternativene og funksjonene som kreves for en virksomhetsdistribusjon, inkludert inline deduplisering, innebygd komprimering, øyeblikksbilder, kloner, tynn klargjøring, autotiering og caching.
  • Hedvig Storage Proxy: En lett VM eller container som gir tilgang til Hedvig Storage Service via industristandardprotokoller. Hedvig støtter for øyeblikket NFS for fil og iSCSI for blokk, samt OpenStack Cinder og Docker-drivere. Hedvig Storage Proxy muliggjør også hurtigbufring på klienten og deduplisering med lokale SSD- og PCIe-flashressurser for rask lokal lesing og effektiv dataoverføring.
  • API-er for Hedvig: REST- og RPC-baserte APIer for både objektlagring og Hedvig-operasjoner. Hedvig støtter for tiden Amazon S3 og Swift for objektlagring. Utviklere og IT-driftsadministratorer kan bruke administrasjons-API-ene for å gi tilgang til alle Hedvig-lagringsfunksjoner for å automatisere klargjøring og administrasjon med selvbetjeningsportaler, applikasjoner og skyer.

Hedvig støtter hyperkonvergens ved å pakke sammen Hedvig Storage Proxy og Hedvig Storage Service som virtuelle apparater som kjører på en vareserver med en hypervisor eller container OS. For hyperscale blir Hedvig Storage Service distribuert på bare metall-servere for å danne et dedikert lagringsnivå mens Hedvig Storage Proxy distribueres som en VM eller container på hver server i beregningsnivået.

Hvorfor velge overskala for lagring

Data vokser mye raskere enn lagringsbudsjetter. Økonomien er ødeleggende for bedrifter som ikke har ressurser fra internettgoliater som Amazon, Google og Facebook. Dermed må bedrifter omfavne programvaredefinert og varebasert lagring for å redusere kostnadene og opprettholde fleksibiliteten og skalerbarheten som trengs for å holde tritt med forretningskravene.

Hos Hedvig har vi lagt merke til at kunder velger om lag 80% av tiden i stedet for hyperkonvergerte, til tross for at vi støtter begge deler. Det som er enda mer interessant er at mange av kundene våre kommer til oss og tenker stikk motsatt. Om lag 80 prosent ber om en hyperkonvergert løsning, men etter at de har gjort leksene, velger de hyperscale-tilnærmingen.

Hvorfor? I et nøtteskall, fordi de favoriserer fleksibilitet (eller smidighet, hvis du må bruke det ordet) fremfor alt når du arkitekturer infrastrukturen. Vurder følgende:

  • Et hyperkonvertert system tilbyr en forenklet "byggestein" -tilnærming til IT. For magre IT-organisasjoner som ønsker å senke kostnadene ved å distribuere og utvide en skylignende infrastruktur, gir hyperkonvergens en god løsning. Men det krever et relativt forutsigbart sett med arbeidsbelastninger der "datalokalitet" er topprioritet, noe som betyr at applikasjonen eller VM må være plassert så nær dataene som mulig. Dette er grunnen til at VDI har vært et plakatbarn for hyperkonvergens. Brukere vil ha sin "virtuelle C: stasjon" lokal. Men det er ikke fleksibelt, da det innebærer å skalere alle elementene i lockstep.
  • Et hyperskalasystem holder lagring uavhengig av beregning, slik at bedriftens IT kan skalere kapasiteten når virksomheten trenger det. Den hyperscale tilnærmingen til datasenter og skyinfrastruktur gir et høyt elastisitetsnivå, og hjelper organisasjoner raskt å svare på endrede behov for applikasjon og datalagring. Det er også en arkitektur som bedre samsvarer med moderne arbeidsbelastninger som Hadoop og NoSQL, så vel som de som er arkitektert med skyplattformer som OpenStack og Docker. Alt dette er eksempler på distribuerte systemer som drar nytte av uavhengig skalert delt lagring.

Det vi har opplevd med kundene våre, er en samlebekreftelse på det vi har lagt merke til en stund nå: at hyperkonvergerte er en svar og ikke de svar når du utforsker moderne lagringsarkitekturer. For å være sikker ser industrien en stor pendel svinge til hyperkonvergerte på grunn av sin enkelhet. Men hvis dataene dine vokser eksponentielt og databehandlingsbehovene dine ikke er det, har du en impedansmatching som ikke passer godt for hyperkonvergens.

Overskala eller hyperkonvergert?

Hyperconverged kan være en enklere og mer kostnadseffektiv tilnærming. Det kundene våre oppdager med Hedvig er imidlertid at vi støtter en funksjon som gjør hyperscale passende for nesten alle arbeidsbelastninger: caching på klientsiden. Hedvig kan dra nytte av lokale SSD- og PCIe-enheter i databehandlingsnivået ditt for å bygge en skrivebuffer. Dette forbedrer leseytelsen betydelig, og enda viktigere, løser datalokalitetsutfordringen. Lagring er fremdeles frakoblet og kjører i sin egen dedikerte, overskala tier, men applikasjoner, virtuelle maskiner og containere kan dra nytte av data lagret lokalt i beregningsnivået. Dette løser også problemet med hvordan du kan utvide caching-nivået ditt, men det er et tema for en annen artikkel.

Som et eksempel på denne fordelen valgte en kunde Hedvigs hyperscale-tilnærming for VDI, en arbeidsmengde som tradisjonelt er reservert for hyperkonvergerte løsninger som diskutert ovenfor. I dette tilfellet hadde kunden “strømbrukere” som krevde at 16 vCPUer og 32 GB minne skulle være dedikert til hvert vertsdesk. Som et resultat ble selskapet tvunget til å distribuere et stort antall hyperkonvergerte noder for å støtte prosesserings- og minnekravene, samtidig som lagringskapasiteten i lockstep unødvendig økte.

Med Hedvig-plattformen klarte kunden å lage dedikerte noder for å kjøre Citrix XenDesktop-gården på biffete bladservere med tilstrekkelig CPU og RAM. Dataene ble holdt i en egen hyperscale Hedvig-klynge på rackmonterte servere, med data lagret tilbake på XenDesktop-serverne i lokale SSD-er. Resultatet? En dramatisk billigere løsning (60 prosent mindre). Mer viktig, det ga også et mer fleksibelt miljø der selskapet kunne kjøre på Moores lov og kjøpe de kraftigste serverne som trengs for å oppgradere stasjonær ytelse uten å måtte oppgradere lagringsservere.

Basert på vår erfaring er det noen enkle tommelfingerregler for å bestemme hvilken arkitektur som passer for deg.

  • Velg overskala når ... organisasjonen din har 5000 ansatte eller mer, mer enn 500 terabyte data, mer enn 500 applikasjoner eller mer enn 1000 virtuelle maskiner.
  • Velg hyperkonvergert når ... du er under disse vannmerkenumrene, har fem eller færre ansatte som administrerer den virtuelle infrastrukturen, eller du er i et eksternt eller avdelingskontor.

Den gode nyheten er at det ikke trenger å være en eller annen beslutning. Du kan starte i et hyperkonvergerte miljø, deretter bytte til hyperscale, eller du kan blande og matche de to. Vår filosofi er at applikasjonene dine dikterer hvilken du skal bruke. Og ettersom søknadsbehovene dine vil endres over tid, bør distribusjonen også gjøres.

I moderne virksomheter er endring og vekst obligatorisk. I økende grad er det ingen måte å løse dette gåten uten den hyperscale arkitekturen som nettgigantene var pionerer for. Det som er endret er at enhver bedrift nå kan dra nytte av hyperscale-tilnærmingen.

Rob Whiteley er VP for markedsføring i Hedvig.

New Tech Forum er et sted for å utforske og diskutere ny teknologi i enestående dybde og bredde. Valget er subjektivt, basert på vårt valg av teknologiene vi mener er viktige og av størst interesse for leserne. godtar ikke markedsføringssikkerhet for publisering og forbeholder seg retten til å redigere alt bidratt innhold. Send alle henvendelser til [email protected].

$config[zx-auto] not found$config[zx-overlay] not found