Programmering

Datanett i minnet vs. databaser i minnet

Adopsjonen av databehandling i minnet fortsetter å akselerere. Modne løsninger gjør det mulig for organisasjoner å oppnå databehandlingshastigheten og -skalaen de trenger for deres digitale transformasjon og omnichannel kundeopplevelsesinitiativer. For eksempel brukte verdipapirforetaket Wellington Management en databehandlingsplattform i minnet for å akselerere og skalere sin investeringsbok (IBOR), den eneste sannhetskilden for investorposisjoner, eksponering, verdsettelser og ytelse. Alle handelstransaksjoner i sanntid, all relatert kontoaktivitet, tredjepartsdata som markedskurser og all relatert backoffice-aktivitet flyter gjennom IBOR i sanntid. IBOR støtter også ytelsesanalyse, risikovurderinger, overholdelse av regelverk og mer. I forskjellige tester utførte den nye plattformen minst ti ganger raskere enn selskapets eldre system bygget direkte på en Oracle relasjonsdatabase.

Nikita Ivanov er CTO i GridGain Systems, som utvikler dataløsninger i minnet.

Gartner spår at innen 2019 vil 75 prosent av cloud-native applikasjonsutvikling bruke databehandling i minnet eller tjenester som bruker in-memory-databehandling, for å gjøre det mulig for vanlige utviklere å implementere høyytelses, massivt skalerbare applikasjoner. Imidlertid må utviklere som er nye innen databehandlingsteknologi i minnet, utvikle en forståelse av de forskjellige strategiene for å legge teknologien til arkitekturen. I de fleste tilfeller er den første avgjørelsen de trenger å ta om de skal distribuere et datarutenett i minnet eller en database i minnet. Denne beslutningen vil først og fremst være basert på om de har til hensikt å akselerere eksisterende applikasjoner, planlegger å utvikle nye applikasjoner eller fullstendig omarkitektur eksisterende eller ser en mulighet til å gjøre begge deler. De må også vurdere hvilket lag som vil fungere som registreringssystemet, datalaget i minnet eller det underliggende datalaget.

La oss utforske databehandlingsteknologi i minnet som trengs for å implementere disse strategiene.

Datanett i minnet

Et datarutenett i minnet (IMDG) kopierer diskbaserte data fra RDBMS-, NoSQL- eller Hadoop-databaser til RAM, der behandlingen foregår uten forsinkelser forårsaket av kontinuerlig disklesing og skriving. Settes inn mellom applikasjonen og datalagene, er datarutenettet i minnet distribuert på en klynge med servernoder og deler tilgjengelig minne og CPU i klyngen. Enten distribuert i et offentlig eller privat skymiljø, lokalt eller i et hybridmiljø, kan et datarutenett i minnet skaleres bare ved å legge til en ny node i klyngen. Noen datanett i minnet kan støtte ANSI-99 SQL- og ACID-transaksjoner, avansert sikkerhet, maskinlæring og integrerte integrasjoner fra Spark, Cassandra og Hadoop.

Et datanett i minnet er en enkel og kostnadseffektiv løsning for eksisterende applikasjoner. Imidlertid krever mange datanettverk i minnet at alle dataene i den underliggende diskbaserte databasen passer inn i minnet, og krever at en bedrift kjøper nok minne til å oppbevare alle dataene. Siden minne fremdeles er dyrere enn disk, kan det hende at mange selskaper foretrekker å ha noen data bare på disken. Nye minnesentriske arkitekturer løser dette ved å behandle mot hele datasettet, selv om noen av dataene er lagret på disken. Denne "vedvarende butikk" -funksjonen gjør at datamengden kan overstige minnemengden. Dette betyr at data kan optimaliseres slik at alle data ligger på disken, men oftere brukte data også ligger i minnet, mens sjeldent brukte data ligger kun på disken. En annen viktig fordel er at etter en omstart kan et system med en vedvarende butikk begynne å behandle umiddelbart mot datasettet på disken uten å vente på at datasettet skal lastes inn i minnet.

Workday, en finansiell og HR SaaS-løsningsleverandør som betjener Fortune 50-selskaper, relaterte hvordan den bruker et datanett i minnet til å behandle omtrent 189 millioner transaksjoner per dag, og toppet på rundt 289 millioner per dag. Til sammenligning håndterer Twitter omtrent 500 millioner tweets per dag.

Dataminne i minnet

En in-memory database (IMDB) er best egnet for nye eller re-arkitekterte applikasjoner. Det er en frittstående, frittstående database som kjører i minnet som støtter databehandlings-API-er som ANSI-99 SQL, nøkkelverdi, beregning og maskinlæring. Fordelen med en in-memory database over et in-memory data grid er at arkitekturen er redusert fra tre lag (applikasjon, in-memory og data) til to. Ulempen er at den ikke kan brukes til en eksisterende applikasjon uten løft og forskyvning av datasettet fra den eksisterende databasen. Videre, fordi en database i minnet fungerer som registreringssystem, må løsningen inneholde en strategi for å beskytte dataene i tilfelle nedetid. Denne strategien kan være lik den vedvarende lagringsfunksjonen som er diskutert for datanett i minnet, eller det kan innebære bruk av ikke-flyktig RAM, en ny teknologi som sannsynligvis vil spille en stadig mer fremtredende rolle i fremtiden.

I dag bruker en storbank med 135 millioner kunder en minnedatabase med en vedvarende butikkfunksjon for å utvikle en nettstørrelsesarkitektur som kan håndtere opptil 1,5 MB data sammen med det nødvendige transaksjonsvolumet. Denne løsningen fungerer som registreringssystem og sitter ikke oppå en eksisterende datalager.

Datamaskinplattformer i minnet

Organisasjoner som utvikler en langsiktig strategi som innebærer å akselerere eksisterende applikasjoner og utrulling av nye, kan velge en databehandlingsplattform i minnet som kombinerer skalerbarheten til en IMDG med de fullstendige relasjonsdatabaseegenskapene til en IMDB. Datamaskinplattformen i minnet kan derfor brukes til å akselerere eksisterende applikasjoner eller være grunnlaget for opprettelsen av nye eller undersøkte applikasjoner som kan dra nytte av distribuert databehandling og en vedvarende butikk.

I tillegg til å bestemme hvilken teknologi som best tilfredsstiller deres behov, bør organisasjoner vurdere om de trenger ytterligere støtte i minneteknologier, for eksempel:

  • En streaming-analysemotor for å håndtere all kompleksiteten rundt dataflyt og prosessering av hendelser.
  • Et dyp-læringsdrevet rammeverk for kontinuerlig læring som skal tjene som en byggestein for det Gartner refererer til som HTAP (hybrid transaksjonell / analytisk prosessering); det vil si evnen til å anvende maskinlæring eller dyplæringsanalyse på driftsdata i sanntid.

Datamaskinteknologi i minnet brukes av ledende digitale bedrifter nå og vil bli enda mer brukt i fremtiden. Jo raskere du utvikler en solid forståelse av distribusjonsstrategiene og funksjonene til in-memory computing, jo raskere vil du kunne hjelpe organisasjonen din med å oppnå konkurransefortrinnet den trenger.

$config[zx-auto] not found$config[zx-overlay] not found