Programmering

IBMs Power5-prosessor verdt et blikk

Hvis alle ting var like og IBM gjorde systemene sine like tilgjengelige som Dell og Hewlett-Packard gjorde sine, kunne IBM Power5-prosessoren begrave Intels Itanium 2. Først introdusert i fjor sommer, er Power5 en en-to slag, en triumf for ingeniørarbeid fra et selskap som utmerker seg ikke bare innen prosessordesign, men også i submicron-vitenskapen om chip-produksjon og emballasje.

Power5 er selvfølgelig ganske raskt. Men det kan også sees på som IBMs første seriøse forsøk på å møte kundenes behov utover hastighet. Power5 tilbyr forbedret energieffektivitet og fantastisk skalerbarhet, støtter ikke-IBM-operativsystemer (inkludert Linux og Windows), og leverer partisjonering og virtualisering uten sidestykke av dagens Intel-teknologi.

Power5 viser også en ny generasjon av 64-biters, PowerPC-baserte arbeidsstasjoner og servere fra IBMs mangeårige partner i Power, Apple Computer. Og IBM dro nylig et uventet trekk for et selskap bygget på patenter ved å publisere Power-arkitekturen og verktøyene under en åpen lisens.

Det er så mange måter Power5s innflytelse når utover IBMs primære base for velhælte kunder. Selv om IBM også selger Itanium 2-, Opteron- og Xeon-servere, ser det ut til at selskapet tydelig har til hensikt å legge Power5-systemer i hendene på Linux- og Windows-administratorer. Om det er fornuftig vil være opp til kundene, men den rene tekniske muskelen til Power5 og den vaklende formuen til Itanium-arkitekturen krever at IBMs flaggskipsprosessor tar en tur under mikroskopet vårt.

Makthemmeligheter

IBM har konsekvent tiltrukket de lyseste hodene, den typen ingeniører som fortjener monikeren “datavitenskapsmann”. På 1980-tallet kokte disse forskerne opp en prosessorarkitektur som ble bygget for ytelse: IBM 801, den opprinnelige RISC-prosessoren. 801-arven lever videre i IBM Power-serien av prosessorer i bedriftsklasse.

Den største forskjellen mellom en RISC-prosessor og en CISC-prosessor, som Intels x86, kan sees på som en dragkamp mellom programmerere og chipdesignere. CISC-prosessorer er designet for å gjøre applikasjonsutvikleres liv lettere ved å redusere vanlige operasjoner til enkelt, langutførte innfødte instruksjoner, noe som gir CISC et rykte som en langsom, men vennlig design. Sammenlignet med det lyset er RISC rask og uvennlig. Hver av de enkle instruksjonene tjener et veldig smalt formål, kjøres raskt og parallelliserer eksepsjonelt godt. RISC krever tålmodige, begavede programmerere og nøye optimaliserte kompilatorer; RISCs suksess vitner om en overflod av begge deler.

Det mest kjente Power5-attributtet er integrasjonen av to diskrete RISC-kjerner på en enkelt brikke. Kunngjøringer fra AMD, Intel og Sun Microsystems angående kommende multicore-prosessorer fokuserte på dette aspektet av Power5, men multicore var også en funksjon av forgjengerne, Power4 og Power4 +. Ifølge IBM er Power5 fullt kompatibel med Power4-kjørbare filer. Rart med multicore er at det leverer rørdrømmen om mer fart på mindre plass uten en markant økning i varmen. Men som du vil se, er ikke multicore bare SMP på en chip.

For det første deler Power5s kjerner en veldig rask nivå 2-cache. Hastigheten og mengden cache er en faktor i ytelsen til alle mikroprosessorer. (Utviklingen av x86 viser at Intel er helt cache-besatt.) Med enkle instruksjoner som flyr så raskt gjennom en RISC-CPU, blir hurtigbufferens effektivitet i å redusere antall turer til RAM nøkkelen til hele designet.

Power5s nivå 2-hurtigbuffer utgjør bare under 2 MB. Med en delt cache er data hentet av en kjerne umiddelbart tilgjengelig for den andre, noe som øker sannsynligheten for at henting av neste programinstruksjon eller datablokk ikke vil kreve en tur til ytelsesdrepende RAM. Men den delte hurtigbufferen gjør det også mer sannsynlig at kjernene vil prøve å få tilgang til hurtigbufferen samtidig, noe de ikke kan gjøre.

IBM implementerte en stopper for hurtigbuffer-konflikt, og delte nivå 2-hurtigbufferen i tre segmenter. Denne utformingen tillater kvasi-samtidig tilgang til hurtigbuffer så lenge begge kjernene treffer forskjellige hurtigbuffersegmenter. IBM har en annen kreativ løsning på nivå 2-cache-konfliktproblemet: en tung 36MB ekstern nivå 3-cache. Hver kjerne eier eksklusivt nivå 3-cache, så det er ingen mulighet for konflikt mellom kjerner. Selv om nivå 3-cache ikke er så raskt som nivå 2, er nivå 3 mye raskere enn hovedminnet, og Power5s design gjør forbindelsen mellom kjernen og den tilknyttede nivå 3-cachen til en direkte lenke. Vi anser IBMs omarbeiding av nivå 3-hurtigbufferdesign som en av de beste designgevinstene i Power5.

En annen betydelig Power5-gevinst er minnekontrollere på brikken. Hver Power5-kjerne har sin egen kontroller og er i stand til å administrere en dedikert blokk med hovedminne. Dette har en enorm innvirkning på den generelle ytelsen, som vi har sett i å sammenligne for eksempel minnegjennomstrømningen til Opteron og Xeon. Og i Power5s tilfelle passer designet med IBMs strategi om parallellisering i flere nivåer.

To er ikke nok

Power5 er ikke bare dual-core; den implementerer Power4s SMT-anlegg (Simultaneous Multi-Threading), som gir hver kjerne muligheten til å utføre instruksjoner fra to tråder samtidig, under visse forhold. SMT ligner Intels HTT (Hyper-Threading Technology), men med tydelige fordeler som gjør "visse forhold" bredere og som dynamisk optimaliserer parallellisering ved å analysere og prioritere tråder for å gjøre parallell kjøring mer effektiv - mye mer effektiv, tror vi. Selv om det er vanskelig å isolere i testing, bør Power5s implementering utkonkurrere den maksimale 30 prosent boosten som Intel prosjekterer for HTT.

Power5 legger til to grunnleggende, men sårt tiltrengte, trådprioriteringsordninger. Dynamic Resource Balancing prøver å holde instruksjonsstrømmer flytende jevnt ved å analysere oppførselen til tråder og ved å koble en kode som kan redusere en SMT-strøm. For eksempel kan instruksjoner som må utføres i rekkefølge for å få et nøyaktig resultat, låse den tråden i prosessoren en stund. Power5 prøver å forutsi dette og kjører enklere instruksjoner til det er rom for å utføre sekvensen uten å tette SMT.

I en annen fantastisk designgevinst gir Power5s justerbare trådprioritet OSer, drivere og applikasjoner muligheten til å tildele et vilkårlig prioritetsnivå til hver tråd. Denne applikasjonsdefinerte trådprioriteten tas med i beregningene av dynamisk ressursbalansering og brukes bredere for å bestemme hvor lenge en tråd forblir aktiv i CPUen. Det gir også operativsystemer en enkel måte å kontrollere strømsparing på.

Hvis du har mange høyprioriterte tråder i gang, vil boksen gå varm. Men etter hvert som operativsystemet slår trådprioritetene ned, vil CPU-en kjøre flere tomgangssykluser og derfor kjøre kjøligere. Hvis du slår alle trådprioritetene ned til det laveste nivået, går CPU-en i en søvnaktig strømsparingsmodus. Det er den enkleste tilnærmingen til strømstyring vi kan forestille oss.

Til slutt bruker Power5 det de vet om fasilitetene som trengs av hver RISC-instruksjon, for i hovedsak å slå av deler av brikken som ikke er nødvendige for øyeblikket. Dette setter potensielt et nytt spinn på Power's beryktede kraft- og varmeproblemer. Det virker absolutt enklere enn OS-drevne strømstyringsordninger som de som brukes av x86-prosessorer.

Du vil kanskje aldri legge merke til det

Bare på teknologi er Power5 posisjonert til å styre. Men utrolig som det kan virke for de mange Itanium 2-skeptikerne som deler sine meninger med , har flertallet av observatører allerede kalt Itanium 2 / Power5-konkurransen til Intels favør.

Det er en merkelig vurdering fordi IBM i dette tilfellet henter Intel på Intel. RISC eier Unix-markedet, Unix eier mellomstore til high-end-markedet, og Intel gjør ikke RISC. Det er ute i kulden på de mange millioner kjøpsordrene på store jern. Intel er effektivt utelukket med mindre den kan overbevise kjøpere om at Itanium 2 utdaterer RISC. Vil Intel kunne bryte inn? Vi tror det vil ta år for Itanium å skyve RISC til side, og mens det bryter inn, vil Power og Sparc fortsette å utvikle seg.

Det som gjør det vanskelig å ringe er at IBM vil ha Intels marked like mye som Intel vil ha IBMs. IBM selger Power5-servere for $ 5000 med Linux forhåndsinstallert. Gå tilbake og skann spesifikasjonene for å forstå hvorfor en Power5-server på $ 5.000 kan være hyggelig å ha rundt.

Analytikere som etser gravsteiner for Power, bemerker at IBMs chipvirksomhet ikke tjener penger. Men systemvirksomheten er, og nå er de to enhetene én. Det er et smart trekk: Lag sjetonger for systemer du selger; bygge systemer rundt sjetongene du lager. Å slippe design og verktøy til publikum er også smart. Hver åpen lisensinnehaver er en potensiell produksjonskunde, og uhensiktsmessig immateriell eiendom kommer til å strømme inn fra genier som ikke er på IBMs lønn.

Dette er gode strategier for å hygge seg på inngangsmarkedet. Hvis bare IBM ikke måtte håndtere kunder. Big Blue har aldri klart å gi den lave enden av katalogen merkevarepolish og kundetillit som Dell og HP liker i spar. Det store arbeidet IBMs ingeniører har gjort, er inngått av selskapets dårlige markedsføring. Hvis du ikke kjører IBM-utstyr nå, vil du sannsynligvis aldri se på en Power5-server uavhengig av pris.

IBM har med vilje hitchet Power5s suksess til Linux på inngangsnivå. Men det er vanskelig å hente ut merverdi fra programvare som publikum mener at den kan laste ned gratis, og Linux er et operativsystem som kjøpere ikke pleier å kjøpe ny maskinvare for å kjøre. Med andre ord, Linux selger ikke Power5-inngangsservere. Til $ 5000 til $ 6000 er ikke IBMs minst kostbare Power5-server billig nok sammenlignet med en skitten billig Opteron- eller Xeon EM64T-server (Extended Memory 64 Technology) som kjører Linux.

På den annen side selger stort Unix jern seg selv, og kundene vil alltid kjøpe mer av det de allerede bruker. De vil kjøpe det løsningskonsulentene deres anbefaler. IBM overgår alle andre i sin evne til å bruke store kontoer. Du kan ikke lirke en kunde løs fra IBM-maskinvare i mellomtone og oppover. Så den overordnede meldingen på Power5 vil bli forvansket til pressen og publikum generelt, men dressene i feltet omgår IBMs markedsføring. I IBM-til-kunde-forhold kan du ikke slå IBM.

Power5 har omtrent alt: fart, enkelhet, innovasjon, sømløs bakoverkompatibilitet, et modent utviklingsverktøysett og støtte fra en teknologisk gigant. Det er en uovertruffen teknisk prestasjon, skapt av det som kan være verdens smarteste ingeniører. Hvis IBMs markedsføring noen gang samsvarer med intelligens fra teknologien, må du passe deg, Intel.

$config[zx-auto] not found$config[zx-overlay] not found