Hjem Fremadrettet tænkning Supercomputing 15: større ændringer i horisonten

Supercomputing 15: større ændringer i horisonten

Video: 2020 Seminar Series: Intro to Supercomputing (Oktober 2024)

Video: 2020 Seminar Series: Intro to Supercomputing (Oktober 2024)
Anonim

Når jeg ser på meddelelserne og procedurerne fra sidste måneds Supercomputing 15 (SC15) -konference i Austin, ser det ud til, at selvom high-performance computing kan være i en smule afslapning, er det et marked, der er klar til nogle store ændringer i året til komme.

Hvis man ser på lederne på top500-listen, den to gange årlige liste over verdens hurtigste computere, er lederen for sjette gang i træk Tianhe-2, en supercomputer bygget af Kinas National University of Defense Technology. I henhold til top500-listen leverer denne maskine 33, 86 petaflop / s (kvadrillioner beregninger pr. Sekund) vedvarende ydelse på Linpack-benchmark og 54, 9 petaflop / s af teoretisk topydelse. Dette er baseret på Intel Xeon og Xeon Phi processorer.

Andenpladsen fortsætter med at gå til Titan, et Cray XK7-system baseret på AMD Opteron CPU'er og Nvidia K20x GPU'er installeret på DOE's Oak Ridge National Laboratory, kl. 17.59 petaflop / s med vedvarende ydeevne på Linpack benchmark.

To nye maskiner knækkede top 10. Trinity-computeren på Lawrence Livermore National Laboratory (LLNL) er sjette med 8, 1 petaflop / s, mens Hazel-Hen-systemet ved Tysklands Höchstleistungsrechenzentrum Stuttgart (HLRS) kom på ottende med 5, 6 petaflop / s. Begge er Cray XC-maskiner, der er baseret på Intel Xeon-processorer med Aries-forbindelsen.

Større ændringer forekommer længere nede på listen, især med en stor stigning i antallet af kinesiske systemer, der voksede til 109, sammenlignet med kun 37 på den forrige liste. Til dels ser det ud til at være fra flere kinesiske systemer, der kører benchmarks og indsender resultater på listen. Som et resultat faldt antallet af amerikanske systemer fra 231 til 200, hvilket er det laveste antal siden listen blev startet i 1993; og antallet af europæiske systemer faldt fra 141 til 108.

En stor tendens er en stigning i antallet af systemer, der bruger acceleratorer eller coprocessorer, der steg til 104 systemer på den aktuelle liste, op fra 90 i juli. Størstedelen af ​​disse systemer bruger Nvidia Tesla GPU'er, efterfulgt af Intels Xeon Phi-coprocessorer, hvor nogle få bruger en kombination. Nvidia påpegede, at det var i 70 af disse systemer, heraf 23 af de 24 nye systemer på listen.

På udstillingen fremhævede Nvidia væksten af ​​acceleratorer, og især antallet af applikationer, der nu er tilgængelige, optimeret til firmaets CUDA-arkitektur. Virksomheden siger, at 90 procent af de top 10 højtydende computerapplikationer og 70 procent af de top 50 nu er accelereret. En spændende anvendelse er til systemer, der kører vejrsimuleringer, en vigtig applikation til højtydende computing, da vejrprognoser er produceret af alle mulige regeringer. Cray havde tidligere peget på brugen af ​​sådanne acceleratorer på det schweiziske meteorologikontor (MeteoSwiss) og har talt om, hvordan det fungerer med forskere i Schweiz om omskrivning af mange af dens applikationer. Nvidia peger nu på brugen af ​​acceleratorer fra National Oceanic and Atmospheric Administration (NOAA) til nogle af dens vejrprognoser også.

Blandt andre applikationer er Cray spioneret olie og gas applikationer, såsom at bruge 3D geofysik til at simulere et reservoir, samt finansielle tjenester, såsom risikovurdering. Sådanne applikationer udgør sjældent de hurtigste systemer i verden, men er en indikation af, at computere med høj ydeevne tager en bredere rolle i flere forretningsapplikationer. Cray har talt om en konstant progression til at køre større og mere detaljerede modeller på tværs af alle videnskabelige og ingeniørmæssige discipliner og kombinere traditionelle arbejdsmængder med analyser.

Jeg var også interesseret i en meddelelse fra Linux Foundation om en ny indsats kaldet OpenHPC, designet til at skabe mere åbne standarder i HPC-verdenen. Det er en interessant idé, og en der ser ud til at have en masse af de store spillere, der logger på.

Der er en række nye systemer i værkerne. IBM bygger en ny maskine kaldet Summit på Oak Ridge National Laboratories (ORNL) og en anden kaldet Sierra ved Lawrence Livermore National Laboratory (LLNL), begge baseret på IBM Power-arkitektur CPU'er, Nvidia Tesla GPU'er og Mellanox-forbindelser. Topmødet forventes at levere 150 til 300 peak petaflop / s, og Sierra over 100 petaflop / s.

Derudover bygger Intel og Cray en ny maskine kaldet Aurora, baseret på de kommende Knights Hill Intel Xeon Phi-processorer til Argonne Leadership Computing Facility (del af Argonne National Labs), der sigter mod 150 petaflops i 2018. Alle disse er en del af et Department of Energy-program kendt som Collaboration of Oak Ridge, Argonne og Lawrence Livermore nationale laboratorier (CORAL), der sigter mod at fremskynde udviklingen af ​​højtydende computing og specifikt FastForward 2-projektet.

Stadig har vi stadig en lang vej at gå på vej mod "exascale computing."

I mellemtiden var der flere processorannoncer, der kunne bode godt for fremtiden. Nvidia skubbede især brugen af ​​supercomputere til hyperscale webapplikationer, især maskinlæring. Den annoncerede et par lidt lavere produkter: Tesla M40-tavlen med 3072 CUDA-kerner, som den sagde var i stand til at udføre ved op til 7 enkelt-præcision teraflop / s, primært rettet mod "dyb læring" -uddannelse, og M4, et lavere powerboard med 1024 kerner og 2, 2 enkelt-præcision teraflop / s, som kan bruges til dyb indlæring af inferens såvel som ting som billed- og videobehandling. Derudover annoncerede virksomheden en ny "hyperscale suite" med applikationer rettet mod de største computersteder. Begge de nye hardwareprodukter er baseret på 28nm processteknologi og virksomhedens Maxwell-arkitektur.

Virksomheden har annonceret to opfølgningsarkitekturer, kendt som Pascal, der skal forventes næste år, og Volta, der vil følge den. Intel fokuserede på, hvordan HPC påvirker videnskaben, og jeg blev fascineret af dens beskrivelse af, hvordan den bruger sin egen supercomputer - i øjeblikket rangeret 99 på top 500-listen - til at hjælpe med at designe sine egne processorer. Især sagde virksomheden, at den bruger en million CPU-timer bare til at designe fotomaskerne til den næste generations processorer.

Meget af Intels aktivitet var fokuseret på Knights Landing, den næste version af sin Xeon Phi-chip, der kan bruges som en accelerator, men også startes op; og dets Omni-Path-stof. Selvom Intel nu siger, at den generelle tilgængelighed vil være i første halvdel af 2016, har nogle få kunder tidlig adgang til Knights Landing. I øjeblikket tester Cray et stort Knights Landing-system som forberedelse til at levere en ny supercomputer kaldet Cori til National Energy Research Scientific Computing Center (NERSC) og Los Alamos National Laboratory og Sandia National Laboratories næste år. Bull, en enhed med den franske systemintegrator Atos, har også modtaget tidlige versioner af Knights Landing for at forberede Tera 1000-systemet, det bygger til den franske kommission for alternative energier og atomenergi. Argonne Leadership Computing Facility arbejder på et system kaldet Theta, der skal leveres næste år, og Sandia National Laboratories arbejder med Penguin Computing for at opgradere flere systemer, der bruger tidligere generationer af Xeon Phi-co-processorer.

Intel har tidligere sagt, at der vil være tre forskellige versioner af Knights Landing: en basislinie-hostprocessor (i stand til selvstart), en værtprocessor med et integreret Omni-Path-stof og et PCIe-acceleratorkort. Selve chippen vil bestå af 36 fliser hver med to CPU-kerner (i alt 72 kerner), fire vektorbehandlingsenheder (to pr. Kerne), 1 MB delt L2-cache og et cache-middel til at opretholde sammenhæng; og Intel har sagt, at det skal levere cirka tre gange den skalære ydeevne for Knights Corner-CPU'en med 3 teraflop / s dobbelt præcision og 6 teraflop / s-præcisionstop ydelse. Det bruger også et nyt hukommelsessystem kaldet MCDRAM, pakkehukommelse med over 3 gange den tilgængelige båndbredde sammenlignet med at gå ud til DDR4, der ser ud til at være en variant på Hybrid Memory Cube-arkitekturen, som Intel og Micron har talt om det. På udstillingen havde Cray et prototypesystem med en startbar Knights Landing, og en række andre leverandører viste systemer designet til Knights Landing. Denne version af Xeon Phi er beregnet til at blive efterfulgt af en version kaldet Knights Hill, som skal bygges på den kommende 10nm-proces.

Derudover talte Fujitsu lidt mere om sit Flagship 2020-projekt, baseret på en ny chip kaldet FX100 med 32 kerner. Dette forventes at grovt fordobles flydepunktsydelse i forhold til den nuværende FX10, og ligesom Knights Landing vil Fujitsus FX100 også bruge en version af Hybrid Memory Cube-arkitekturen. Derudover har NEC et projekt kodenavnet Aurora (ikke relateret til CORAL-projektet), baseret på dets opfølgning til SX-ACE-chip, men med større hukommelsesbåndbredde. Dette er målrettet for 2017.

Supercomputing 15: større ændringer i horisonten