Hjem Fremadrettet tænkning Verdens hurtigste supercomputer nu i Kina

Verdens hurtigste supercomputer nu i Kina

2024

Video: Polestar 1 | SUPER-Volvo er en plugin-hybrid med 1.000 Nm! (Oktober 2024)

Gårsdagens nyhed om, at Kinas Tianhe-2-supercomputer nu er den hurtigste i verden, er ikke så chokerende. Når alt kommer til alt var en tidligere version øverst på listen over computere tilbage i 2010.

Hvad der er lidt mere overraskende er arkitekturen bag Tianhe-2 (også kendt som Mælkevejen-2). Det er baseret på Intels nye Xeon Phi-arkitektur, der kombinerer et stort antal x86-kerner til en enkelt chip; supercomputeren kombinerer derefter disse chips i en enkelt arkitektur. Dette system forventedes ikke at blive implementeret i endnu et par år, så jeg blev overrasket over at se et Xeon Phi-baseret system til at gå på listen. Det, som jeg finder mest fascinerende her, er konkurrencen med systemer, der hovedsagelig er baseret på GPU-computing. Faktisk er et system baseret på Nvidias CUDA GPU-kerner, som toppede listen sidste gang, nu på andenpladsen.

Top500-listen over verdens hurtigste computere kommer typisk ud to gange om året: en gang i forbindelse med den internationale Supercomputing Conference (ISC), der sker nu i Tyskland og igen på Supercomputing Conference (SC 13) i efteråret.

Tianhe-2, der er baseret på National University of Defense Technology i Changsha, Kina, viser vedvarende ydeevne på mere end 33, 8 petaflops (mere end 17.500 billioner flydende punktoperationer i sekundet) og højeste ydelse på 54, 9 petaflops på LINPACK-benchmark. Dette gør det cirka dobbelt så hurtigt som den tidligere leder, Titan-systemet, der er baseret på det amerikanske energiministerium Oak Ridge National Laboratory (ORNL). Tianhe-2 har 16.000 noder, hver med to Intel Xeon E5-2692 (12-core processorer, der bruger Ivy Bridge) -processorer og tre Xeon Phi-processorer til et samlet antal af 3.120.000 computerkerner. Xeon-kernerne er baseret på en kommende 12-core-version af Xeon # 5-2600-familien, baseret på 22nm Ivy Bridge-arkitekturen. Det samlede system trækker 17, 8 MW, det meste af ethvert topsystem på top 500-listen, men fordi ydelsesnumrene er så høje, betragtes det stadig som relativt effektiv. Juni-listen over de mest effektive supercomputere, Green500, skal snart ud.

ORNLs Titan-system, der toppede den forrige liste, er nu på andenpladsen. Dette er baseret på et Cray XK7-system med 18.688 noder, der hver indeholder en 16-core AMD Opteron 6274 og en Nvidia Tesla K20x grafikbehandlingsenhed (GPU) -accelerator. Dette system viser vedvarende ydeevne på 17, 5 petaflops (mere end 17.500 billioner flydende punktoperationer pr. Sekund) og højeste ydelse på over 27 petaflops på LINPACK-benchmark. Sequoia-systemet på Lawrence Livermore National Laboratory, der er baseret på IBMs BlueGene / Q-system og dets Power CPU'er, kom på andenpladsen på Top500-listen for et år siden, men er gået til tredjepladsen. Systemet på fjerdepladsen forbliver "K-computeren" på Japans RIKEN Advanced Institute for Computational Science baseret på Fujitsu SPARC64-processorer.

De fire øverste systemer viser fire meget forskellige arkitekturer. Traditionelle store jernsystemer som dem, der er baseret på IBMs BlueGene (Power) og Fujitsus SPARC-arkitekturer, er stadig meget i gang, men det meste af opmærksomheden går til Intels nye Xeon Phi-arkitektur og Nvidias CUDA-arkitektur. I mellemtiden er der fortsat historier om, at Kina arbejder på at skabe sin egen processor til supercomputing.

Flere detaljer meddelte Nvidia i går, at forskere ved Stanford University bruger GPU'er til at skabe verdens største kunstige neurale netværk designet til at modellere, hvordan den menneskelige hjerne lærer. Det afslørede også, at dens CUDA-værktøjskasse nu vil understøtte ARM-baserede platforme.

Som en del af superdatakonferencen introducerede Intel også nye versioner af sin Xeon Phi-coprocessor-familie, herunder 7100 med 61 kerner, der er klokket til 1, 23 GHz, 16 GB hukommelseskapacitetsstøtte, og over 1, 2TFlops med dobbelt præcisionsydelse; Xeon Phi 3100-familien med 57 kerner uret til 1, 1 GHz og 1TFlops med dobbelt præcisionsydelse; og en ny 5100D, designet så stikkontakter kan fastgøres til et mini-kort til brug i klingeformfaktorer. Intel siger, at den næste generation, kendt som "Knights Landing" og baseret på den kommende 14nm-processteknologi, ikke kun vil fungere som en coprocessor, men også som en primær processor og således fjerne kompleksiteten ved at flytte data til forskellige hukommelsepuljer. Dette integrerer hukommelsen i pakken for at få hurtigere ydeevne.

Intel kalder kombinationen af traditionelle Xeon- og Xeon Phi-processorer "neo-heterogen arkitektur." Hardwarearkitekturen har flere klasser af beregningsmuligheder, der er adgang til ved hjælp af en fælles programmeringsmodel. Virksomheden understreger, at da det hele er x86, der kan strømline udvikling og optimering på måder, der ville være sværere, når man bruger en kombination af CPU'er og GPU-acceleratorer. Nvidia og de andre virksomheder, der presser GPU-beregning, ville være uenige i denne vurdering.

Intel talte også om at bruge high-performance computing ikke kun til traditionelle anvendelser som regerings- og militær forskning og avancerede kommercielle applikationer som olie- og gassimulering, men også til applikationer som big data. Målet er at gøre supercomputing mere mainstream.

Se den komplette Top500-supercomputers liste her.