Hjem Fremadrettet tænkning Supercomputing 17 indeholder nogle overraskelser, antydninger til fremtiden

Supercomputing 17 indeholder nogle overraskelser, antydninger til fremtiden

Video: Introducing the NYU Greene Supercomputer, One of the Fastest in Higher Ed (Oktober 2024)

Video: Introducing the NYU Greene Supercomputer, One of the Fastest in Higher Ed (Oktober 2024)
Anonim

Der var et par overraskelser på denne måneds Supercomputing 17-konference, herunder en meget god visning til PEZY-SC2-acceleratoren, såvel som Intels retningskift for sin Xeon Phi-linje. Derudover så vi også de første systemer bygget på Intels Xeon skalerbare processor (Skylake) og de første til at indeholde Nvidias Volta-accelerator.

Men måske mest bemærkelsesværdigt er nyheden om, at kinesiske systemer nu tegner sig for 202 af de 500 supercomputere på den nyeste Top 500-liste sammenlignet med kun 143 fra USA. Amerikanske systemer har domineret listen siden starten for 25 år siden, og for kun få måneder siden havde USA 169 systemer til Kinas 160. Det samme er tilfældet, når det gælder samlet ydelse, hvor de kinesiske systemer tilsammen tegner sig for 35, 4 procent af den samlede ydelse af Top 500-systemerne.

De hurtigste computere i verden er fortsat de to massive kinesiske maskiner, der har toppet listen i flere år nu: Sunway TaihuLight, fra Kinas National Supercomputing Center i Wuxi, med vedvarende Linpack-ydelse på mere end 93 petaflops (93 tusind billioner flydende point operationer pr. sekund) og Tianhe-2 fra Kinas National Super Computer Center i Guangzhou med vedvarende ydelse på mere end 33, 8 petaflops. Disse forbliver de hurtigste maskiner og med en enorm margin. Piz Daint-systemet fra Swiss National Supercomputing Center, et Cray-system, der bruger Intel Xeons og Nvidia Tesla P100s, blev en tredjeplads med Linpack vedvarende ydelse på 19, 6 petaflops.

Den største ændring øverst er et nyt system på fjerde sted: en opgraderet version af Gyoukou-supercomputeren, et ZettaScaler-2.2-system, der er installeret på Japans Agentur for Marine-Earth Science and Technology. Denne maskine bruger PEZY-SC2-acceleratorer, en anden generation af 2048-kernechip, der giver en maksimal ydelse på 4.096 teraflops i dobbeltpræcision såvel som konventionelle Intel Xeon-processorer, i alt 19.860.000 kerner. (En tidligere ZettaScaler-maskine med PEZY-SC2 lavede listen på et lavere niveau i juni-versionen). Det giver det det højeste antal kerner, der bruges sammen - også kendt som det højeste niveau af samtidighed - der hidtil er set, og overgår TaihuLight, som har 10, 6 millioner kerner. Gyoukou-maskinen opnåede en Linpack-vedvarende ydelse på 19, 14 petaflops, men det interessante er, at den bruger 1, 35 megawatt effekt, sammenlignet med 2, 27 megawatt for PizDaint, 17, 8 megawatt for Tinahe-2 og 15, 4 megawatt for Taihulight. Det er stadig meget magt, men det er en stor reduktion sammenlignet med de andre systemer og en stærk indikation af, at strømproblemer er vigtige, selv for de hurtigste maskiner i verden. Det er også værd at bemærke, at dette viser, hvordan nye arkitekturer kan reducere strømtrækningen dramatisk.

Det øverste amerikanske system forbliver Titan-supercomputeren på Oak Ridge National Laboratory, et fem år gammelt system, der bruger Nvidia K20x GPU-acceleratorer og leverer 17, 59 petaflops, som nu er på femte plads på listen.

På den seneste Green 500-liste over de mest energieffektive supercomputere gik fire af de fem øverste slots - inklusive de tre bedste - til nyligt installerede japanske systemer, alle baseret på ZettaScaler-2.2-arkitekturen og PEZY-SC2-acceleratoren. Den mest effektive af disse er Shoubu System B, der er installeret i RIKENs Advanced Center for Computing og Kommunikation. Shoubu System B opnåede 17, 0 gigaflops / watt; Shoubu System B og de næste to systemer, der bruger henholdsvis 16, 8 og 16, 7 gigaflops / watt, er alle i den nederste halvdel af Top 500-listen. Det femte system på den grønne placering er Gyoukou-systemet nævnt ovenfor - nummer fire-systemet på Top 500-listen ved 14, 2 gigaflops / watt.

Dette er store gennembrud for PEZY-SC2-acceleratoren og kan pege på fremtidige retninger for supercomputing-arkitekturer.

Den fjerde grøneste supercomputer er Nvidias interne DGX SaturnV Volta-system, der opnåede 15, 1 gigaflops / watt og kommer ind på 149 på Top 500-listen. Dette system har 22.440 Volta-kerner (som ser ud til at tælles på en noget anden måde på listen end nogle af de andre kerner.) Nvidia har haft et meget godt år til sin accelerator, og har store forhåbninger om flere maskiner, der bruger Volta GPU-arkitektur.

Som sædvanligt var de store leverandører med til at krage om deres succeser på listen, med Intel som bemærkede, at dens CPU'er var i seks af de ti bedste systemer og et rekordhøjt niveau på 471 ud af 500 systemer. Intel bemærkede også, at dets nye Xeon skalerbare processorer var i 18 supercomputere med over 25 petaflops ydeevne. Men hvad der kan være mere bemærkelsesværdigt er, at Intel sagde, at det annullerer Knights Hill, den planlagte 10nm efterfølger af 14nm Knights Landing Xeon Phi-processor. Selskabet sagde, at det nu planlægger en ny platform til exascale-systemer (1.000 petaflops) inden 2021, men afslørede ingen detaljer.

Nvidia understregede, at det havde 34 nye systemer med sine acceleratorer på listen, hvilket bragte virksomhedens samlede antal til 87. Nvidia og partner IBM var ved at bryde sig om muligheden for, at den næste liste skal komme i juni, Summit-maskinen på Oak Ridge National Laboratory (ORNL) skal være blandt maskinerne øverst på listen. Denne maskine har 4600 noder, hver med to IBM Power 9-base-CPU'er og 6 Nvidia Volta-acceleratorer, med en forventet ydelse på omkring 200 petaflops. Dette adskiller sig fra Nvidias interne løsning, idet CPU'er og GPU'er alle kommunikerer via NVLink 2.0 på en cache-sammenhængende måde ved hjælp af OpenCAPI, så GPU'erne kan få direkte adgang til hovedsystem RAM. Topmødet følges af Sierra-maskinen på Lawrence Livermore National Laboratory og af AI Bridging Cloud Infrastructure (ABCI) -maskine i Japan.

Jeg var interesseret i at høre Cray annoncere en "produktionsklar" supercomputer baseret på Cavium ThunderX2-processor på 64-bit Armv8-A-arkitekturen, nu tilgængelig som en del af sin XC50 supercomputer. ARM-baserede maskiner testes i Barcelona Supercomputer Center (hvis Mare Nostrum-maskine nu ligger på nummer 16 på Top 500-listen) såvel som "Post-K" supercomputeren i Japan og Isambard supercomputer i England. Cavium havde nogle tidlige benchmarks på ThunderX2, som viste, at 14nm-chip fungerer bedre på multetrådede eller hukommelsesbundne applikationer end Intels Skylake Xeons, skønt Intel er fortsat førende inden for enkelttrådede og i rå teraflops. Bemærk, at ud over Cavium-designet har Qualcomm også annonceret en ARM-baseret serverchip kaldet Centriq.

I andre processor-nyheder annoncerede AMD, at den havde forhindret produktion af sine Epyc-processorer, skønt disse endnu ikke er i nogen Top 500-systemer, mens NEC annoncerede versioner af sit Vector Engine PCIe-acceleratorkort til sin nye SX-Aurora TSUBASA supercomputer-serie, som har en særlig hurtig hukommelsesbåndbredde.

På sammenkoblingssiden sagde Mellanox, at 77 procent af de nye systemer på Top 500-listen bruger InfiniBand, mens Intel fremhævede de seneste succeser med sin Omni-Path-arkitektur, der mest bruges i sine Xeon Scalable Processor (Skylake) -systemer. I mellemtiden ser en række leverandører hen til Gen-Z, designet til at være en mindre latens, hukommelsescentreret tilgang til meget højhastighedsforbindelser mellem computere og hukommelse / lagerenheder.

Det er også interessant at bemærke, at alle maskinerne på Top 500 nu for første gang kører Linux.

Mellem det stærke førsteindtryk fra PEZY-SC2, Intels beslutning om at dumpe Knights Mill for en ny arkitektur, Nvidias Volta og ny konkurrence fra AMD, ARM-leverandører og NEC, er nu en spændende tid i supercomputingens verden. Næste års lister skulle være ret interessante, da vi ser, hvilke arkitekturer der virkelig udfører, og hvilke der er mest effektive, da mange af sælgere og supercomputersites prøver at placere sig i løbet om at fremstille en exascale (1000 petaflop) computer med en sub -20 megawatt effekttrækning.

Er du nysgerrig efter din bredbåndsinternethastighed? Test det nu!

Supercomputing 17 indeholder nogle overraskelser, antydninger til fremtiden