Hjem Fremadrettet tænkning Supercomputer rangerer stort set uændret, men sidder tæt

Supercomputer rangerer stort set uændret, men sidder tæt

Video: Super Computers बनाने में India, USA-China की तुलना में कहां खड़ा है?| NSM (Oktober 2024)

Video: Super Computers बनाने में India, USA-China की तुलना में कहां खड़ा है?| NSM (Oktober 2024)
Anonim

Den seneste liste over verdens hurtigste supercomputere ændrede ikke meget, men det årlige Supercomputing-show (SC14) indeholdt masser af diskussioner om nye systemer på listen såvel som flere high-performance computing-meddelelser, som nye acceleratorer fra Intel og Nvidia.

Kinas Tianhe-2-supercomputer, der bruger Intel Xeon CPU'er og Xeon Phi-acceleratorer, forblev på førstepladsen på Top500-listen med en maksimal ydelse på 54, 9 petaflops (kvadrillioner flydepunktoperationer pr. Sekund). I år var faktisk de ni øverste systemer identiske med den nyeste øverste tilføjelse på 10. plads - en uspecificeret amerikansk regeringssystemmaskine, der er en Cray CS-Storm drevet af Intel Xeon E5-2660 v2 CPU'er og Nvidia K40 GPU'er, forbundet via Infiniband.

Længere nede på listen var der 78 nye systemer, selvom selv dette er en ny rekordlav. Og samlet set ser det ud til, at vi ser en afmatning i væksthastigheden for den samlede styrke i de 500 systemer.

Rangeringen af ​​disse systemer er baseret på LINPACK-benchmark, selvom der nu er en række bestræbelser på at skabe nye benchmarks, der er rettet mod forskellige slags computere. Jeg fandt det interessant, at Horst Simon, redaktør af Top500-listen, i en tale på showet sagde, at trods målet om at nå en exascale computer - 1 exaflops per sekund (ca. 1.000 petaflops) - i 2020, tror han det sandsynligvis vil tage os indtil udgangen af ​​2024. Dette skyldes delvis, at vi har brug for mere strømbesparende teknikker - såsom siliciumfotonik og 3D-integration og emballering - for at holde den krævede kraft til et exascale system nede på 20 megawatt. Dette er store systemer.

På trods af manglen på store ændringer øverst hørte vi et par nye meddelelser - især dem fra Intel og Nvidia, som kunne pege vejen mod hurtigere maskiner.

Nvidia, hvis GPU'er og CUDA-programmeringssprog virkelig startede bevægelsen mod acceleratorer og coprocessorer inden for high-performance computing, var overalt i showet med masser af systemer. Den tilbyder i øjeblikket K40-acceleratoren og på showet annonceres den næste version, Tesla K80, der bruger en dual-GPU-tilgang til at tilbyde det, firmaet siger, er næsten to gange højere ydeevne og dobbelt hukommelse båndbredde for sin forgænger.

Nvidia siger, at K80 tilbyder 4.992 CUDA-kerner og 24 megabyte RAM og har en topkapacitet på 2.91 teraflops pr. Bord. Det er interessant, at K80 er tilgængelig nu, og at mange af systemfabrikanterne allerede tilbyder systemer med tavlen. For eksempel viste Dell sine nye PowerEdge C4130-servere, som giver dig mulighed for at passe op til fire Nvidia-acceleratorplader (eller Intel Xeon Phi-acceleratorer) på en 1U-server, hvor K80-versionen tilbyder op til 7, 2 teraflops i hver boks. Det er bare en skør mængde computerkraft i et rack (skønt en der ville bruge en masse energi og har brug for meget køling).

I mellemtiden annoncerede Intel, at den næste version af sin Xeon Phi-chip - en version kendt som Knight's Landing, som de første kommercielle systemer skal begynde at sende til næste år - nu har mere end 50 kunder, der planlægger at bruge den nye processorversion af delen (hvor Xeon Phi fungerer som systemprocessor) i nye supercomputere. Mange flere systemer bruger coprocessoren PCIe-kortversion af produktet.

Blandt kunderne til Knights Landing er Trinity-supercomputeren, en fælles indsats mellem Los Alamos og Sandia National Laboratories og Cori-supercomputer, der er annonceret af det amerikanske energiministerium (DOE) National Energy Research Scientific Computing (NERSC) Center. Knight's Landing formodes at kunne tilbyde cirka 3 teraflops ydeevne og vil integrere Intels siliciumfotonikbaserede Omni-Path Fabric-teknologi, som virksomheden sagde ville tilbyde 100 Gbps liniehastighed og op til 56 procent lavere switch-stoffets latenstid end InfiniBand-alternativer. (Bemærk, at InfiniBand-udbyderne nu også taler om nye versioner.)

Intel sagde, at opfølgningen, kendt som Knight's Hill, vil blive bygget ved hjælp af Intels 10nm-processeteknologi og bruge den næste generation af Omni-Path-stoffet. Det vil følge Knights Landing, men den nøjagtige timing blev ikke afsløret.

AMD, der annoncerede og viste sit FirePro S9150 enkelt-CPU-kort, som det siger at kan tilbyde 2, 53 teraflops ydeevne, skal ikke udelades fra ligningen. Dette system, der er programmeret ved hjælp af OpenCL, sendes allerede.

Faktisk er en ny supercomputer kaldet L-CSC fra GSI Helmholtz Center, baseret på S9150 GPU'er og Intel Xeon 2690v2 10-core CPU'er toppet den nye version af Green500-listen, der viser supercomputere i rækkefølge af behandlingsstyrke pr. Watt. Dette markerede første gang et system var i stand til at overgå 5 gigaflops / watt (milliarder af operationer pr. Sekund pr. Watt). Bemærk på denne liste, det andet sted system var Suiren, drevet af PEZY-SC mange-core acceleratorer og Xeon CPU'er; mens resten af ​​top 10 bruger Nvidia Tesla GPU'er, der viser rækkevidden af ​​sådanne systemer.

Der er også andre, mere usædvanlige muligheder. Micron viser sin Automata-chip, i det væsentlige en speciel chip, designet til mønster-matching, til brug i ting som netværkssikkerhed og genomik-søgning. Dette udvikles til et PCIe 3-kort med 32 chips og forventes lanceret i første kvartal 2015, oprindeligt i lave mængder. (Virksomheden står også bag sin Hybrid Memory Cube til næste generations hukommelse til sådanne systemer.) IBM har sin TrueNorth-processor, som den håber peger vejen til mere "hjernelignende computing." NEC arbejder på den næste generation af sin SX-ACE-vektorprocessor, som den siger, er lettere at programmere end GPU'er. Og selvfølgelig forsøger ARM også at komme ind på servermarkedet med, at Applied Micros X-Gene1 bruges som en processor, der opretter forbindelse til forskellige acceleratorkort.

Et antal leverandører viste nye systemer. Ud over det Dell-system, jeg nævnte tidligere, viste Lenovo et vandkølet dual-processor-system baseret på en brugerdefineret Intel Xeon E5-2798A-processor (med 16 kerner, der kører op til 3, 2 GHz), som det siger at leverer 1.083 teraflops. Og det sagde, at næste års Knights Landing Xeon Phi-processor vil muliggøre et "peta-cube" -system, der leverer mere end en petaflop i kun to standard 42U-stativer.

One Stop-servere viste en High Density Compute Accelerator, der bruger PCIe Gen3 til at understøtte op til 16 high-end acceleratorboards fra en enkelt eller flere servere, hvor firmaet siger, at det giver op til 89, 6 teraflops ved hjælp af Tesla K80 boards. Dette kan fungere med IBMs Power8-processor. Huawei viste den amerikanske tilgængelighed af sin X6800 Data Center Server og en væskekølet version af sin FusionServer 9000 bladeserver.

For at forbinde systemer lancerede Obsidian Technologies sit InfiniCortex-initiativ, designet til at tage en 100 Gigabit InfiniBand-forbindelse over lange afstande. Virksomheden annoncerede støtte fra Singapores agentur for videnskab, teknologi og forskning (A * STAR). Og Mellanox viste 100 Gigabit Infiniband, der arbejdede over 100 meter via fiber og 8 meter via kobber.

For at skabe de største supercomputere henvender organisationer sig typisk til virksomheder som IBM og Cray for at sætte systemerne sammen, selvom disse ofte tager år at bygge. Crays største annonce af den slags på udstillingen var et $ 80 millioner dollars-system kendt som Shaheen II på King Abdullah University of Science and Technology i Saudi-Arabien til en Cray XC40, inklusive et Urika-GD-grafisk analyseapparat.

Og selvfølgelig, lige før showet, tildelte DOE IBM (og komponentleverandører Nvidia og Mellanox) en enorm kontrakt for, hvad der ville være de to største supercomputere i landet, hver med mere end 100 petaflops.

Redaktørens note: Dette indlæg blev opdateret den 11/26. Tianhe-2 har en højtydende ydelse på 54, 9 petaflops, ikke teraflops.

Supercomputer rangerer stort set uændret, men sidder tæt