Hjem Fremadrettet tænkning Intel ser en udvidende rolle for fpgas, heterogen computing

Intel ser en udvidende rolle for fpgas, heterogen computing

Video: Introduction to Intel® FPGA Programmable Acceleration Card N3000 (Oktober 2024)

Video: Introduction to Intel® FPGA Programmable Acceleration Card N3000 (Oktober 2024)
Anonim

Meget af den interessante processor-diskussion har for nylig drejet sig om at bruge forskellige slags chips og kerner i modsætning til de almindelige computerkerner, der er almindelige i konventionelle CPU'er. Vi har set alle mulige forskellige kombinationer af chips, der bruges til bestemte computeropgaver, herunder CPU'er, GPU'er, DSP'er, brugerdefinerede ASICS og feltprogrammerbare gate arrays (FPGs), og i stigende grad ser vi applikationer, der kombinerer aspekter af alle disse, undertiden i et system og nogle gange i en enkelt chip.

Selv Intel - længe tilhænger af almindelige beregningskerner, der fordoblet hastighed hvert par år - er kommet i gang med sit køb af Altera, en af ​​de førende FPGA-producenter. For nylig havde jeg en mulighed for at tale med Dan McNamara, daglig leder for Intels Programmable Solutions Group (PSG) - hvad der engang var kendt som Altera - som kaster lys over Intels planer på dette område og gav mere detaljeret information om virksomhedens planer for tilslutning forskellige slags kerner og forskellige dør sammen i højhastighedschippakker.

"Verden går heterogen, " sagde McNamara og bemærkede, at der nu er en fælles erkendelse af, at du ikke kan løse alle problemer med kerner til almindelig brug. Tilpassede ASIC'er - såsom Googles Tensorbehandlingsenheder eller TPU'er kan accelerere visse typer funktioner langt ud over traditionelle CPUS eller GPU'er, men disse tager lang tid at oprette. I modsætning hertil sagde han, at FPGA'er giver mulighed for tilpassbar kode, der giver meget af ydeevne fordele ved ASIC'er uden at vente to år på chipdesign og fremstilling. En udvikler kan straks ændre algoritmer inden for en FPGA, mens en CPU, GPU eller brugerdefineret chip fungerer på en fast måde.

McNamara sagde også, at FPGA'er er meget lav-latency og kan være meget parallelle, hvor forskellige dele af en chip fungerer samtidig med applikationer som billedbehandling eller kommunikation.

Intel sender nu Arria 10 FPGA, der er fremstillet på TSMCs 20nm-proces, og tilbyder en pakke, der kombinerer en Xeon (Broadwell) processor og Arria 10. Dette er i brug i applikationer som webskala-søgning og analyse. McNamara sagde, at FPGA'er kunne fremskynde søgningen med op til 10 gange og bemærkede, at Microsoft har været offentligt om at bruge sådanne FPGA'er til at fremskynde søgningen.

Et stort forbedringsområde for nylig har været at skabe hurtigere multi-chip-pakker, der kan kombinere chip-dyse oprettet på forskellige processer og måske fra forskellige producenter. Disse inkluderer pakker, der indeholder en CPU og en FPGA, såsom Xeon / Arria-kombinationen; en FPGA med forskellige transceivere som i Intels Stratix 10 FPGA; eller endda forskellige dele af en fuld CPU, som Intel beskrev i sin nylige teknologi og produktionsdag.

Intel har oprettet en ny teknologi kaldet embedded multi-chip interconnect bridge (EMIB) for at gøre dette, som debuterede i Stratix 10. I EMIB oprettes kernedysen på Intels 14nm-proces og transceiverne på TSMC's 16nm-proces.

Samlet set sagde McNamara, at flere områder bevæger sig mod at vedtage flere FPGA'er ved hjælp af sådan emballage. Han talte om hyper-skala-websteder, der ser efterspørgsel ændre sig hurtigt, og hvor en FPGA / CPU-kombination kan fungere godt inden for områder som søgning, analyse og videostreaming, såvel som netværkstransformation, hvor tendenser som softwaredefineret netværk og virtualiseringsnetværksfunktioner skaber behov for mere pakkebehandling. Andre fokusområder inkluderer 5G og trådløse applikationer, autonom kørsel og kunstig intelligens (AI) applikationer. I AI sagde McNamara, at optimerede ASIC'er og rå computerkraft meget vel kan være bedst til træning (Intel har købt Nervana), men at FPGA'erne ofte er bedst til inferens på grund af deres fleksibilitet og lave latenstid, og bemærkede, at ZTE brugte Arria 10s til viser meget imponerende score for billedgenkendelse.

Personligt er jeg nysgerrig efter at se, om fremtidige CPU'er virkelig vil tage forskellige komponenter og blande og matche dem ved hjælp af EMIB eller en lignende teknologi for at ændre det, vi synes om som en processorchip. Jeg er fascineret af tanken om, at fremtidens systemer kan bruge masser af forskellige kerner - nogle programmerbare (FPGA) og nogle faste (en blanding af både brugerdefinerede ASIC'er og traditionelle CPU'er og GPU'er) til at gøre ting sammen, der forbedrer hvad en enkelt teknologi kan gøre på egen hånd.

Intel ser en udvidende rolle for fpgas, heterogen computing