Hjem Fremadrettet tænkning Amd og Intel åbner grafik foran i processorkamp

Amd og Intel åbner grafik foran i processorkamp

Video: AMD vs Intel in 2020 (Oktober 2024)

Video: AMD vs Intel in 2020 (Oktober 2024)
Anonim

I en række nylige meddelelser har Intel og AMD separat afsløret flere vigtige ændringer i arkitekturerne for deres x86-processorer, som lover at omdanne den måde, hvorpå x86-processorer vil blive brugt i de næste par år.

Sidste uge annoncerede AMD en ny hukommelsesarkitektur med det formål at bringe CPU og GPU computing tættere sammen. Intel afslørede en ny vægt på at forbedre sin position i mere traditionel pc-grafik. I går annoncerede Intel en helt ny version af mikroarkitekturen til sin Atom-serie af processorer, en der skulle gøre disse chips meget mere magtfulde og potentielt lukke kløften mellem Atom og virksomhedens mere almindelige Core-processorfamilie.

AMDs nye hukommelsesarkitektur

AMDs meddelelse om, hvad det kalder heterogen Uniform Memory Access (hUMA), var ikke en stor overraskelse, da virksomheden har talt om Heterogene Systems Architecture (HSA) i lang tid.

Konceptet er temmelig enkelt. Selv i en chip, der har både CPU'en og grafikbehandlingen (GPU) på samme dyse, som i AMDs accelererede behandlingsenheder (APU'er), er hukommelsen, der bruges af CPU'en og grafikken, forblevet i separate puljer. Mens der fysisk er den samme hukommelse, bruger CPU'en og GPU forskellige pegepunkter til hukommelsen. For at bruge GPU'en til computing skal et program kopiere dataene fra den del af hukommelsen, der bruges af CPU'en, til den del, der bruges af grafikken, udføre beregningen og kopiere dem igen. Alt dette tager tid. Med et ægte samlet hukommelsessystem, der inkluderer grafik, er dette ikke nødvendigt.

AMD skubber på dette som en del af HSA Foundation, der inkluderer ARM, Qualcomm, Samsung, Texas Instruments, MediaTek og Imagination. Især bruger denne fremgangsmåde en softwaredrifttid kendt som HSAIL og et sæt grænseflader til HSA-accelererede applikationer.

Denne uge detaljerede AMD, hvordan CPU'en og GPU'en i sin hUMA-arkitektur dynamisk kan allokere hukommelse fra hele hukommelsesområdet og bruge dette sammen med det samme virtuelle adresseringsskema. Hukommelsen vil være tovejs sammenhængende, så enhver opdatering til hukommelse foretaget af CPU'en eller GPU'en ses af de andre behandlingselementer. GPU'en understøtter nu oversigtshukommelse med virtuelle sider, så den kan fungere med større datasæt (den måde, CPU'er i øjeblikket fungerer). Tanken er, at CPU og GPU kan arbejde mere effektivt. AMD sagde, at udviklere vil være i stand til at skrive HSA-accelererede applikationer ved hjælp af standard programmeringssprog som Python, C ++ og Java.

AMD er ikke det eneste firma, der betragter heterogen databehandling som vigtig, og HSA Foundation har også sine konkurrenter. Nvidia har været en stor talsmand for, hvad det plejede at kalde GP-GPU, skubbe på sine CUDA API'er og lovede, at en fremtidig version af dens grafikprocessorer understøtter en samlet hukommelse. Flere af de store softwareplatforme har deres egne alternativer: Microsofts DirectCompute-udvidelser til DirectX til GP-GPU computing og Googles Renderscript API til heterogen computing. Det vigtigste er måske, at Khronos Group, et industrikonsortium, fremmer OpenCL-standarden.

Det store spørgsmål vil være, hvilken af ​​disse standarder der vil tiltrække udviklere. AMDs første processor, der understøtter hUMA, vil være dens Kaveri-processor, der er beregnet til at blive sendt i slutningen af ​​2013 (dog sandsynligvis ikke i systemer før i begyndelsen af ​​næste år). AMD leverer også APU'en til PlayStation 4 og rygter i vid udstrækning at levere APU'en til den næste generation af Xbox også. Det lyder sandsynligt, at andre medlemmer af HSA Foundation også kunne bruge hUMA-arkitektur, skønt ingen endnu har meddelt nogen sådan design. Sammen kan dette være nok til at skabe kritisk masse for udviklere og for værktøjer, og i bekræftende fald kan dette vise sig at være meget vigtigt.

Intel fordobler grafik til Haswell

Sent i sidste uge afslørede Intel flere detaljer om sin kommende 4. Generation Core-processor, et 22nm produkt kendt som Haswell. Intel havde tidligere afsløret et antal nye funktioner til Haswell, herunder nye AVX2-instruktioner til arbejde med større heltalvektorer og fused multiply-add (FMA) instruktioner til flydende punkt. Dette er ting, som slutbrugere sandsynligvis ikke vil se, undtagen med hensyn til forbedret ydelse i temmelig specialiserede arbejdsbelastninger.

Det, der er mest interessant ved den nye meddelelse, er fokuset på grafik, et område, hvor konkurrenterne AMD og Nvidia helt sikkert har haft føringen.

Men Intel tager nogle store skridt med Haswell-processorer. Intel har længe sagt, at det vil tilføje mere grafik til dyse for nogle modeller af Haswell, herunder en avanceret version kendt som GT3. Effektivt er dette kun yderligere grafikinstruktionsenheder over mængderne i de nuværende Ivy Bridge-processorer. I sig selv er dette en stor ændring, da Intel i sine produkter typisk har afsat mere die-plads til CPU-plads, mens AMDs konkurrerende APU'er har afsat mere die-plads til grafik.

Men Intel viste for nylig en anden variant, hvad det kalder GT3e-grafik, som tilføjer en anden dyse med 128 MB indlejret DRAM til den pakke, der indeholder Haswell-matricen, og er designet til at fremskynde grafikydelsen. I sidste uge annoncerede Intel, at versioner med højere hastighed af GT3-grafikken nu kaldes Iris, og de med den indlejrede DRAM vil blive kaldt Iris Pro, da Intel håber at få en branding-fordel af de nye niveauer af grafik.

Især er Haswell-linjen segmenteret med versioner med en lille mængde grafik (GT1) kaldet HD Graphics; med GT2-grafik (svarende til high-end af Ivy Bridge-linjen) kaldet HD Graphics 4200 til 4600, afhængigt af hastighed; med GT3-grafik, men kører med 15 watt kaldet HD Graphics 5000; disse dele med GT3-grafik, der kører ved 28 watt og derover, kaldes nu Intel Iris Graphics 5100; og dem med GT3e-grafik og indlejret grafik kaldet Iris Pro 5200. (Intel har aldrig været en til at navngive enkelhed.)

Intels delnumre forbliver komplicerede, men bemærk, at et delnummer, der starter med 4, angiver Haswell, mens et, der starter med en 3, angiver Ivy Bridge. Virksomheden bruger MQ til at indikere standard GT3 bærbare dele og HQ for at indikere dele, der har den indlejrede DRAM.

Som en del af meddelelsen delte Intel ydelsesnumre for de nye dele og viser betydelige ydeevneforbedringer sammenlignet med virksomhedens eksisterende processorer. Intel viste tal, der antydede Ultrabook-ydeevne på op til 1, 5 gange den foregående generation på omtrent det samme strømforbrug (og dobbelt så stor ydeevne med en chip med højere watt, der er rettet mod lidt større notebooks, dem med 14-in og større skærme), dobbelt så stor ydeevne på traditionelle bærbare computere og næsten tre gange ydelsen på desktop-systemer.

Intel siger, at den nye Iris og Iris Pro-grafik kan sammenlignes med diskrete GPU'er, og det er en stor aftale. (Som altid tager jeg alle ydelsesnumre med et saltkorn, indtil jeg faktisk kan teste produkterne.) Jeg er sikker på, at der stadig vil være meget højere ydelse af diskrete desktop grafikdele fra AMD og Nvidia til spil- og arbejdsstationsapplikationer, men typisk bruger disse dele meget strøm. I bærbare computere i fuld størrelse, hvor strømkonvolutten er meget mindre, er grafik på-die-vigtigere vigtigere, men der har stadig været et stort marked for diskret grafik. Intel ser ud til at målrette mod dette marked. Ultrabooks og andre tynde notebooks har typisk ikke haft strømkravet til at køre diskret grafik, så forbedret on-die-grafik er bestemt velkommen.

Intels nye Atom-mikroarkitektur

Men i mange henseender betragtede den største meddelelse fra Intel sin arkitektur med lav effekt, som er bestemt til at erstatte den arkitektur, der blev brugt i virksomhedens nuværende Atom-arkitektur. Atom-familien er for det meste kendt for at blive brugt i mobile enheder, såsom tablets og i mindre grad et par smarte telefoner. Den nye arkitektur, der er kendt som Silvermont, er også rettet mod en række forskellige datacentre og indlejrede markeder.

Arkitekturen repræsenterer en stor ændring. I stedet for den i rækkefølge eksekveringsmotor, der blev brugt i tidligere versioner af Atom-arkitekturen, inklusive Saltwell-arkitekturen, der blev brugt på firmaets nuværende 32nm Atom-versioner, tilføjer Silvermont en out-of-order eksekveringsmotor, som den bruges i Intels Core- og Xeon-processorer. Dette skulle forbedre enkeltrådede applikationsbehandling markant. Det tilbyder en ny systemstofarkitektur, designet til at skalere op til otte kerner (mest sandsynligt til applikationer såsom mikroservere). Endelig tilføjer den nye instruktioner (for at gøre det på niveau med dem, der bruges i Westmere-versionen af ​​Core-processorer), og nye sikkerheds- og virtualiseringsteknologier.

Den nye arkitektur har et modulopbygget design baseret på moduler, der indeholder to kerner, 1 MB delt L2-cache (meget lav latenstid, høj båndbredde) og en dedikeret punkt-til-punkt-grænseflade til SoC-stoffet. Bemærk, at dette erstatter konceptet med multi-threading, som Intel har stærkt fremmet, og faktisk lyder lidt som AMDs modulære tilgang, der bruges i dets nuværende desktop- og serverchips. (Intel gik imidlertid ud af sin måde at forklare, at det ikke var den samme ting; AMDs moduler deler flere ting, inklusive flydende punkt.) Modulerne kan kombineres til at omfatte op til otte kerner.

Til strømforbrug siger Intel, at den nye arkitektur tillader et bredere dynamisk effektområde og tillader hver kerne sin egen uafhængige frekvens og strømstyring, hvilket således lader hver bevægelse op og ned i ydelse og magttrækning. (I modsætning til mobile processorer er det mere, som Qualcomm bruger med sine Krait-kerner end den mere almindelige ARM big.LITTLE-kombination.) Den er også designet med forbedret strømstyring og hurtigere ind- og udgang fra standbytilstande, funktioner, der er særlig vigtige på det mobile marked.

Virksomheden siger, at det bedre kan justere strømmen mellem CPU-kernen og andre elementer, såsom grafik, hvilket giver mulighed for en mere sofistikeret implementering af burst-tilstand.

Alt i alt siger Intel, at den nye arkitektur og et skridt til firmaets 22nm FinFet SoC-proces bør tillade chips, der tilbyder op til tre gange højere ydelse eller fem gange lavere effekt end nuværende Atom-chips. Generelt sagde Intel, at den "effektive" dual-core kan overgå en ineffektiv nuværende quad-core processor under strømbegrænsninger. (Igen, som altid, vil jeg vente på, at produkterne bedømmer dette.)

Som den nuværende Atom-linje, vil Silvermont-arkitekturen sandsynligvis blive brugt i en række processorer, lige fra dem, der er rettet mod mobile enheder til større systemer. Disse bør omfatte Avoton, der er rettet mod mikroservere, Rangely rettet mod netværksenheder, Merrifield rettet mod smartphones og Bay Trail rettet mod tablets og cabrioleter. Heraf er den mest efterlængtede 22nm Bay Trail-platform, som Intel forventer at have på markedet i tide til, at tabletter skal være tilgængelige inden for feriesæsonen, med flere detaljer inden for kort tid.

Samlet set lyder Silvermont-arkitekturen som et stort skridt op fra den eksisterende Atom-arkitektur, og jeg er især fascineret af at se, hvordan Bay Trail, baseret på denne arkitektur, faktisk klarer sig. Til dato har der været et bemærkelsesværdigt præstationsgap mellem den lave ende af Core-familien og high-end Atomer, men denne arkitektur ser ud som om den virkelig kunne lukke kløften.

Konklusion: Grafik og magt definerer konkurrence

Hver større processor, du ser i dag - hvad enten det drejer sig om en Intel- eller AMD-chip rettet mod desktops eller laptops eller en ARM-baseret chip rettet mod smartphones og tablets - har flere CPU-kerner, typisk flere GPU-kerner (undtagen serverchips) og alle mulige anden specialiseret logik til ting som billedbehandling, videokodning og dekodning og håndtering af kryptering.

Når chipprocessen bliver mindre, kan flere transistorer inkluderes på en enkelt chip. Men hvilke funktioner, der skal integreres (og hvordan man integrerer dem) forbliver en nøgledifferentiering blandt chip-leverandørerne, ligesom det specifikke design og mikroarkitektur af chips selv.

Disse meddelelser viser de afvejninger, som Intel og AMD foretager, og disse bør have enorme konsekvenser for computing i de næste par år.

For desktops og laptops ser Intel ud som om det ikke kun prøver at indhente AMD med indbygget grafisk ydeevne ved at tilføje flere eksekveringsenheder, men også forsøge at komme videre med funktioner som indlejret DRAM og drage fordel af dens processteknologi at føre. AMD sidder heller ikke stille med sin grafik, så det skulle skabe en interessant matchup. I mellemtiden presser AMD hårdt på for bedre at integrere grafik- og CPU-funktioner, hvilket kan resultere i en ny måde at programmere på; det tager længere tid, men kan vise sig at være utroligt vigtigt.

Kampen mellem AMDs Kaveri og Intels Haswell kunne derfor være mere interessant end Intel-AMD-konkurrencen i de sidste par år. Haswell vil bestemt sende først. (Jeg forventer at se systemer i sommer kontra mod tidligt næste år for Kaveri.) Igen er dette mest for mainstream desktops og notebooks. Spillere og brugere af arbejdsstationer vil utvivlsomt stadig ønsker at parre enten chip med diskrete grafikløsninger fra enten AMD eller Nvidia.

For tablets og potentielt til sidst telefoner kan den heterogene systemarkitekturtilgang, som AMD og andre skubber, vise sig at være endnu vigtigere, selvom det igen vil tage et stykke tid at se, om applikationer virkelig drager fordel af det. Intels nye arkitektur skulle gøre den mere konkurrencedygtig i dette rum. Det ser virkelig ud som et stort skridt fremad, men konkurrenterne vil også fortsætte med at bevæge sig.

Jeg er lidt nysgerrig efter, om ting som den Silvermont-baserede Bay Trail-platform til Atom faktisk kører hurtigt nok, så det begynder at vises i mere mainstream low-end notebooks eller endda desktops. Allerede dagens Atom-baserede tabletter kører Windows rimeligt godt, og med forbedringerne kan det være nok for mange mainstream-brugere, selvom det hænger bag ydeevnen til Haswell eller Kaveri (eller Intels nuværende Sandy Bridge og AMD's nuværende Richmond, til det stof).

Det skulle sørge for en spændende konkurrence i det kommende år.

Amd og Intel åbner grafik foran i processorkamp