Hjem Fremadrettet tænkning Mobilprocessorer fra 2018: stigningen i maskinlæringsfunktioner

Mobilprocessorer fra 2018: stigningen i maskinlæringsfunktioner

Indholdsfortegnelse:

Video: Edge Computing for the (Telecom) Infrastructure - Victor Bahl, Microsoft Research (Oktober 2024)

Video: Edge Computing for the (Telecom) Infrastructure - Victor Bahl, Microsoft Research (Oktober 2024)
Anonim

Ikke overraskende har dette års smartphones hurtigere processorer end dem fra sidste år - det sker hvert år. Men hvad der er nyt i år, er overvejelsen af ​​maskinindlæringsfunktioner, som næsten hver processorudbyder touting som en måde at differentiere deres enheder på. Dette er tilfældet for telefonselskaberne, der designer deres egne chips, de uafhængige eller sælgende chip-leverandører, der sælger processorer til telefonudbydere, og endda IP-producenterne, der designer kernerne, der går ind i processorerne selv.

Baggrund

Først en lille baggrund: alle moderne applikationsprocessorer inkluderer design (ofte benævnt intellektuel ejendom eller IP) fra andre virksomheder, især firmaer som ARM, Imagination Technologies, MIPS og Ceva. En sådan IP kan vises i forskellige former - for eksempel sælger ARM alt fra en grundlæggende licens til dens 32-bit og 64-bit arkitektur, til specifikke kerner til CPU'er, grafik, billedbehandling osv., Som chipdesignere derefter kan bruge til oprette processorer. Typisk blander og matcher chipdesignere disse kerner med deres egne design og træffer forskellige valg med hensyn til hukommelse, sammenkoblinger og andre funktioner i et forsøg på at afbalancere ydelsen med strømkrav, størrelse og omkostninger.

På CPU-fronten har de fleste chips en kombination af større kerner, der er mere kraftfulde og kører hurtigere og varmere, og mindre kerner, der er mere effektive. Telefoner bruger typisk de mindre kerner mest af tiden, men til krævende opgaver skifter de til højere ydeevne og bruger en kombination af både kerner og GPU og andre kerner for bedst at styre ydelsesbehov og termiske overvejelser (du kan ikke kør højkvalitetskernerne meget længe, ​​fordi de ville overophedes, og du behøver normalt ikke). De mest kendte eksempler på de store kerner er ARM's Cortex-A75 og A73-kerner; de matchende mindre kerner ville være A55 og A53. I nutidens avancerede telefoner ser du ofte fire af hver i det, der er kendt som et octa-core-layout, selvom nogle leverandører har taget andre fremgangsmåder.

Til grafik er der mere mangfoldighed, hvor nogle leverandører vælger ARM's Mali-linje, andre vælger Imagination Technologies 'PowerVR, og stadig andre vælger at designe deres egne grafikkerner. Og der er endnu mere mangfoldighed, når det kommer til ting som billedbehandling, digital signalbehandling og som sent AI-funktioner.

Æble

Apple begyndte at skubbe til sine AI-kapaciteter i sine efterårstelefonmeddelelser, herunder især "A11 Bionic" -chippen, der blev brugt i iPhone 8 og 8 Plus, samt iPhone X.

A11 Bionic er en seks-kernet arkitektur med to højtydende kerner og fire effektivitetskerner. Apple designer sine egne kerner (under en ARM-arkitekturlicens) og har traditionelt skubbet enkelttrådede ydelser. Dette er et skridt op fra A10-fusionen med fire kerner, og Apple sagde, at ydeevne kerne i A11 er op til 25 procent hurtigere end i A10, mens de fire effektivitetskerner kan være op til 70 procent hurtigere end A10 Fusion-chippen. Det sagde også, at grafikprocessoren er op til 30 procent hurtigere.

Apple taler om, at chippen har en dual-core "Neural Engine", som kan hjælpe med scenegenkendelse i kameraappen, og Face ID og Animoji på iPhone X. Virksomheden frigav også et API, der hedder CoreML, for at hjælpe tredjepart udviklere opretter applikationer, der drager fordel af dette.

Apple giver typisk ikke meget information om sine processorer, men siger, at A11 Bionic neuromotor er et dual-core design, der kan udføre op til 600 milliarder operationer i sekundet til realtidsbehandling.

I modsætning til de fleste af de andre processorproducenter integrerer Apple ikke modemet i sine applikationsprocessorer og bruger i stedet frittstående Qualcomm- eller Intel-modemer. Der har været en del kontroverser om, hvorvidt Apple kun understøtter funktionerne i sine Qualcomm-modemer, der også understøttes af Intel; I praksis betyder dette, at iPhones understøtter 3-vejs bærersamling, men ikke nogle af de mere avancerede funktioner.

Huawei

Huawei var også tidligt mod AI-skubben og kaldte Kirin 970, som den annoncerede på IFA-showet sidste efterår, "verdens første mobile AI-behandlingsenhed." Kirin 970 bruges lige nu i Huawei Mate 10. Den inkluderer fire Cortex-A73 CPU-kerner, der kører på op til 2, 4 GHz og fire A53'er, der kører på op til 1, 8 GHz, sammen med ARM's Mali G72 MP12 GPU.

Det, der især er nyt i 970, er hvad Huawei kalder sin NPU eller Neural Processing Unit. Virksomheden har sagt, at de opgaver, der kan overføres til denne processor, kan se 25 gange ydelsen og 50 gange effektiviteten i forhold til dem, der kører på CPU-klyngen. Dette er især rettet mod hurtigere billedgenkendelse og bedre fotografering. På showet sagde Huawei, at telefonen kan behandle 1, 92 16-bit TeraFLOP'er.

Kirin 970 har en dual-image signalprocessor, et kategori 18 LTE-modem med 5-carrier-aggregering og 4-by-4 MIMO, der skal muliggøre en maksimal downloadhastighed på 1, 2 Gbps.

På Mobile World Congress annoncerede Huawei sit første 5G-modem, Balong 5G01, som det sagde ville være det første 5G-modem, der blev sendt. Det ser ud til, at nogle fremtidige applikationsprocessorer også vil vedtage dette modem, men det er endnu ikke blevet annonceret. Teknisk set er alle disse produkter oprettet af firmaets HiSilicon-datterselskab.

Qualcomm

Chippen, der sandsynligvis vil være hjertet i de fleste af flagskibets Android-telefoner i USA i år, er Qualcomms Snapdragon 845. Dette er en opgradering af Snapdragon 835, der blev brugt i de fleste af 2017's premium Android-telefoner, og er allerede brugt i de nordamerikanske versioner af Galaxy S9.

Som med de fleste andre leverandører skubber Qualcomm neurale netværk og AI som et af de største forbedringsområder i dette års chip sammen med et øget fokus på "nedsænkning" - hvilket i det væsentlige betyder bedre billeddannelse.

I AI-området kan Qualcomm lide at tale om at have en multi-core Neural Processing Engine (NPE), der bruger en ny version af sin Hexagon DSP såvel som CPU og GPU til inferencing.

Chippen har Hexagon 685 DSP, som Qualcomm siger, at mere end fordobler AI-behandlingsydelsen; en Kryo 385-CPU, som den siger giver en 25 til 30 procent ydelsesforøgelse for sine ydeevne kerner (fire ARM Cortex-A75 kerner, der kører på op til 2, 85 GHz), og op til en 15 procent øget ydelse for sine "effektivitetskerner (fire Cortex-A55-kerner, der kører med op til 1, 8 GHz), hvor alle deler en 2MB L3-cache, og en Adreno 630 GPU, som Qualcomm siger, vil støtte en 30 procent forbedring af ydelsen eller en 30 procent effektreduktion samt op til 2, 5 gange hurtigere skærme.

I AI-området understøtter chippen et stort antal forskellige maskinlæringsrammer, og virksomheden siger, at dette fungerer til ting som objektklassificering, ansigtsregistrering, scenesegmentering, højttalergenkendelse osv. To fremhævede applikationer er live bokeh-effekter (til produktion af portrætter med en sløret baggrund) og aktiv dybdesensor og struktureret lys, hvilket skulle muliggøre forbedret ansigtsgenkendelse. Ved at flytte inferencing fra skyen til enheden, siger Qualcomm, at du får fordelene ved lav latenstid, privatliv og forbedret pålidelighed.

I billeddannelsesområdet har chippen en ny version af Qualcomm's Spectra ISP, forbedret Ultra HD-videooptagelse med multi-frame støjreduktion, evnen til at optage 16-megapixel video ved 60 billeder i sekundet og 720p langsom mo-video på 480 billeder i sekundet. For VR understøtter 845 skærme med en 2K-by-2K-opløsning på 120 billeder i sekundet, et stort trin op fra 1.5K-by-1.5K ved 60 frames per sekund understøttet af 835.

Andre funktioner inkluderer en sikker behandlingsenhed, der bruger sin egen kerne til at gemme sikkerhedsoplysninger uden for kernen, og som fungerer med CPU og Qualcomms TrustZone-funktion.

845 integrerer X20-modemet, som Qualcomm introducerede sidste år, og som er i stand til at understøtte LTE-kategori 18 (med hastigheder op til 1, 2 Gbps), op til 5 bærerammensætning og 4X4 MIMO, og bruger teknikker såsom licenseret assisteret adgang for at gøre hurtigere hastigheder mulige i flere områder.

Chippen er fremstillet på Samsungs 10nm laveffektproces.

Qualcomm fremstiller også Snapdragon 600-familien af ​​applikationsprocessorer, ledet af 660, som bruges af mange kinesiske leverandører, herunder Oppo og Vivo. I løbet af Mobile World Congress introducerede den Snapdragon 700-familien, der har mange af de samme funktioner som 800-familien, herunder Hexagon DSP, Spectra ISP, Adreno-grafik og Kryo CPU. Sammenlignet med 660 siger Qualcomm, at det vil tilbyde en 2x forbedring i AI-applikationer på enheden og en 30 procent forbedring i effektivitet.

Samsung

Mens den bruger Qualcomm-processorer i de fleste af sine nordamerikanske telefoner, bruger Samsung på mange andre markeder sine egne Exynos-processorer og begynder at stille sådanne processorer til rådighed for andre telefonproducenter.

Dens nye top-of-the-line er Exynos 9810, som Samsung vil bruge i internationale versioner af Galaxy S9 og S9 +.

Igen skubber Samsung nye funktioner til "dyb læringsbaseret software", som den siger, hjælper processoren til nøjagtigt at identificere emner eller personer i telefonerne og understøtter dybdesans for ansigtsgenkendelse.

9810 er også en octa-core-chip med fire A55-kerner til effektivitet og fire brugerdefinerede CPU-design til ydeevne. Samsung siger, at disse nye kerner, der kan køre med op til 2, 9 GHz, har en bredere rørledning og optimeret cachehukommelse, hvilket giver dem dobbelt så meget en-core-ydelse og 40 procent mere multi-core-ydelse sammenlignet med sin forgænger sidste års 8895. (Udgivne benchmarks viser forbedringer i den virkelige verden, men ikke så meget som det hævdes; jeg er fortsat skeptisk over for alle de mobile benchmarks på dette tidspunkt.)

Andre funktioner inkluderer Mali-G72 MP18-grafik, support til op til 3840-ved-2400 skærme og 4096-by-2160-skærme, en dobbelt billedsignalprocessor (ISP) og support til 4K-optagelse ved 120 billeder i sekundet. 9810 har også et kategori 18-modem med 6 transportør-aggregering og 4-by-4 MIMO til downlink (2 CA for uplink), med en maksimal hastighed på 1, 2 Gbps downlink og uploader på 200 MB. På papir matcher dette kategori 18-modem, som både Qualcomm og Huawei har i deres nuværende topchips. Ligesom Snapdragon 845 fremstilles den på Samsungs anden generation 10nm FinFET-proces.

MediaTek

MediaTek har været mere en spiller i mellemhøjtelefoner og derunder, og i sidste måned introducerede en ny chip kaldet Helio P60 rettet mod "New Premium" -markedet - midt-markedstelefon i $ 200- $ 400-serien, der tilbyder alt det grundlæggende funktioner i de højere ende telefoner. Den første telefon, der annonceres, der vil bruge denne chip er Oppo R15.

Virksomhedens øverste processor, der blev annonceret sidste år, er Helio X30, som er en deca-processor, der er rettet mod premium-telefoner. Dette inkluderer to ARM Cortex-A73 CPU-kerner, der kører på op til 2, 5 GHz, fire Cortex-A53-kerner, der kører på op til 2, 2 GHz, og fire A35-kerner, der kan køre på op til 1, 9 GHz, sammen med Imaginations PowerVR-serie 7XT Plus-grafik på 800 GHz og et LTE-kategori 10-modem, der er i stand til 3-carrier-aggregering på downlink. Det er en interessant chip, produceret på TSMCs 10nm-proces, og skubber tanken om, at flere kerner kan være mere fleksible. Blandt de telefoner, der annonceres, at de bruger dette, er Meizu Pro 7 Plus med dobbelt skærme og Vernee Apollo 2 (8MP frontkamera, 16MP + 13MP bagkameraer).

Sidste år annoncerede MediaTek to mellemmarkedsprocessorer, Helio P23 og P30, der var rettet mod globale markeder og Kina specifikt, hver med otte Cortex-A53-kerner, der kører på 2, 53 GHz, og Mali G71 MP2-grafik. Dette er de chips, som P60 er designet til at erstatte, og tilbyder mere kraft og muliggør en række nye funktioner.

P60 tilbyder mere ydeevne og er en tilbagevenden til den store.LITE konfiguration ARM og MediaTek skubbet i tidligere år, og kombinerer fire af de mere kraftfulde ARM Cortex-A73 på op til 2, 0 GHz med fire af de mere effektive Cortex-A53 kerner, også ved 2, 0 GHz. Disse er forbundet med en ARM Mali G72 NMP3 GPU på op til 800 MHz og styres alle af den fjerde version af MediaTeks CorePilot-teknologi til planlægning, hvor opgaver kører. Sammenlignet med P23 og P30 siger MediaTek, at P60 tilbyder en 70 procents ydeevneforbedring i både CPU og GPU-operationer.

MediaTek kommer også på AI-båndet, med P60 inklusive sin NeuroPilot-platform til neuralt netværkshardwareacceleration. Dette understøtter Google Android Neural Network (NN) og de almindelige AI-rammer, herunder TensorFlow, TensorFlow Lite, Caffe og Caffe 2. Dette er effektivt en specialiseret digital signalprocessor, der er i stand til 280 GMAC'er (milliarder af multiplikationsakkumulerede operationer pr. Sekund). Det er designet til at blive brugt til ting som ansigtsgenkendelse til at låse en telefon op (noget, vi har set i avancerede telefoner, men ikke mellemhøjtelefoner indtil nu), og genkendelse af objekter, selv i videoer, med 60 billeder i sekundet.

Derudover har P60 en række nye billedfunktioner, herunder tre billedsensorprocessorer, der kan understøtte en dobbeltkamera-konfiguration på 16 og 20 MP sensorer eller et enkelt kamera på op til 32 MP. (Jeg har endnu ikke set en telefon i produktion med en kamerasensor med så mange megapixel, men de kommer visstnok til.) Disse sensorer tilføjer støjreducerende funktioner sammen med real-time bokeh (sløring af baggrunden, der bruges i portrættilstande).

Chippen indeholder et modem, der understøtter kategori 7-downloads (ved op til 300 Mbps) og kategori 13-uploads (op til 150 Mbps med 2 transportørsamling). Det er fremstillet på TSMCs 12nm FinFet-proces, som virksomheden siger, at det hjælper det med at levere 25 procent strømbesparelse til kraftintensive applikationer såsom spil og 12 procent strømbesparelser generelt.

Spreadtrum

Spreadtrum, der gør at modemer for det meste sælges på det kinesiske marked, annoncerede et partnerskab med Intel, der vil bruge Intels 5G-modem og ARM-kompatible CPU'er. Dette er stadig et par år væk, så detaljer er endnu ikke tilgængelige.

Bemærk, at selvom Spreadtrum ikke er meget synlig i USA, sporer det kun Qualcomm og MediaTek på handelsmarkedet for applikationsprocessorer. Det sælger for det meste produkter med ARM-CPU'er og sit eget 4G-modem, men har en aftale med og ejes mindretal af Intel. Dette har resulteret i en chip med Intel CPU'er og Spreadtrum's modem (det modsatte af den nye meddelelse).

ARM

Selvfølgelig er det ikke kun chipmakerne, der ser AI som den næste store bølge, og de virksomheder, der foretager IP-en, har også været et stort skub på dette område.

ARM, den mest succesrige af IP-producenterne, annoncerede en pakke med IP til maskinlæring i sidste måned, inklusive både hardware og software, og skubbede til dette på Mobile World Congress.

Døbt Project Trillium, dette inkluderer processor-design (IP) til både Machine Learning (ML) og Object Detection (OD) sammen med et nyt softwarebibliotek.

ML-processoren er designet til at sidde i en applikationsprocessor og køre ved siden af ​​CPU, GPU og skærmkernen. Softwarebiblioteket, der er kendt som ARM NN (neuralt netværk), er designet til at understøtte rammer som TensorFlow, Caffe og Android NN. Dette gør det muligt for disse applikationer at køre gennem software alene på eksisterende processorer, der har ARM CPU'er og grafik; selvom det naturligvis vil fremskyndes betydeligt, når det køres på processorer, der inkluderer ML-kerner. Tredjepartssoftware fungerer også på processorkernen. ARM siger, at ML-kernen blev designet fra bunden specifikt til at køre neurale netværk. Det kan køre både 8 og 16-bit applikationer, skønt tendensen er at fokusere på 8-bit for enkelhed.

OD-processoren er designet til at sidde ved siden af ​​en billedsignaleringsprocessor (ISP) for at tilvejebringe detektering af objekter med lav effekt, specifikt til applikationer som ansigtsregistrering og sporing af bevægelse. Dette er en dedikeret hardware-blok designet til at blive brugt med nye sensorteknologier såsom stereoskopiske kameraer.

ARM sagde, at den nye IP ville være tilgængelig til udvikler-forhåndsvisning i april og ville være generelt tilgængelig senere på året, men i betragtning af en typisk tidscyklus er det usandsynligt, at de nye processor-kerner vises i chips før i 2019 eller senere. Selvfølgelig kunne softwaren, der fungerer på eksisterende kerner, blive brugt meget hurtigere.

ARM skubbede også nogle nye løsninger til Internet of Things, inklusive en ny SIM-løsning kaldet Kigen, designet til at blive bygget inde i SoC'er til enheder med lav effekt til at erstatte dagens fysiske SIM-kort.

Imagination Technologies

Fantasi, kendt for sin PowerVR-grafik, annoncerede sin neurale netværks-IP sidste efterår, PowerVR 2NX Neural Network Acceleration (NNA). Dette er en fleksibel arkitektur med en til otte kerner, som hver kan have 256 8-bit multiplay-akkumuleringsenheder (MAC'er). Fantasi har sagt, at det kan udføre over 3, 2 billioner operationer pr. Sekund.

Ceva

Andre IP-leverandører kommer også på markedet. Ceva, som er kendt for sine DSP-kerner, annoncerede netop NeuPro, en familie af AI-processorkerner designet til kantenheder. Disse bygger på processorer, som virksomheden har solgt inden for computervisionsområdet, og bruger CDNN-rammerne til en række "AI-processer." Dette vil arbejde med de fælles maskinelæringsrammer og konvertere disse til at køre på mobile processorer til inferencing. Virksomheden planlægger processorer fra 2 til 12, 5 teraops per sekund (TOPS) designet til forbruger-, overvågnings- og ADAS-produkter (til autonome køretøjer). Ceva har sagt, at en større bilkund planlægger at aktivere 100 TOPS-ydelser ved hjælp af mindre end 10 watt strøm. Licenser begynder i andet halvår af dette år.

Ceva annoncerede også sin PentaG-platform med DSP'er til 5G baseband-modemer. Virksomheden siger, at dens nuværende DSP'er findes i 40 procent af verdens håndsæt, der dækker omkring 900 millioner telefoner om året og i modemer fra Intel, Samsung og Spreadtrum. Den nye platform har mere AI, der især bruges til "linktilpasning." I 5G-verdenen kan håndsæt have flere links til en basestation, og Ceva siger, at dens hardware og software hjælper med at bestemme det bedste link hvert par millisekunder. Dette kan spare en masse strøm sammenlignet med at bruge software alene. Dette er ikke en generel DSP eller neuralt netværkschip, men snarere en designet specielt til kommunikation. Det blev netop annonceret og skulle være tilgængeligt i tredje kvartal.

Ceva laver også et stort skub for DSP'er på 5G-basestationsmarkedet og har sagt, at så meget som 50 procent af den 5G nye radioinfrastruktur vil bruge virksomhedens DSP IP, inklusive systemer fra Nokia og ZTE.

Hvor sandsynligt er det, at du anbefaler PCMag.com?

Mobilprocessorer fra 2018: stigningen i maskinlæringsfunktioner