Hjem Nyheder & analyse Hvad er maskinlæring?

Hvad er maskinlæring?

Indholdsfortegnelse:

Video: Lego City 60004 Fire Station / Feuerwehr Hauptquartier - Lego Speed Build Review (Oktober 2024)

Video: Lego City 60004 Fire Station / Feuerwehr Hauptquartier - Lego Speed Build Review (Oktober 2024)
Anonim

I december 2017 introducerede DeepMind, det forskningslaboratorium, som Google erhvervede i 2014, AlphaZero, et kunstig intelligensprogram, der kunne besejre verdensmestre ved flere brætspil.

Interessant nok modtog AlphaZero nul instruktioner fra mennesker om, hvordan man spiller spillet (deraf navnet). I stedet brugte den maskinlæring, en gren af ​​AI, der udvikler sin adfærd gennem oplevelse i stedet for eksplicitte kommandoer.

Inden for 24 timer opnåede AlphaZero overmenneskelig præstation i skak og besejrede det forrige verdensmester skakprogram. Kort efter behersker AlphaZeros maskinlæringsalgoritme også Shogi (japansk skak) og det kinesiske brætspil Go, og det besejrede sin forgænger, AlphaGo, 100 til nul.

Maskinindlæring er blevet populær i de senere år og hjælper computere med at løse problemer, der tidligere blev antaget at være det eksklusive domæne for menneskelig intelligens. Og selvom det stadig er langt fra den originale vision om kunstig intelligens, har maskinlæring bragt os meget tættere på det endelige mål at skabe tænkemaskiner.

Hvad er forskellen mellem kunstig intelligens og maskinlæring?

Traditionelle tilgange til udvikling af kunstig intelligens involverer omhyggeligt kodning af alle regler og viden, der definerer en AI-agents opførsel. Når du opretter regelbaseret AI, skal udviklere skrive instruktioner, der specificerer, hvordan AI skal opføre sig som svar på enhver mulig situation. Denne regelbaserede tilgang, også kendt som god gammeldags AI (GOFAI) eller symbolsk AI, forsøger at efterligne det menneskelige sinds ræsonnement og videnrepræsentationsfunktioner.

Et perfekt eksempel på symbolsk AI er Stockfish, en top-ranking open source-skakmotor, der er mere end 10 år i gang. Hundreder af programmører og skakspillere har bidraget til Stockfish og hjulpet med at udvikle sin logik ved at kode dens regler - for eksempel hvad AI skal gøre, når modstanderen flytter sin ridder fra B1 til C3.

Men regelbaseret AI bryder ofte, når man håndterer situationer, hvor reglerne er for komplekse og implicitte. Genkendelse af tale og objekter i billeder er for eksempel avancerede operationer, der ikke kan udtrykkes i logiske regler.

I modsætning til symbolsk AI udvikles maskinlæring AI modeller ikke ved at skrive regler, men ved at samle eksempler. For eksempel at oprette en maskinlæringsbaseret skakmotor opretter en udvikler en basisalgoritme og "træner" den derefter med data fra tusinder af tidligere spillede skakspil. Ved at analysere dataene finder AI fælles mønstre, der definerer vinderstrategier, som den kan bruge til at besejre rigtige modstandere.

Jo flere spil AI gennemgår, jo bedre bliver det til at forudsige vindende træk under spillet. Dette er grunden til, at maskinlæring defineres som et program, hvis ydeevne forbedres med oplevelsen.

Maskinindlæring er anvendelig til mange virkelige opgaver, inklusive billedklassificering, stemmegenkendelse, indholdsanbefaling, bedrageri og naturligt sprogbehandling.

Overvåget og uovervåget læring

Afhængigt af det problem, de ønsker at løse, forbereder udviklere relevante data til at opbygge deres maskinlæringsmodel. Hvis de for eksempel ville bruge maskinlæring til at opdage falske banktransaktioner, ville udviklere udarbejde en liste over eksisterende transaktioner og mærke dem med deres resultat (falske eller gyldige). Når de indlæser dataene til algoritmen, adskiller den de falske og gyldige transaktioner og finder de fælles egenskaber inden for hver af de to klasser. Processen med træning af modeller med annoterede data kaldes "overvåget læring" og er i øjeblikket den dominerende form for maskinlæring.

Mange online opbevaringssteder med mærkede data til forskellige opgaver findes allerede. Nogle populære eksempler er ImageNet, et open-source datasæt med mere end 14 millioner mærkede billeder, og MNIST, et datasæt på 60.000 mærkede håndskrevne cifre. Maskinlæringsudviklere bruger også platforme som Amazons Mechanical Turk, et online, on-demand leje-hub til udførelse af kognitive opgaver, såsom mærkning af billeder og lydeksempler. Og en voksende sektor af startups er specialiseret i dataanotation.

Men ikke alle problemer kræver mærkede data. Nogle maskinelæringsproblemer kan løses gennem "uovervåget læring", hvor du giver AI-modellen rå data og lader den selv finde ud af, hvilke mønstre der er relevante.

En almindelig brug af uovervåget læring er anomalidetektion. For eksempel kan en maskinlæringsalgoritme træne på de rå netværkstrafikdata fra en internetforbundet enhed - f.eks. Et smart køleskab. Efter træning opretter AI en baseline for enheden og kan markere outlier-opførsel. Hvis enheden bliver inficeret med malware og begynder at kommunikere med ondsindede servere, vil maskinlæringsmodellen være i stand til at registrere den, fordi netværkstrafikken er forskellig fra den normale opførsel, der observeres under træning.

Forstærkningslæring

I øjeblikket ved du sandsynligvis, at kvalitetsuddannelsesdata spiller en enorm rolle i effektiviteten af ​​maskinlæringsmodeller. Men forstærkningslæring er en specialiseret type maskinlæring, hvor en AI udvikler sin adfærd uden at bruge tidligere data.

Modeller med forstærkningslæring starter med en ren skifer. De instrueres kun om deres miljøs grundlæggende regler og den aktuelle opgave. Gennem prøve og fejl lærer de at optimere deres handlinger til deres mål.

DeepMinds AlphaZero er et interessant eksempel på forstærkningslæring. I modsætning til andre maskinlæringsmodeller, som skal se, hvordan mennesker spiller skak og lærer af dem, begyndte AlphaZero kun at kende brikkenes bevægelser og spillets gevinstvilkår. Derefter spillede det millioner af kampe mod sig selv, startende med tilfældige handlinger og gradvist udviklede adfærdsmønstre.

Forstærkningslæring er et varmt forskningsområde. Det er den vigtigste teknologi, der bruges til at udvikle AI-modeller, der kan mestre komplekse spil som Dota 2 og StarCraft 2, og bruges også til at løse virkelige problemer, såsom styring af datacenterressourcer og skabe robothænder, der kan håndtere genstande med menneskelignende fingerfærdighed..

Deep Learning

Deep learning er en anden populær delmængde af maskinlæring. Den bruger kunstige neurale netværk, softwarekonstruktioner, der er nogenlunde inspireret af den biologiske struktur i den menneskelige hjerne.

Neurale netværk er fremragende ved behandling af ustrukturerede data, såsom billeder, video, lyd og lange uddrag af tekst, såsom artikler og forskningsartikler. Inden dyb læring, var maskinlæringseksperter nødt til at lægge en stor indsats i at udtrække funktioner fra billeder og videoer og ville køre deres algoritmer oven på det. Neurale netværk registrerer automatisk disse funktioner uden at kræve megen indsats fra menneskelige ingeniører.

Dyb læring er bag mange moderne AI-teknologier, såsom førerløse biler, avancerede oversættelsessystemer og teknologien til ansigtsgenkendelse i din iPhone X.

Grænserne for maskinlæring

Folk forveksler ofte maskinlæring med kunstig intelligens på menneskeligt niveau, og marketingafdelingerne i nogle virksomheder bruger med vilje ordene om hverandre. Men selvom maskinlæring har taget store fremskridt mod at løse komplekse problemer, er det stadig meget langt fra at skabe de tænkemaskiner, der er forestillet af AIs pionerer.

Ud over at lære af erfaring kræver sand intelligens ræsonnement, sund fornuft og abstrakt tænkning - områder, hvor maskinlæringsmodeller fungerer meget dårligt.

Selvom maskinlæring f.eks. Er god til komplicerede opgaver, der er genkendt af mønster, såsom at forudsige brystkræft fem år i forvejen, kæmper det med enklere logik- og ræsonnementsopgaver, som f.eks.

Maskinlærings mangel på ræsonnementskraft gør det dårligt til at generalisere sin viden. For eksempel vil et maskinlæringsagent, der kan spille Super Mario 3 som en pro, ikke dominere et andet platformspil, såsom Mega Man, eller endda en anden version af Super Mario. Det skal trænes fra bunden.

Uden magt til at udtrække konceptuel viden fra erfaring kræver maskinlæringsmodeller masser af træningsdata for at udføre. Desværre mangler mange domæner tilstrækkelige træningsdata eller har ikke midler til at erhverve mere. Dyb læring, som nu er den udbredte form for maskinlæring, lider også af et problem, der kan forklares: Neurale netværk fungerer på komplicerede måder, og endda deres skabere kæmper for at følge deres beslutningsprocesser. Dette gør det vanskeligt at bruge kraften i neurale netværk i indstillinger, hvor der er et juridisk krav til at forklare AI-beslutninger.

Heldigvis arbejdes der for at overvinde maskinlæringens grænser. Et bemærkelsesværdigt eksempel er et udbredt initiativ fra DARPA, Forsvarsdepartementets forskningsarm, til at skabe forklarbare AI-modeller.

  • Hvad er kunstig intelligens (AI)? Hvad er kunstig intelligens (AI)?
  • De fleste AI-dollars går til maskinlæring De fleste AI-dollars går til maskinlæring
  • Hvordan ønsker du at se AI brugt? Hvordan ønsker du at se AI brugt?

Andre projekter sigter mod at reducere maskinlæringens over-afhængighed af kommenterede data og gøre teknologien tilgængelig for domæner med begrænset træningsdata. Forskere hos IBM og MIT for nylig kom ind på banen ved at kombinere symbolsk AI med neurale netværk. Hybride AI-modeller kræver mindre data til træning og kan give trinvis forklaring af deres beslutninger.

Hvorvidt udviklingen af ​​maskinlæring til sidst vil hjælpe os med at nå det stadigt svigagtige mål om at skabe AI på menneskeligt niveau, er det endnu ikke se. Men hvad vi ved med sikkerhed, er, at takket være fremskridt inden for maskinlæring, bliver enhederne, der sidder på vores skriveborde og hviler i lommerne, smartere for hver dag.

Hvad er maskinlæring?