Hoppa till huvudinnehåll

Googles AI-program lärde sig själv att spela det svåra brädspelet go - finländskt proffs ser fram emot nya insikter

Brädspelet go
Brädspelet go Bild: Nataliya Dvukhimenna brädspel,go

Programmet Alphago zero har snabbt lyckats lära sig själv det knepiga asiatiska brädspelet go, och briljera i det - helt utan mänsklig hjälp. Det här är ett framsteg inom artificiell intelligens och pekar på hur stor betydelse AI-tekniken kan ha på vissa begränsade områden.

Go är ett uråldrigt brädspel för två personer, med en spelplan som påminner lite om en mycket stor schackbräda, med vita eller svarta stenar som pjäser. Namnet uttalas "gåå" på svenska.

Målet är att kontrollera största delen av planen, till exempel genom att omringa motståndarens pjäser.

– Spelet har mycket enkla regler, till skillnad från schack där man till exempel behöver veta hur enskilda pjäser kan förflytta sig, kommenterar Antti Törmänen.

Törmänen är 28 år och för tillfället den enda finländska proffsspelaren på go i världen, och en av få västerlänningar. Han bor i Tokyo i Japan och jobbar för det japanska goförbundet.

Gospelaren Antti Törmänen
Finlands enda proffsspelare på go, Antti Törmänen. Gospelaren Antti Törmänen Bild: Japanska goförbundet brädspel,antti törmänen

Men go kan spelas på många olika sätt, med invecklade strategier, vilket gör det svårt att veta hur man egentligen borde spela det.

Ett nytt dataprogram som kallas Alphago zero från det Google-ägda företaget Deepmind har ändå lyckats klurat ut ett utmärkt facit, helt enkelt genom att spela mot sig själv närmare fem miljoner gånger på några dagar. AI-metoden kallas förstärkande inlärning.

Programmet hittade på egna effektiva sätt att spela, som ingen eller få människor har använt hittills.

Törmänen ser ivrigt fram emot att få nya insikter via AI-programmets spelande - alltså nya metoder han själv kan använda för att bli en ännu bättre spelare.

– Alphago zero ser nog på spelbrädet på ett annat sätt än vi människor. Och den kan utveckla helt egna strategier, till exempel kan den medvetet förlora på vissa håll på spelplanen för att sedan ha bättre möjligheter att vinna hela spelet, säger han.

Och mycket riktigt. Programmet hittade på egna effektiva sätt att spela, som ingen eller få människor har använt hittills.

Dessutom förkastade den också vissa vanliga mänskliga spelmetoder som ineffektiva - till exempel vissa strategier nära hörnen av spelplanen.

Vann över föregångare

En tidigare version av Alphago vann i fjol fyra av fem matcher mot världens bästa gospelare Lee Sedol. Den spelade på basis av data från proffsmatcher, där den använde sig av olika strategier som mänskliga spelare hade kommit på.

Det nya Alphago zero-programmet lärde sig alltså att spela helt själv, utan sådan här förhandsinfo.

När den spelade mot sin föregångare vann den alla gånger - 100 matcher av 100.

Törmänen låter sig inte nedslås av att en superdator har blivit så mycket bättre än människor på det spel han själv spelar som proffs.

– Det finns robotar som kan springa snabbare än löpare i de olympiska spelen. I slutänden är det kampen mellan människor som är intressant, och AI-framsteget kan alltså ge oss gospelare nyttig information om hur man kan spela, säger han.

Go kan också spelas på nätet.
Go kan också spelas på nätet. Go kan också spelas på nätet. Bild: Yle / Jussi Mankkinen brädspel,morgonöppet

Bygger på tidigare kunskap

Devdatt Dubhashi, som är professor i datateknik vid Chalmers tekniska högskola i Sverige och expert på artificiell intelligens, kommenterar att företaget Deepminds nya AI-program är ett intressant och imponerande framsteg - men ingenting revolutionerande.

– Det är inte revolutionerande eftersom det bygger på tidigare arbete som har gjorts på det här området, men Deepmind har förbättrat metoden på olika fiffiga sätt, säger han.

Devdatt Dubhashi
AI-experten Devdatt Dubhashi. Devdatt Dubhashi forskare

Framstegen han syftar på är bland annat att det nya systemet nu kan fungera på en enda dator istället för flera, och med endast fyra särskilda TPU-datorkretsar för neurala nätverk, istället för 48 stycken.

Träningstiden minskade också från flera månader till endast några dagar.

Ingenjörerna har gjort ett mycket gott jobb med mjukvaran, bedömer professorn.

Ett TPU-chip
TPU-datorkretsar är betydligt mer effektiva än vanliga processorer och grafikkort och särskilt lämpade för artificiell intelligens. TPU-kretsen (Tensor Processing Unit) förstärker programvaran som driver inlärningstjänster. Ett TPU-chip Bild: Google tensor processing unit,TPU

Är bra på vissa specifika saker

Dubhashi säger att man ska vara försiktig med att dra för långtgående slutsatser om hur brett AI-tekniken bakom Alphago zero kan användas.

Man har lyckats med en mycket svår uppgift inom ett smalt område, och bevisat hur stor nytta man kan ha av förstärkt lärande.

Tekniken funkar bra när det gäller brädspel för det går lätt att avgränsa vad AI-tekniken ska göra.

– Det är klart avgränsat, utan osäkerheter eller psykologiska faktorer, till exempel, säger han.

Dubhashi påpekar däremot att Deepmind-forskarna förhastar sig när de betonar att den här specifika inlärningstekniken kan användas på många andra utmanande områden.

Han säger att det till exempel är betydligt svårare att utveckla bra AI-system som kan bota sjukdomar eller köra bilar på ett tryggt sätt.

Alphago zero-framsteget publicerades i den vetenskapliga tidskriften Nature på onsdagskvällen.

Go är ett populärt spel bland annat i Kina, Japan, Korea och Ryssland och uppfanns för mer än 2 500 år sedan.

Det uppskattas finnas cirka 200 aktiva gospelare i Finland, och flera tusen finländare har spelat go. Många av dem är programmerare eller matematiker.

Artikeln uppdaterades 19.10.2017 kl. 16.34: Rubriken ändrades. Orden "Framsteg inom AI: Superdator" byttes ut mot "Googles AI-program" i rubriken, för att betona mjukvaran mer.

Läs också

virtuell verklighet + datorer + bredbandsnät + mobiltelefoner + internet + sociala nätverk + lösenord + databrott + teknik (apparater) + kommunikationsteknik + databaser + datakommunikation + pekskärm + telefoner + sökmotorer + dataskydd + e-postadresser