Principal Innovar La intel·ligència artificial de Google 'Alpha Go Zero' acaba de prémer el botó Restabliment sobre com es pot aprendre

La intel·ligència artificial de Google 'Alpha Go Zero' acaba de prémer el botó Restabliment sobre com es pot aprendre

El Vostre Horòscop Per Demà

Recordeu (vagament) com vau aprendre a caminar, parlar, anar amb bicicleta o conduir? Va ser desordenat i ple d’errors, però les habilitats que vau aprendre d’aquesta manera es van mantenir. Fora dels sistemes vius, ha estat un desafiament estructurar algoritmes prou forts com per tenir “experiència de la vida real” i desenvolupar conductes adaptables i adhesius per a la intel·ligència artificial.

Bé, Alpha Go Zero ho va fer.

'Comença a partir d'una pissarra en blanc i es calcula només per si mateix, només a partir del joc personal, i sense cap coneixement humà, ni cap dada humana, ni trets, ni exemples, ni intervenció humana. Descobreix com jugar el joc de Go des dels primers principis ', afirma el professor de DeepMind, David Silver.

L’IA ha tingut diverses iteracions, cadascuna més intel·ligent i més capaç que l’anterior. La versió anterior utilitzava una enorme base de dades de jocs anteriors juntament amb un munt d’algoritmes que l’apuntaven cap a la victòria. Aquest enfocament va conduir a la derrota del vigent campió del món, jugador professional de Go. En el pòquer, AI Libratus ha eliminat recentment els millors jugadors de pòquer del món en gairebé 2 milions de dòlars, també aprenent a través del joc automàtic en lloc de les dades de jocs humans.

amb qui està casat amb Mark Burnett

Ara, en aquesta última versió d’Alpha Go, s’ensenya el programa d’intel·ligència artificial a si mateix com es juga a Go, sense antecedents humans.

Executant milions de simulacions de jocs contra si mateix, va trigar 40 dies a aprendre, des de zero, a vèncer la versió campió del món de si mateixa. Això canvia realment el joc, no només per a Go, sinó també per com es descobreixen nous coneixements. Quina exactitud o completesa té el vostre coneixement del domini? Hi ha molt més per descobrir, és el que ens explica aquest fascinant experiment d’aprenentatge amb Alpha Go Zero.

'La idea d'Alpha Go no és sortir i derrotar els humans, sinó descobrir què significa fer ciència, perquè un programa pugui aprendre d'ell mateix què és el coneixement', segons Silver en una publicació de YouTube sobre l’assoliment.

L’equip Alpha Go Zero Deep Mind l’anomena primer aprenentatge “tabula rasa” (pissarra en blanc).

'Si ho podeu aconseguir tabula rasa aprenent, teniu un agent que es pot trasplantar des del joc de Go a qualsevol altre domini, i les característiques específiques del joc en què us trobeu, teniu un algorisme tan general que es pot aplicar a qualsevol lloc ', diu . Aquesta és una idea provocativa quan amplieu el concepte. Penseu què podríem fer amb un conjunt d’algoritmes d’aprenentatge forts que podrien abordar sistemàticament problemes difícils i aprendre més ràpidament que el coneixement col·lectiu de la nostra civilització. . . en dies, no en dècades.

amb qui està sortint amb Sidney Crosby

De moment, el gran problema és que 'els algoritmes són molt més importants que la informàtica o les dades disponibles', va dir Silver. Només això canvia el joc de com enfoquem l’extensió del món conegut. Tot i que Alpha Go funciona amb aproximadament 25 milions de dòlars en maquinari (no és exactament un sistema lleuger), ja sabeu que els gurus de la IA treballen des de fa temps per crear conjunts de dades més nets i millors. Avui en dia, molts conjunts de dades grans es consideren massa sorollosos, plens de dades deficients, per formar amb precisió una intel·ligència artificial. Si la IA aprèn de les dades i les dades són dolentes, no aprèn. Gran problema.

Què passa si no necessiteu dades netes, sinó només experiència i la intel·ligència artificial es podria entrenar?

Aquest és l’apassionant assoliment d’Alpha Go Zero. Tot i que es troba en el món dels jocs basat en regles, té grans implicacions en totes les indústries que treballen a partir de regles físiques: penseu en química, trànsit, biologia, farmacologia, viatges, logística i fabricació. Si podem dissenyar regles tan flexibles que poden treballar a partir d’una experiència més àmplia i tan direccionals que sempre creen habilitats més fortes, com Alpha Go Zero, llavors és possible aconseguir intel·ligència artificial que domini els sistemes. Aquests sistemes no necessitarien dades externes, no tenen problemes de neteja de dades i no necessiten ralentitzacions en el bucle. És per això que la companyia matriu de Google, Alphabet, va apostar per la intel·ligència artificial i inverteix en intel·ligència artificial a un ritme ràpid. (Amazon també inverteix en intel·ligència artificial, com la seva última adquisició d'IA BodyLabs).

que està sortint amb justina valentine

El professor de Deep Mind, David Silver, diu: 'El fet que hàgim vist com un programa aconsegueix un rendiment d'alt nivell ... hauria de significar que ara podem començar a abordar alguns dels problemes més difícils i impactants per a la humanitat'.

Aquesta publicació s'ha actualitzat per aclarir que AI Libratus ha guanyat recentment els millors jugadors de pòquer mitjançant una estratègia que consisteix en el joc propi en lloc de dades introduïdes per humans.