miércoles, junio 26Te mantenemos informado

La Inteligencia Artificial autodidacta de Google

El programa de Inteligencia Artificial de google AlphaGo aprende de si mismo. Ha aprendido en tres días lo que a la humanidad le ha costado miles de años y, además, sin ninguna ayuda humana.

AlphaGo es un programa informático de inteligencia artificial desarrollado por Google DeepMind para jugar al juego de mesa Go. En octubre de 2015 se convirtió en la primera máquina de Go en ganar a un jugador profesional de Go sin emplear piedras de handicap en un tablero de 19×19.

Inteligencia artificial

Y es que la versión actualizada de AlphaGo es completamente autodidacta, un paso importante hacia el surgimiento de máquinas que logran capacidades sobrehumanas «sin aportaciones humanas», según apuntaron los responsables del programa a la revista Nature.


El juego de ‘Go’, es el desafío más complejo para dos personas que jamás se haya inventado y Alphago Zero lo ha dominado en tres días. Creó sus propios y novedosos movimientos para eclipsar todo el conocimiento que a nosotros tanto nos ha costado obtener. Finalmente, AlphaGo Zero ganó por 100 juegos a 0, venciendo de forma apabullante.

«AlphaGo Zero no solo redescubrió los patrones y aperturas comunes que los humanos tienden a jugar… finalmente los descartó, prefiriendo sus propias variantes que los humanos ni siquiera conocen ni juegan en este momento», dijo David Silver, investigador principal de Alpha Go.

El predecesor de Zero, AlphaGo, era increíble, pero la nueva versión autodidacta ha redefinido su arsenal de entrenamiento al erradicar por completo las enseñanzas humanas de su educación. Cogió las reglas del juego y, sin instrucciones, el sistema aprendió cómo jugar, ideó una estrategia y mejoró mientras compitió contra sí mismo, comenzando con un «juego completamente al azar» para descubrir cómo se ganaba la recompensa.

A diferencia de sus predecesores, AlphaGo Zero «ya no está limitado por los límites del conocimiento humano», escribió el CEO de Silver y DeepMind, Demis Hassabis, en un blog.

En el estudio, los investigadores exponen cómo esa sorprendente autosuficiencia ha ‘afilado’ la inteligencia de Zero hasta convertirla en devastadora: en 100 juegos no hubo ni una sola victoria contraria. Ni una.

Aún más sorprendente, ese truco se produjo después de solo tres días de entrenamiento de auto-juego de AlphaGo Zero, en el que destilaba el equivalente a miles de años de conocimiento humano del juego.

Aparte de ser autodidacta, el equipo detrás de AlphaGo Zero atribuye su dominio de Go a una red neuronal única mejorada (como si de un  cerebro humano se tratara) y a simulaciones de entrenamiento más avanzadas.

En comparación, AlphaGo Zero tenía cuatro unidades de procesamiento de  datos y AlphaGo 48; AlphaGo Zero jugó 4,9 millones de juegos de entrenamiento durante tres días y AlphaGo 30 millones de juegos durante varios meses.

Pero solo porque la IA esté avanzando a un ritmo tan asombroso no significa necesariamente que Zero sea más inteligente o más capaz de los humanos en otros campos lejos de este complicado juego de mesa inventado hace más de 2.500 años.

«Sin embargo, este no es el comienzo de ningún fin porque AlphaGo Zero, como todas las otras IA exitosas hasta ahora, es extremadamente limitado en lo que sabe y en lo que puede hacer en comparación con los humanos e incluso con otros animales», aclaró Satinder Singh de la Universidad de Michigan (EE. UU.).

Es posible que no sean capaces de hacer todo lo que los humanos podemos hacer ahora mismo, pero pueden hacer tantas otras cosas que nosotros no podemos… bienvenidos al futuro.


Deja un comentario