DeepMind Y Google: La Batalla Por El Control De La Inteligencia Artificial - Vista Alternativa

Tabla de contenido:

DeepMind Y Google: La Batalla Por El Control De La Inteligencia Artificial - Vista Alternativa
DeepMind Y Google: La Batalla Por El Control De La Inteligencia Artificial - Vista Alternativa

Vídeo: DeepMind Y Google: La Batalla Por El Control De La Inteligencia Artificial - Vista Alternativa

Vídeo: DeepMind Y Google: La Batalla Por El Control De La Inteligencia Artificial - Vista Alternativa
Vídeo: AlphaGo - The Movie | Full award-winning documentary 2024, Abril
Anonim

Una noche de agosto de 2010, un londinense de 34 años llamado Demis Hassabis subió al escenario en una sala de conferencias en el Área de la Bahía de San Francisco. Subiendo al podio con el paso fingido de un hombre que intenta controlar sus nervios, apretó los labios en una pequeña sonrisa y dijo: “Bueno, hoy quiero hablar de diferentes enfoques de la creación …”. Se detuvo, como si se diera cuenta de lo alto que estaba declarando sus ambiciones. Y lo dijo: "AGI".

AGI significa Inteligencia Artificial General, un programa informático hipotético que puede realizar tareas intelectuales tan bien como un humano, o incluso mejor. AGI podrá realizar tareas específicas, como reconocer personas en fotos o traducir idiomas, que actualmente son capaces de realizar muchas inteligencias artificiales separadas en nuestros teléfonos y computadoras. Podrán mantener una conversación, jugar al ajedrez y hablar francés al mismo tiempo. Podrán comprender libros de física, escribir novelas, desarrollar estrategias de inversión y mantener una conversación informal con extraños. Supervisarán las reacciones nucleares, gestionarán las redes eléctricas y el tráfico, y tendrán éxito sin esfuerzo en todo lo demás. AGI hará que la IA más avanzada de hoy parezca calculadoras de bolsillo.

El único intelecto actualmente capaz de realizar todas estas tareas pertenece a los humanos. Pero la mente humana está limitada por el tamaño del cráneo que alberga el cerebro. Su poder está limitado por la pequeña cantidad de energía que puede proporcionar el cuerpo. Dado que AGI se ejecutará en computadoras, no sufrirá estas limitaciones. Su inteligencia solo estará limitada por la cantidad de procesadores disponibles. AGI puede comenzar monitoreando reacciones nucleares. Pero pronto descubrirá nuevas fuentes de energía, digiriendo más trabajo físico por segundo del que una persona puede hacer en mil años. La inteligencia a nivel humano, respaldada por la velocidad y escalabilidad de las computadoras, nos evitará problemas. Hassabis dijo al periódico británico Observer que espera que AGI aborde, entre otras disciplinas, problemas como “el cáncer,cambio climático, energía, genómica, macroeconomía y sistemas financieros.

La conferencia en la que habló Hassabis se llamó Singularity Summit. Singularidad, la primera parte del nombre, se refiere a la consecuencia más probable de la aparición de AGI, según los futurólogos. Dado que AGI procesará información a alta velocidad, se volverá muy inteligente muy rápidamente. Los ciclos rápidos de superación personal conducirán a una explosión de inteligencia de la máquina, dejando a la gente oliendo el polvo de silicio. Dado que este futuro se basa únicamente en suposiciones no verificadas, se asume casi religiosamente que la Singularidad resultará ser una utopía o un infierno.

norte

A juzgar por los títulos de los discursos, los participantes de la conferencia creyeron más en el primer resultado: “La mente y cómo construirla”, “IA contra el envejecimiento”, “Reemplazando nuestros cuerpos”, “Modificando la frontera entre la vida y la muerte”. El discurso de Hassabis, por otro lado, parecía aburrido: "Un enfoque neurocientífico sistémico para crear AGI".

Hassabis se paseaba entre el podio y la pantalla, hablando con un golpeteo. Llevaba un jersey burdeos y una camisa blanca de botones como un colegial. Su pequeña estatura solo parecía enfatizar su inteligencia. Hasta ahora, explicó Hassabis, los científicos se han acercado a AGI desde dos lados. Un enfoque, conocido como IA simbólica, trató de describir y programar todas las reglas necesarias para un sistema que pudiera pensar como un humano. Este enfoque fue popular en las décadas de 1980 y 1990, pero no produjo los resultados deseados. Hassabis creía que la arquitectura mental del cerebro era demasiado sutil para describirla de esta manera.

Otro enfoque ha reunido a científicos que intentan replicar digitalmente las redes físicas del cerebro. Tenía cierto sentido. Después de todo, el cerebro es el lecho de la inteligencia humana. Pero esos investigadores también estaban en el camino equivocado, dijo Hassabis. Su tarea era similar a la de crear un mapa de todas las estrellas del universo. Más profundamente, se estaban enfocando en el nivel incorrecto de funcionamiento del cerebro. Fue como intentar averiguar cómo funciona Microsoft Excel pirateando una computadora y aprendiendo cómo interactúan los transistores.

En cambio, Hassabis ofreció un término medio: AGI debería inspirarse en las amplias formas en que el cerebro procesa la información, no en los sistemas físicos o reglas específicas que se aplican a situaciones específicas. En otras palabras, debería centrarse en comprender el software del cerebro, no su hardware. Nuevas técnicas, como la resonancia magnética funcional (fMRI, por sus siglas en inglés), que permitieron conocer el funcionamiento del cerebro, insinuaron que tal comprensión era posible. Estudios recientes, dijo Hassabis, muestran que el cerebro aprende repitiendo sus experiencias durante el sueño para revelar principios generales. Los investigadores de IA deben emular dicho sistema.

Video promocional:

En la esquina inferior derecha de la diapositiva de apertura, el logo en forma de un vórtice azul redondo hace alarde. Las dos palabras al lado están impresas a continuación: DeepMind. Esta fue la primera vez que se mencionó públicamente a la empresa. Hassabis pasó más de un año intentando conseguir una invitación para la Singularity Summit. La conferencia fue su tapadera. De hecho, necesitaba un minuto con Peter Thiel, el multimillonario de Silicon Valley que financió la conferencia. Hassabis quería la inversión de Thiel.

Hassabis nunca habló sobre por qué necesitaba el apoyo de Thiel. Pero Thiel creía en AGI incluso más que Hassabis. Hablando en la Cumbre de la Singularidad en 2009, Thiel dijo que su mayor temor del futuro no era un levantamiento de robots. Estaba más preocupado de que la Singularidad no llegara pronto. El mundo necesitaba nuevas tecnologías para evitar una recesión económica.

DeepMind terminó recaudando £ 2 millones, de los cuales Thiel fue 1.4 millones. Cuando Google compró la empresa en enero de 2014 por 600 millones de dólares, Thiel y otros primeros inversores obtuvieron un rendimiento del 5.000% de su inversión.

Para muchos fundadores, este sería un final feliz. Uno podría descansar, dar un paso atrás, pasar tiempo a solas con el dinero. Para Hassabis, la adquisición de Google fue solo un paso más en su búsqueda de AGI. Pasó la mayor parte de 2013 negociando los términos del trato. DeepMind tuvo que operar por separado de su propietario. Necesitaba obtener los beneficios de ser propietaria de Google, como el acceso al flujo de caja y la potencia informática, sin perder el control.

Hassabis pensó que DeepMind podría ser un híbrido, con un motor de puesta en marcha, el cerebro de las mejores universidades y los bolsillos profundos de una de las empresas más valiosas del mundo. Se dispuso de todos los ingredientes para acelerar la llegada de la AGI y eliminar las causas del sufrimiento humano.

Hu del Sr. Hassabis

Demis Hassabis nació en el norte de Londres en 1976 en una familia china grecochipriota y nacida en Singapur. Era el mayor de tres hermanos. Su madre trabajaba en los grandes almacenes británicos John Lewis y su padre tenía una juguetería. El propio Hassabis comenzó a jugar al ajedrez a la edad de cuatro años, viendo jugar a su padre y su tío. En unas semanas ya estaba golpeando a los adultos. A la edad de 13 años, se convirtió en el segundo mejor jugador de ajedrez del mundo de su edad. A los ocho años aprendió a programar en una simple computadora.

Hassabis recibió su educación superior en 1992, dos años antes de lo previsto. Conseguí un trabajo como programador de videojuegos en Bullfrog Productions. Hassabis escribió Theme Park, en el que los jugadores crean y administran un parque de atracciones virtual. El juego fue un gran éxito y vendió 15 millones de copias, creando todo un género de juegos de simulación en los que el objetivo no era derrotar al enemigo, sino optimizar el funcionamiento de un sistema enorme y complejo como un negocio o una ciudad.

Además de crear juegos, Demis los jugó bien. Cuando era adolescente, corría de un piso a otro en competiciones de juegos de mesa, mientras competía en duelos de ajedrez, scrabble, póquer y backgammon. En 1995, mientras estudiaba informática en la Universidad de Cambridge, Hassabis compitió en el torneo de go para estudiantes. Go es un antiguo juego de mesa de estrategia que es significativamente más difícil que el ajedrez. El dominio debe requerir la intuición adquirida durante muchos años de experiencia. Nadie sabía si Hassabis había jugado Go antes.

Primero, Hassabis ganó el torneo de principiantes. Luego derrotó al ganador de los jugadores experimentados, aunque con un hándicap. Charles Matthews, el maestro del go de Cambridge que organizó el torneo, recuerda la conmoción de ser destruido por un novato de 19 años. Matthews tomó a Hassabis bajo su protección.

La inteligencia y la ambición de Hassabis siempre han sido evidentes en los juegos. Los juegos, a su vez, reavivaron su pasión por la inteligencia. Al observar su desarrollo en el ajedrez, se preguntó si las computadoras podrían programarse para aprender de la misma manera que lo hacía adquiriendo experiencia. Los juegos ofrecían un entorno de aprendizaje que no se correspondía con el mundo real. Fueron estrictos y cerrados. Dado que los juegos están separados del mundo real, se pueden practicar sin interferencias y aprender de manera eficaz. Los juegos aceleran el tiempo: los jugadores crean un sindicato del crimen en unos días y luchan en el Somme durante unos minutos.

En el verano de 1997, Hassabis viajó a Japón. En mayo de ese año, la computadora Deep Blue de IBM venció a Garry Kasparov, el campeón mundial de ajedrez. Por primera vez, una computadora venció a un gran maestro. El partido atrajo la atención de todo el mundo y generó preocupaciones sobre el creciente poder y la amenaza potencial de las computadoras. Cuando Hassabis se reunió con Masahiko Futszuvera, un maestro de juegos de mesa japonés, habló sobre planes que combinarían sus intereses en los juegos de estrategia y la inteligencia artificial: un día desarrollaría un programa de computadora para derrotar al mejor jugador de go.

Hassabis abordó su carrera metódicamente. “A la edad de 20 años, Hassabis creía que ciertas cosas tenían que estar en su lugar antes de que la inteligencia artificial pudiera llegar al nivel que necesitaba”, dice Matthews. "Él tenía un plan".

En 1998, fundó su propio estudio de juegos llamado Elixir. Hassabis se centró en un juego enormemente ambicioso, Republic: The Revolution, una compleja simulación política. Unos años antes, cuando todavía estaba en la escuela, Hassabis le había dicho a su amigo Mustafa Suleiman que el mundo necesitaba simulaciones grandiosas para modelar su compleja dinámica y resolver los problemas sociales más complejos. Ahora intentó hacerlo en el juego.

Fue más difícil codificar sus aspiraciones de lo esperado. Elixir terminó lanzando una versión simplificada del juego para obtener críticas cálidas. Otros juegos han fallado. En abril de 2005, Hassabis cerró Elixir. Matthews cree que Hassabis fundó la empresa simplemente para adquirir experiencia en gestión. Hassabis ahora solo carecía de un área importante de experiencia antes de poder comenzar su búsqueda para encontrar AGI. Tenía que entender el cerebro humano.

En 2005, Hassabis recibió su doctorado en neurociencia en la University College London. Publicó un estudio muy influyente sobre la memoria y la imaginación. Un estudio, que desde entonces ha sido citado más de 1.000 veces, mostró que a las personas con amnesia también les resulta difícil imaginar nuevas experiencias, lo que sugiere una conexión entre la memorización y las imágenes mentales. Hassabis desarrolló la comprensión del cerebro necesaria para dominar la AGI. Gran parte de su trabajo se redujo a una pregunta: ¿Cómo recibe y retiene el cerebro humano conceptos y conocimientos?

Hassabis estableció formalmente DeepMind el 15 de noviembre de 2010. La declaración de misión de la compañía era la misma que ahora: "resolver la inteligencia" y luego usarla para resolver todo lo demás. Como dijo Hassabis en la Singularity Summit, esto significa traducir nuestra comprensión de cómo el cerebro realiza tareas en un software que puede usar los mismos métodos para enseñar.

Hassabis de ninguna manera afirma que la ciencia haya comprendido completamente la mente humana. El plan para implementar AGI fue imposible de aprender de cientos de estudios de neurociencia. Pero él cree claramente que es muy posible comenzar a trabajar en AGI de la manera que le atrae. Sin embargo, también es posible que su confianza triunfe sobre la realidad. Todavía sabemos muy poco con certeza sobre cómo funciona realmente el cerebro. En 2018, un equipo de investigadores australianos cuestionó los propios hallazgos de Hassabis. Por supuesto, este es solo un documento, pero muestra que la ciencia detrás del trabajo de DeepMind está lejos de ser probada.

Suleiman y Shane Legg, un neozelandés obsesionado con AGI a quien Hassabis también conoció en la universidad, se unieron como cofundadores. La reputación de la empresa creció rápidamente. Hassabis floreció. "Atrae como un imán", dice Ben Faulkner, ex ejecutivo de Deep Mind. Muchos reclutas proceden de Europa. Quizás el mayor logro de DeepMind fue reclutar activamente a personas talentosas desde el principio y retener a los mejores y más brillantes de ellos.

Una de las técnicas de aprendizaje automático en las que se ha centrado la empresa surgió de la doble pasión de Hassabis por los juegos y la neurociencia: el aprendizaje por refuerzo. Dicho programa está diseñado para recopilar información sobre el medio ambiente y luego aprender de él, reproduciendo su experiencia una y otra vez, tal como Hassabis describió la actividad cerebral durante el sueño en su conferencia en la Singularity Summit.

El aprendizaje por refuerzo comienza con una pizarra limpia. Al programa se le muestra un entorno virtual del que no conoce nada excepto las reglas, como un simulador de ajedrez o un videojuego. El programa contiene al menos un componente conocido como red neuronal. Consiste en capas de estructuras computacionales que examinan la información para identificar características o estrategias específicas. Cada capa explora el entorno en su propio nivel de abstracción. Al principio, estas redes tienen un éxito mínimo, pero sus errores, y esto es importante, también están codificados en ellas. Gradualmente, se vuelven más y más inteligentes, experimentando con diferentes estrategias y recibiendo recompensas si tienen éxito. Si el programa mueve la pieza de ajedrez y, como resultado, pierde la partida, no volverá a cometer ese error. Gran parte de la magia de la inteligencia artificial radica en la velocidad con la que repite estas tareas.

norte

El trabajo de DeepMind culminó en 2016 cuando el equipo desarrolló un programa de inteligencia artificial que utilizaba el aprendizaje por refuerzo junto con otros métodos de juego. El programa, llamado AlphaGo, levantó las cejas después de vencer al campeón mundial en un partido de cinco juegos en Seúl en 2016. La victoria de la máquina, que fue vista por 280 millones de personas, ocurrió diez años antes de lo que predijeron las máquinas. Al año siguiente, una versión mejorada de AlphaGo derrotó al campeón chino de Go.

Al igual que Deep Blue en 1997, AlphaGo cambió la percepción del logro humano. Los campeones humanos, las mentes brillantes del planeta, ya no estaban en la cima de la pirámide intelectual. Casi 20 años después de que Hassabis anunciara sus ambiciones a Fuzuvere, las cumplió. Hassabis dijo que este partido lo hizo llorar. Estaba agradecido con Matthews.

DeepBlue ganó gracias a la fuerza bruta y la velocidad computacional, pero el estilo de AlphaGo se sintió artístico, casi humano. Su elegancia y sofisticación, la superioridad del poder computacional, parecían mostrar que DeepMind estaba por delante de la competencia en la creación de un programa que podía curar enfermedades y administrar ciudades.

DeepMind e inteligencia artificial

Hassabis siempre ha dicho que DeepMind cambiará el mundo para mejor. Pero no hay certeza sobre AGI. Si alguna vez aparece, no sabemos si será para bien o para mal, si se someterá al control humano. Si es así, ¿quién llevará las riendas?

Desde el principio, Hassabis intentó defender la independencia de DeepMind. Siempre insistió en que DeepMind se quedara en Londres. Cuando Google compró la empresa en 2014, la cuestión del control se volvió más urgente. Hassabis no necesitaba vender DeepMind a Google. Con suficiente dinero en efectivo en la mano, esbozó un modelo de negocio en el que la empresa desarrollaría juegos para financiar la investigación. Prometieron mucho dinero en Google, pero él no quería transferir la empresa que crió. Como parte del trato, DeepMind creó un acuerdo que evitaría que Google tomara unilateralmente el control de la propiedad intelectual de la empresa. En el año previo a la adquisición, las fuentes dicen que ambas partes firmaron un acuerdo: el Acuerdo de Ética y Seguridad. Este acuerdo fue redactado por abogados senior en Londres.

El acuerdo transfiere el control de la tecnología central de AGI DeepMind, si la hubiera, a la Junta de Gobierno de Ética. Según la misma fuente, el Consejo de Ética no es de ninguna manera una concesión cosmética de Google, sino que proporciona a DeepMind un sólido apoyo legal para mantener el control de su tecnología más valiosa y potencialmente más peligrosa. Los nombres de los comisionados no se han publicado, pero otra fuente cercana tanto a DeepMind como a Google dijo que los tres fundadores de DeepMind están en la junta. La propia empresa no revela nada.

Hassabis puede determinar el destino de DeepMind de otras formas. Uno de ellos es la devoción. Los empleados, antiguos y actuales, dicen que el programa de investigación de Hassabis es una de las mayores fortalezas de DeepMind. Su programa, que ofrece un trabajo importante y emocionante sin la presión de la academia, ha atraído a cientos de los expertos más talentosos del mundo. DeepMind tiene oficinas subsidiarias en París y Albert. Muchos empleados se sienten más conectados con Hassabis y su misión que con su empresa matriz, que solo quiere ingresos. Mientras Hassabis mantenga la lealtad personal, tiene un poder considerable sobre su único accionista. Es mejor dejar que el talento trabaje para DeepMind de forma remota que terminar en Facebook o Apple.

DeepMind tiene otra fuente de apalancamiento, aunque requiere una reposición constante: halo auspicioso. La empresa lo ha conseguido. AlphaGo fue un gran anuncio. Desde la adquisición de Google, la compañía ha producido milagros repetidamente que han atraído la atención mundial. Un ejemplo de software puede detectar patrones de exploración ocular que son indicadores de degeneración macular. Otro programa aprendió a jugar al ajedrez desde cero, utilizando una arquitectura similar a AlphaGo, y se convirtió en el mejor jugador de todos los tiempos después de solo nueve horas de jugar consigo mismo. En diciembre de 2018, AlphaFold demostró ser más preciso que sus competidores al predecir la estructura tridimensional de las proteínas a partir de una lista de compuestos que potencialmente podrían tratar enfermedades como el Parkinson y el Alzheimer.

DeepMind está especialmente orgulloso de los algoritmos que ha desarrollado para calcular las soluciones de refrigeración más eficientes para los centros de datos de Google, que contienen aproximadamente 2,5 millones de servidores informáticos. En 2016, DeepMind dijo que había reducido la factura de electricidad de Google en un 40%. Pero algunos expertos dicen que este alarde es exagerado. Google ha utilizado algoritmos para optimizar sus centros de datos mucho antes de que apareciera DeepMind. Se cree que DeepMind exagera sus méritos para ganar valor a los ojos de Alphabet. Alphabet, la empresa matriz de Google, paga a DeepMind por servicios similares. En 2017, este último emitió una factura a Alphabet por £ 54 millones. Estos números palidecen en comparación con los gastos generales de DeepMind. Ese mismo año, gastó £ 200 millones en personal. Generalmente,en 2017, DeepMind perdió 282 millones de libras.

Eso es un centavo para un gigante rico. Pero otras subsidiarias de Alphabet llamaron la atención de Ruth Porat, la tacaña CFO de Alphabet. Google Fiber, un intento de construir un proveedor de servicios de Internet, se suspendió después de que quedó claro que la inversión tardaría décadas en amortizarse. Los investigadores de IA también se preguntan si DeepMind se arruinará.

La divulgación progresiva de los avances de DeepMind en IA es parte de una estrategia que construye gradualmente la reputación de la empresa. Esto es especialmente valioso en un momento en que Google está acusado de violar la privacidad del usuario y difundir noticias falsas. DeepMind también tiene la suerte de contar con un partidario del más alto nivel: Larry Page, uno de los dos fundadores de Google, ahora director ejecutivo de Alphabet. Paige está muy cerca de Hassabis. El padre de Page, Karl, estudió redes neuronales en la década de 1960. Al principio de su carrera, Page dijo que creó Google únicamente para fundar una empresa de inteligencia artificial.

El estrecho control de DeepMind sobre la prensa no está en consonancia con el espíritu académico que impregna la empresa. Algunos académicos se quejan de que les resulta difícil publicar su trabajo: tienen que superar capas de aprobación interna antes de poder enviar un artículo a una conferencia o revista. DeepMind cree que es necesario proceder con cautela para no asustar al público con la perspectiva de AGI. Pero las acusaciones demasiado duras pueden arruinar la atmósfera académica y debilitar la lealtad de los empleados.

Cinco años después de la adquisición de Google, la cuestión de quién controla DeepMind se vuelve crítica. Los fundadores y los primeros empleados de la empresa se están acercando al umbral en el que pueden retirarse con la compensación financiera que recibieron por la compra de la empresa (las acciones de Hassabis probablemente valen alrededor de 100 millones de libras). Pero una fuente cercana a la compañía sugiere que Alphabet ha retrasado los pagos a los fundadores durante varios años. Dado su implacable enfoque, es poco probable que Hassabis salte del barco. Le interesa el dinero sólo en la medida en que le ayude a acercarse a la meta de toda su vida. Pero algunos de mis colegas se fueron. Tres ingenieros de inteligencia artificial han dejado la empresa desde principios de 2019. Ben Laurie, uno de los ingenieros de seguridad más distinguidos del mundo, está de regreso en Google. Esto ciertamente no es muchoPero DeepMind ofrece una misión tan asombrosa y una paga decente que nadie debería irse.

Hasta ahora, Google no ha molestado realmente a DeepMind. Pero un acontecimiento reciente ha suscitado preocupaciones sobre cuánto tiempo podrá la empresa mantener su independencia.

DeepMind, Medicina e Inteligencia Artificial

DeepMind siempre ha planeado utilizar IA para mejorar la atención médica. En febrero de 2016, se creó una nueva división de DeepMind Health, dirigida por Mustafa Suleiman, uno de los cofundadores de la compañía. Suleiman, cuya madre era enfermera, esperaba crear un programa llamado Streams que alertara a los médicos cuando la salud de un paciente se estaba deteriorando. DeepMind sería recompensado en función de las métricas. Debido a que este trabajo requería acceso a información confidencial del paciente, Suleiman estableció un Panel de Revisión Independiente (IRP) que reclutó buenos profesionales de la salud y la tecnología ingleses. DeepMind fue lo suficientemente inteligente como para tener cuidado. Posteriormente, el Comisionado de Información británico descubrió que uno de los socios del hospital había violado la ley al procesar datos de pacientes. Sin embargo, a fines de 2017, Suleiman había firmado acuerdos con cuatro hospitales importantes.

El 8 de noviembre de 2018, Google anunció la creación de su propia división de salud: Google Health. Cinco días después, se anunció que DeepMind Health se uniría a los esfuerzos de la empresa matriz. DeepMind no ha sido advertido. Según la información obtenida de las solicitudes de FOI, solo notificó a los hospitales asociados del cambio con tres días de anticipación. DeepMind se negó a revelar cuándo comenzaron las discusiones sobre la fusión, pero dijo que el corto tiempo entre el aviso y el anuncio público era en interés de la transparencia. En 2016, Suleiman escribió que "los datos de los pacientes nunca se asociarán con cuentas, productos o servicios de Google". Su promesa parecía haberse roto.

La anexión de Google enfureció a los empleados de DeepMind Health. Más empleados planean dejar la empresa después de que se complete el proceso de adquisición, según personas cercanas al equipo de atención médica.

Este episodio muestra que las partes periféricas del trabajo de DeepMind son vulnerables a Google. DeepMind declaró que "todos estuvimos de acuerdo en que tiene sentido combinar estos esfuerzos en un esfuerzo colaborativo con mayores recursos". Esto plantea la pregunta de si Google aplicará la misma lógica al trabajo de DeepMind en AGI.

A gran escala, DeepMind ha logrado grandes avances. Ella ya ha creado un software que puede aprender a realizar tareas a un nivel sobrehumano. Hassabis a menudo se refiere a Breakout, un videojuego para la consola Atari. El jugador controla un murciélago que puede moverse horizontalmente y con su ayuda hace rebotar las bolas, dirigiéndolas a los bloques de arriba, que se destruyen en caso de colisión. El jugador gana cuando se destruyen todos los bloques. Pierde si la pelota cae más allá de la plataforma. Sin instrucción humana, DeepMind no solo aprendió a jugar, sino también a lanzar bolas al espacio detrás de los bloques para aprovechar el rebote. Esto demuestra el poder del aprendizaje reforzado y los poderes sobrenaturales de los programas de computadora de DeepMind.

La demostración es ciertamente impresionante. Pero Hassabis guarda silencio sobre algo. Si la plataforma virtual se eleva incluso un poco más, el programa cometerá un error. La habilidad que ha adquirido DeepMind es tan limitada que no puede responder ni siquiera a pequeños cambios en el entorno que un ser humano podría superar fácilmente. Pero hay muchas sutilezas en el mundo. Para la inteligencia diagnóstica, no hay dos órganos del cuerpo iguales. Para la inteligencia mecánica, dos motores similares nunca serán iguales en el ajuste. Por lo tanto, lanzar programas a la naturaleza es difícil.

Una segunda cosa de la que DeepMind rara vez habla es que el éxito en entornos virtuales depende de tener una función de recompensa: una señal que permite al software medir su progreso. El programa aprende que rebotar en la pared trasera aumenta su puntuación. Gran parte del trabajo de DeepMind con AlphaGo ha sido crear una función de recompensa que sea compatible con un juego tan complejo. Desafortunadamente, el mundo real no ofrece recompensas simples. El progreso rara vez se mide en puntos individuales. El cerebro humano recibe una señal sobre el éxito de la tarea justo en el proceso de implementación, y no después.

DeepMind ha descubierto una manera de solucionar esto mediante el uso de cantidades masivas de potencia de procesamiento. AlphaGo ha estado jugando durante miles de años de tiempo humano para aprender algo. Muchos filósofos de la IA sospechan que esta solución es inaceptable para tareas que ofrecen recompensas más débiles. DeepMind reconoce tales ambigüedades. Recientemente tomó StarCraft 2, un juego de estrategia para computadora. Las decisiones que se toman al comienzo del juego tienen consecuencias que aparecen más tarde, lo cual es bastante característico de la retroalimentación tortuosa y tardía de los problemas reales. En enero, el software de DeepMind venció a algunos de los mejores jugadores del mundo y fue bastante impresionante a pesar de las estrictas restricciones. Los programas también han comenzado a explorar las funciones de recompensa siguiendo los comentarios de las personas. Pero incluir instrucciones humanas en un bucle crea el riesgo de perder escala y velocidad.

Tanto los investigadores actuales como los anteriores de DeepMind y Google, bajo condición de anonimato, han expresado su escepticismo de que DeepMind pueda lograr AGI utilizando tales métodos. Para ellos, el deseo de lograr un alto rendimiento en entornos simulados dificulta la solución del problema de la función de recompensa. Sin embargo, este mismo enfoque está en el corazón de DeepMind. Existe competencia interna dentro de una empresa donde los programas de equipos competidores compiten por la supremacía.

Hassabis siempre ha visto la vida como un juego. Gran parte de su carrera la ha dedicado a hacerlos, la mayor parte de su tiempo libre lo ha pasado jugando. En DeepMind, los usa para desarrollar una poderosa inteligencia artificial. Al igual que su software, Hassabis aprende de su propia experiencia. La búsqueda de AGI puede conducir en última instancia a un callejón sin salida, inventando tecnología médica útil en el camino y dominando a los mejores jugadores en su habilidad. Pero también puede crear AGI justo debajo de las narices de Google, pero fuera de su control. Y si logra hacerlo, Demis Hassabis ganará la partida más difícil de todas.

Ilya Khel

Recomendado: