Buscar

La Inteligencia Artificial de Google ahora da respuestas, no solo resultados de búsqueda

Prueba a preguntarle a la aplicación de búsqueda de Google ‘¿Cuál es el pájaro más rápido de la Tierra?’, y te lo dirá. ‘Halcón peregrino‘, dice el teléfono. Según YouTube, el halcón peregrino tiene una velocidad máxima registrada de 389 kilómetros por hora.

La Inteligencia Artificial de Google ahora da respuestas, no solo resultados de búsqueda
Google Inteligencia Artificial.
Google Inteligencia Artificial.

Firma

Alberto Vázquez

Alberto Vázquez

Estudió Física e Informática en la Universidad de A Coruña. Trabajó en los departamentos de sistemas informáticos de empresas como Fadesa, Gas Natural e Inditex. Actualmente dirige su propio proyecto empresarial: Openinnova. Colaborador de MUNDIARIO.

Esa es la respuesta correcta, pero no proviene de alguna base de datos maestra dentro de Google. Cuando haces la pregunta, el motor de búsqueda de Google señala un vídeo de YouTube que describe las cinco aves más rápidas del planeta y luego extrae la información que estás buscando.

No menciona esos otros cuatro pájaros. Y responde de manera similar a si preguntas, por ejemplo, "¿Cuántos días hay en Hanukkah?" o "¿Cuánto tiempo es Totem?" El buscador sabe que Totem es un espectáculo de Cirque de Soleil, y que dura sobre dos horas y media, incluyendo un intervalo de treinta minutos.

Google responde a estas preguntas con la ayuda de redes neuronales profundas, una forma de inteligencia artificial que rehace rápidamente no sólo el motor de búsqueda de Google sino toda la compañía y, bueno, los otros gigantes de Internet, desde Facebook a Microsoft.

Las redes neuronales profundas son sistemas de reconocimiento de patrones que pueden aprender a realizar tareas específicas analizando grandes cantidades de datos. En este caso, han aprendido a tomar una oración larga o párrafo de una página relevante en la web y extraer el resultado-la información que está buscando.

Estos algoritmos de compresión de frases acaban de entrar en el motor de búsqueda. Ellos manejan una tarea que es bastante simple para los seres humanos, pero tradicionalmente ha sido bastante difícil para las máquinas. Muestran cómo el aprendizaje profundo está avanzando el arte de la comprensión del lenguaje natural, la capacidad de entender y responder al habla humana natural. "Necesitamos usar redes neuronales, o al menos esa es la única manera que hemos encontrado para hacerlo", comentan desde Google. 

Google entrena estas redes neuronales utilizando datos creados por un equipo masivo de lingüistas llamado Pygmalion.

En efecto, las máquinas de Google aprenden a extraer respuestas relevantes largas de cadenas de texto viendo cómo los humanos lo hacen, una y otra vez.

Estos cuidadosos esfuerzos muestran tanto el poder como las limitaciones del aprendizaje profundo. Para entrenar sistemas artificialmente inteligentes como este, necesitas muchos datos que han sido tamizados por la inteligencia humana. Estos tipos de datos no son fáciles ni baratos.

Entrenamiento y más entrenamiento

​Para entrenar el cerebro artificial de Google, la compañía también usan viejas historias en noticias, donde las máquinas comienzan a ver cómo los titulares sirven como breves resúmenes de los artículos más largos que siguen.

Pero por ahora, la compañía todavía necesita de un equipo de lingüistas. No sólo demuestran la compresión de oraciones, sino que en realidad etiquetan partes del habla de maneras que ayudan a las redes neuronales a entender cómo funciona el lenguaje humano.

Con una centena de lingüistas en todo el mundo, el equipo de Pygmalion produce lo que se llama "los datos dorados", mientras que las noticias serian como la "plata".

Los datos plateados siguen siendo útiles, porque hay muchos de ellos. Pero los datos dorados son esenciales.

Este tipo de IA asistida por humanos se llama aprendizaje supervisado, y hoy en día, es la única manera de funcionar de las redes neuronales.

Personas a través de Internet ya han etiquetado millones de gatos en fotos de gatos, por ejemplo, por lo que hace más fácil entrenar una red neuronal que reconoce a los gatos. Pero en otros casos, los investigadores no tienen más remedio que etiquetar los datos por sí mismos.

Para entrenar sistemas como este, se necesita un montón de datos exquisitamente tamizados por la inteligencia humana.

Este tipo de etiquetado manual no es escalable. No es el futuro. Es un trabajo increíblemente muy aburrido. Las limitaciones son aún más evidentes cuando se considera que el sistema no funcionará realmente a menos que Google emplee lingüistas en todos los idiomas.

Pero la esperanza es que compañías como Google puedan eventualmente pasar a una forma más automatizada de IA llamada aprendizaje no supervisado. Ese sera un salto cualitativo.

Sera cuando las máquinas puedan aprender de datos no etiquetados -muchas cantidades de información digital extraída de Internet y otras fuentes- y el trabajo en esta área ya está en marcha en lugares como Google, Facebook y OpenAI, la empresa de aprendizaje automático fundada por Elon Musk.

Eso está lejos. Pero se acerca el momento cada vez a mayor velocidad. Hoy en día, la IA todavía necesita un Pygmalion.