De copas con Wolfram Alpha

Hace un tiempo escribí un artículo sobre el procesamiento del lenguaje natural en el que hacía mención a algunos motores de búsqueda que habían dado pasos importantes en este sentido. Todo aquello venía como consecuencia del anuncio del lanzamiento de Wolfram Alpha, un buscador que prometía un salto cualitativo en la forma de buscar información en Internet.

Lo cierto es que creo que ni ellos explicaron muy bien lo que habían hecho ni yo entendí bien lo poco que habían explicado, lo cual no impide que el resultado siga siendo absolutamente espectacular. Más que un sistema experto en el manejo del lenguaje natural y la recuperación de información, como parecía sugerirse en un principio, han desarrollado una herramienta que permite obtener información de una base de conocimiento de forma similar a como se hace en un buscador tradicional. La diferencia es que el resultado a una consulta no son las páginas en las que se puede obtener la respuesta, sino la respuesta en sí, y que el conocimiento es introducido de forma controlada en el sistema –es decir, no se obtiene automáticamente rastreando documentos en Internet–.

Para ver un poco las posibilidades del invento el otro día estuve haciendo algunas pruebas, y lo cierto es que estoy impresionado. No voy a extenderme mucho porque hay ejemplos para aburrir, pero por dar una idea, podemos preguntarle por el «ahora» y nos devolverá la fecha y la hora actual, las horas del amanecer y el anochecer y hasta un reloj (los enlaces de las imágenes abren la búsqueda correspondiente):

Más cosas. Viniendo de la gente de Wolfram, no podían fallar las matemáticas. Por poner sólo un ejemplo entre miles, puede resolver integrales indefinidas:

Además de en matemáticas, física, ingeniería y demás familia, es bastante potente en cuanto a geografía. Así, es posible buscar información sobre ciudades o países, o por ejemplo, obtener los terremotos cerca de una zona para una fecha determinada:

También ofrece datos climáticos pasados y la previsión meteorológica para los próximos días:

Otra de las operaciones que permite es la de comparar conceptos. Por ejemplo, tres idiomas:

Y también resuelve consultas menos… convencionales: ¿he bebido demasiado como para conducir? Si te sorprendes a ti mismo preguntando a un ordenador, la respuesta probablemente sea afirmativa.

¿Conclusiones? Pues como todo tendrá sus carencias, pero la idea y el resultado son excepcionales. La forma de recuperar la información es muy sencilla y rápida, y los resultados son muy completos, especialmente los relativos a ciencias e ingeniería –supongo que son las áreas que más se prestan a este tipo de herramientas– así que creo que nos vamos a llevar muy bien :-)

Quizá lo único que me plantea dudas es si será necesaria demasiada intervención humana para mantener o actualizar el conocimiento del sistema, porque por ejemplo, hay áreas sin desarrollar todavía… quizá esto pueda suponer un problema a la larga. Sea lo que sea, el tiempo lo dirá. Porque se lo he preguntado a Wolfram Alpha y él tampoco lo sabe.

A mí háblame en lenguaje natural

El uso del lenguaje natural ha sido tradicionalmente una de las grandes asignaturas pendientes de la informática en general y de la Inteligencia Artificial en particular. En principio, incluso los canis son capaces de comunicarse verbalmente con mayor o menor eficacia, de modo que parece una aspiración muy razonable el que algo que pretenda ser considerado inteligente sea capaz, por lo menos, de hablar.

Con todo, parece que últimamente se le empieza a dar más importancia a la interacción natural y fluida con los ordenadores, y un paso más en este sentido podría ser Wolfram Alpha, un motor computacional que en teoría será capaz de proporcionar respuestas exactas a preguntas que le sean formuladas en lenguaje natural. La revolución viene precisamente de que, hasta la fecha, para resolver una pregunta necesitamos encontrar el documento en que esté escrita su respuesta. Lo cual a veces puede ser complicado.

La clave de este sistema reside doblemente en la interpretación del lenguaje: por un lado necesita entender la pregunta que realiza el usuario. Por otro, necesitará mantener una base de conocimiento obtenido fundamentalmente de Internet, para lo cual es necesario a su vez procesar el contenido textual de los documentos de la red. Que es la madre del cordero.

De este tipo de cosillas se encarga una disciplina que denominamos Recuperación de la Información (Information Retrieval o IR en inglés), que abarca desde la informática a la documentación, pasando por la lingüística o la semiótica, cuyo principal cometido es tratar de encontrar formas de obtener conocimiento de bases de datos no estructuradas, como Internet. Sin embargo, el análisis de esta información es tan complejo que en un momento dado se pensó que sería más fácil que los humanos estructuraran correcta y formalmente su información que pretender que una máquina obtuviera datos de esa maraña caótica que es la red.

Más o menos así nació el concepto de web semántica, o lo que algunos llaman ya web 3.0 (vamos a tener tontería para rato). Para que lo entendamos, la idea es que si escribo mis datos de contacto en mi página web lo haga con un formato específico, de manera que incluso una máquina pueda entender que esa porción de información es mi tarjeta de visita y sea capaz, por ejemplo, de extraer mi teléfono automáticamente y ofrecer al usuario llamarme.

Y de momento, esto es lo mejor que se nos ha ocurrido para mejorar la forma en podemos obtener información de Internet. Sin embargo, el paso que habría dado esta gente con su motor de conocimiento supondría que podemos prescindir de adaptarnos a las máquinas y podemos hacer que las máquinas de adapten a nosotros. Ahí es nada.

Hace tiempo que Powerset, hoy propiedad de Microsoft, presentó un buscador muy interesante en la misma línea. Hoy lo recordé y estuve jugando un rato. Tiene sus lagunas, pero en general no funciona nada mal. Sin duda es un planteamiento tan prometedor como su tecnología…

Es de suponer que si esto sigue evolucionando de esta manera, la Inteligencia Artificial dará un paso adelante y la menospreciada inteligencia humana dará varios hacia atrás: ya ni siquiera será necesario saber buscar información, sólo preguntarla :-P

También es posible que sólo estemos ante humo. En informática es por desgracia tan frecuente que hasta tenemos una palabra específica para ese tipo de productos: vaporware.

Encontré este interesante artículo en Menéame.