A mí háblame en lenguaje natural

El uso del lenguaje natural ha sido tradicionalmente una de las grandes asignaturas pendientes de la informática en general y de la Inteligencia Artificial en particular. En principio, incluso los canis son capaces de comunicarse verbalmente con mayor o menor eficacia, de modo que parece una aspiración muy razonable el que algo que pretenda ser considerado inteligente sea capaz, por lo menos, de hablar.

Con todo, parece que últimamente se le empieza a dar más importancia a la interacción natural y fluida con los ordenadores, y un paso más en este sentido podría ser Wolfram Alpha, un motor computacional que en teoría será capaz de proporcionar respuestas exactas a preguntas que le sean formuladas en lenguaje natural. La revolución viene precisamente de que, hasta la fecha, para resolver una pregunta necesitamos encontrar el documento en que esté escrita su respuesta. Lo cual a veces puede ser complicado.

La clave de este sistema reside doblemente en la interpretación del lenguaje: por un lado necesita entender la pregunta que realiza el usuario. Por otro, necesitará mantener una base de conocimiento obtenido fundamentalmente de Internet, para lo cual es necesario a su vez procesar el contenido textual de los documentos de la red. Que es la madre del cordero.

De este tipo de cosillas se encarga una disciplina que denominamos Recuperación de la Información (Information Retrieval o IR en inglés), que abarca desde la informática a la documentación, pasando por la lingüística o la semiótica, cuyo principal cometido es tratar de encontrar formas de obtener conocimiento de bases de datos no estructuradas, como Internet. Sin embargo, el análisis de esta información es tan complejo que en un momento dado se pensó que sería más fácil que los humanos estructuraran correcta y formalmente su información que pretender que una máquina obtuviera datos de esa maraña caótica que es la red.

Más o menos así nació el concepto de web semántica, o lo que algunos llaman ya web 3.0 (vamos a tener tontería para rato). Para que lo entendamos, la idea es que si escribo mis datos de contacto en mi página web lo haga con un formato específico, de manera que incluso una máquina pueda entender que esa porción de información es mi tarjeta de visita y sea capaz, por ejemplo, de extraer mi teléfono automáticamente y ofrecer al usuario llamarme.

Y de momento, esto es lo mejor que se nos ha ocurrido para mejorar la forma en podemos obtener información de Internet. Sin embargo, el paso que habría dado esta gente con su motor de conocimiento supondría que podemos prescindir de adaptarnos a las máquinas y podemos hacer que las máquinas de adapten a nosotros. Ahí es nada.

Hace tiempo que Powerset, hoy propiedad de Microsoft, presentó un buscador muy interesante en la misma línea. Hoy lo recordé y estuve jugando un rato. Tiene sus lagunas, pero en general no funciona nada mal. Sin duda es un planteamiento tan prometedor como su tecnología…

Es de suponer que si esto sigue evolucionando de esta manera, la Inteligencia Artificial dará un paso adelante y la menospreciada inteligencia humana dará varios hacia atrás: ya ni siquiera será necesario saber buscar información, sólo preguntarla :-P

También es posible que sólo estemos ante humo. En informática es por desgracia tan frecuente que hasta tenemos una palabra específica para ese tipo de productos: vaporware.

Encontré este interesante artículo en Menéame.

3 comentarios

  1. Muchísimas gracias por la forma cercana y accesible en que explicas las cosas, y por ese toque de humor :)

    Leila

Escribe tu comentario

Comment