A mí háblame en lenguaje natural

El uso del lenguaje natural ha sido tradicionalmente una de las grandes asignaturas pendientes de la informática en general y de la Inteligencia Artificial en particular. En principio, incluso los canis son capaces de comunicarse verbalmente con mayor o menor eficacia, de modo que parece una aspiración muy razonable el que algo que pretenda ser considerado inteligente sea capaz, por lo menos, de hablar.

Con todo, parece que últimamente se le empieza a dar más importancia a la interacción natural y fluida con los ordenadores, y un paso más en este sentido podría ser Wolfram Alpha, un motor computacional que en teoría será capaz de proporcionar respuestas exactas a preguntas que le sean formuladas en lenguaje natural. La revolución viene precisamente de que, hasta la fecha, para resolver una pregunta necesitamos encontrar el documento en que esté escrita su respuesta. Lo cual a veces puede ser complicado.

La clave de este sistema reside doblemente en la interpretación del lenguaje: por un lado necesita entender la pregunta que realiza el usuario. Por otro, necesitará mantener una base de conocimiento obtenido fundamentalmente de Internet, para lo cual es necesario a su vez procesar el contenido textual de los documentos de la red. Que es la madre del cordero.

De este tipo de cosillas se encarga una disciplina que denominamos Recuperación de la Información (Information Retrieval o IR en inglés), que abarca desde la informática a la documentación, pasando por la lingüística o la semiótica, cuyo principal cometido es tratar de encontrar formas de obtener conocimiento de bases de datos no estructuradas, como Internet. Sin embargo, el análisis de esta información es tan complejo que en un momento dado se pensó que sería más fácil que los humanos estructuraran correcta y formalmente su información que pretender que una máquina obtuviera datos de esa maraña caótica que es la red.

Más o menos así nació el concepto de web semántica, o lo que algunos llaman ya web 3.0 (vamos a tener tontería para rato). Para que lo entendamos, la idea es que si escribo mis datos de contacto en mi página web lo haga con un formato específico, de manera que incluso una máquina pueda entender que esa porción de información es mi tarjeta de visita y sea capaz, por ejemplo, de extraer mi teléfono automáticamente y ofrecer al usuario llamarme.

Y de momento, esto es lo mejor que se nos ha ocurrido para mejorar la forma en podemos obtener información de Internet. Sin embargo, el paso que habría dado esta gente con su motor de conocimiento supondría que podemos prescindir de adaptarnos a las máquinas y podemos hacer que las máquinas de adapten a nosotros. Ahí es nada.

Hace tiempo que Powerset, hoy propiedad de Microsoft, presentó un buscador muy interesante en la misma línea. Hoy lo recordé y estuve jugando un rato. Tiene sus lagunas, pero en general no funciona nada mal. Sin duda es un planteamiento tan prometedor como su tecnología…

Es de suponer que si esto sigue evolucionando de esta manera, la Inteligencia Artificial dará un paso adelante y la menospreciada inteligencia humana dará varios hacia atrás: ya ni siquiera será necesario saber buscar información, sólo preguntarla :-P

También es posible que sólo estemos ante humo. En informática es por desgracia tan frecuente que hasta tenemos una palabra específica para ese tipo de productos: vaporware.

Encontré este interesante artículo en Menéame.

¿Qué es el tiempo?

Hace ya más de tres años escribí un artículo sobre un programa de Redes, en el que trataron ciertos aspectos relativos a la memoria humana y a cómo está relacionada con nuestra percepción del tiempo. Los científicos parecen estar de acuerdo en que sentimos que el tiempo pasa más despacio cuando lo llenamos de experiencias novedosas, lo que explica por ejemplo por qué sentimos que los días pasan más rápido conforme nos hacemos mayores (snif), o por qué recordamos hechos traumáticos como una duración mayor de la que en realidad tuvieron.

Últimamente he invertido algunos ratos libres en ponerme al día con Redes, aprovechando que ahora publican los programas en su blog y no hay que estar despierto hasta las dos de la madrugada. En su programa número 20 titulado «Qué es el tiempo» entrevistaron a David Eagleman, director del Laboratorio para la Percepción y la Acción de la Escuela Médica de la Universidad de Texas.

La principal consecuencia que se puede extraer de sus estudios es que el cerebro obtiene información de muchos sentidos a velocidades muy distintas, y necesita hacer cierto trabajo para unir todas estas percepciones en una sola. En la entrevista, Eagleman pone un ejemplo que me parece muy significativo:

En los primeros tiempos de la televisio?n, los ingenieros estudiaban co?mo se podi?an enviar las sen?ales de audio y las visuales, y asegurarse de que estuvieran sincronizadas. Lo que descubrieron por casualidad es que no es necesario que este?n sincronizadas porque hay una ventana de una de?cima de segundo en la que las sen?ales pueden estar desfasadas pero el cerebro de los espectadores las sincronizara?.

Es decir, que nuestra percepción de la vida siempre va un poco por detrás de la realidad. Pero hay más:

La consecuencia es que cuando pensamos que se produce el «momento ahora», el «momento ahora» ya sucedio? hace mucho tiempo y las sen?ales cerebrales se han ido moviendo, hemos tenido que recopilar toda la informacio?n, compararla y entonces es cuando vemos el «momento ahora».

En el programa dan algunas pistas prácticas para entender todo esto y pillar a nuestro propio cerebro haciendo de las suyas. Por ejemplo, cuando nos ponemos frente a un espejo y miramos nuestro ojo izquierdo y el derecho alternativamente, nunca vemos nuestros propios ojos moverse. O cuando nos observamos las manecillas de un reloj, a veces nos parece que el primer segundo tarda un poco más en transcurrir…

Hoy me he tomado el día libre. Quizá sea el primero en varios meses, pero no podía haberlo elegido mejor. Hace un tiempo maravilloso. Hoy las horas están pasando lentas, llenas de experiencias olvidadas por culpa del invierno y del trabajo, la mayoría de ellas tan sencillas como dar un paseo, cocinar despacio, sentarse a escribir sobre lo que quieres o simplemente pensar.

Actualización: En los comentarios Trebol-a me da el soplo de que en el canal RSS de blip.tv están disponibles los archivos con los programas en formato mov, de manera que pueden descargarse :-) ¡Gracias!