SF restablecido y funcionando

20 de febrero de 2006

Este fin de semana no iba a poder ocuparme del blog, por estar visitando la bella ciudad de Madrid (hacía trece años que no volvía y la he encontrado mejor que nunca, a pesar de las obras). Ni podía ni quería preocuparme del blog, así que, en previsión del aluvión de visitas por parte de los lectores de CPI dejé encargado a Misslucifer (gran colaboradora y mejor amiga) que enviara un post preparado para dar la bienvenida a este selecto grupo.

Debido a problemas de comunicación y de la diferente configuración de nuestros clientes de correo, el post fue publicado con errores en los vínculos. No quise marearme con el asunto ni volver loca (más :-P) a Misslucifer, así que decidimos posponer a hoy la toma de decisiones…

El post de la discordia ya ha sido actualizado y todo vuelve a estar en orden :-) Sólo me queda agradecer a los lectores su paciencia infinita.

A Misslucifer, como es natural, le debo una cena por su inestimable ayuda y para compensarla por el mal rato que debió pasar, en parte por mi responsabilidad. ¡Gracias!

Bienvenido, mister CPI

18 de febrero de 2006

Actualización: Superados una serie de desagradables problemas técnicos, aquí dejo el post de bienvenida a CPI tal y como nuestros lectores debieron verlo. Reiteramos nuestras disculpas y aprovechamos para saludarles :-)

Supongo que estos días recibiremos la grata visita de algunos lectores de CPI (magnífica bitácora) así que quisiera darles la bienvenida a esta nuestra comunidad: Segmentation Fault.

El nuestro es un blog de corta vida, dedicado a la divulgación informática. Como CPI, tenemos un consultorio: el Consultorio SF, que ya ha resuelto algunas dudas… Aparte de aprender qué es eso del RSS, hemos aprendido qué es una cookie (y de dónde viene su nombre… no es lo que parece)

Pero sobre todo hemos dedicado posts y posts a las preciosas y abismales diferencias entre hombre y ordenador, lo que nunca podrán hacer (con algunos ejemplos prácticos). Y como sin duda hoy lo que manda es Internet, nos pareció bonito analizar las diferencias entre un coche y una ADSL, o qué narices es la verificación de palabras, y ver cómo un portátil de 100 dólares puede revolucionar el mundo que conocemos…

Feliz estancia :-)

Consultorio SF (II). Las redes neuronales

17 de febrero de 2006

Nuestro lector de honor, Patxi (¡gracias!) nos enviaba esta consulta:

Mola la consultoría. Aquí va una pregunta: ¿llegarán nunca los ordenadores a intepretar imágenes? ¿y vídeo?

Yo me quedaré perplejo el día que a un ordenador le enseñes un video y te lo explique: «se ve un hombre corriendo sobre una playa y ahora rompe una ola…» o algo equivalente.

En realidad aquí se plantean muchas preguntas, así que voy a intentar ir por partes… Nos enfrentamos a un problema decisivo: no conocemos casi nada sobre el funcionamiendo del cerebro. El acto de interpretar es una actividad muy humana, en la medida que precisa de la subjetividad y de la experiencia… tendríamos que preguntarnos cómo percibimos nosotros al hombre que corre por la playa (magnífica excusa para plantar la foto :-P) y cómo sabemos que se trata de una persona… es mucho más complejo de lo que nos parece, porque estamos acostumbrados a interpretar constantemente.

Así que, en cierto sentido, podemos responder que los ordenadores, tal como los conocemos, no serán capaces nunca de interpretar nada… la cuestión aquí es si realmente necesitamos que ellos interpreten de la misma forma en que lo hacemos nosotros… (pero no se desanimen, no todo es lo que parece)

Los ordenadores sólo son capaces de resolver, en principio, los problemas para los cuales conocemos una serie de pasos que nos llevan a su resolución. Pues bien, no existe (no se conoce) una secuencia de este tipo que haga comprender a un computador que lo que se ve en el vídeo es un perro, o una persona, y que lo haga en general (es mucho más complejo que reconocer una letra)

La respuesta tenemos que buscarla en la Inteligencia Artificial. Hay que decir que la IA no es sólo un tema de películas de ciencia-ficción: funciona y sus resultados son prometedores, pero no es la gran revolución que se creía en un principio.

Existe un tipo de computación basada en redes de neuronas. Una red de neuronas imita el funcionamiento de la mente humana: la idea es simular un montón de unidades independientes que pueden funcionar como pequeñas calculadoras, y que interactúan entre sí, tal y como lo hacen las neuronas en nuestro cerebro… puede parecer increíble, pero esto existe…

Hace unos días veíamos cómo los ordenadores pueden reconocer texto y proponíamos una solución sencilla paso a paso. Ahora bien, en cuanto se distorsionaban las letras, el programa no era capaz de comprender nada… Sin embargo, existe una forma de aplicar redes de neuronas al reconocimiento de texto, utilizando [modo experto] una red de Hopfield, que es capaz de soportar una modificación de hasta el 25% de un caracter a reconocer… ¿Cómo lo hace?

Las redes de neuronas aprenden. La forma del aprendizaje es muy parecida a la nuestra: se le da a red un conjunto de datos inicial y se le pide que de un resultado, el que sea. Si es el que esperábamos, hemos terminado. Si no, ajustamos cómo se comunican las neuronas entre ellas y volvemos a probar… es como un entrenamiento. Parece complicado, y de hecho lo es. No obstante, funciona :-)

Sabiendo esto no puedo decir que un ordenador no vaya a ser capaz nunca de reconocer a un hombre corriendo en la playa, pero desde luego que si lo llega a hacer, será mediante un mecanismo de este tipo… (De hecho, nosotros reconocemos a otro humano caminando en la distancia bastándonos sólo en cinco o seis puntos que se mueven a cierto ritmo… es fascinante)

Ahora mismo podríamos tomar una red de neuronas y entrenarla para que reconociera un hombre corriendo (esto existe, de hecho, en algunos sistemas de seguridad, aunque es bastante primitivo). También podríamos lograr que reconociera en un vídeo como rompe una ola (dosis extra de dificultad). Los límites de este tipo de estructuras no están nada claros, para bien o para mal.

El problema surge al generalizar: el querer una red que estudie un vídeo o una imagen y que identifique lo que sea, cualquier cosa, un perro, un gato, un calamar gigante o un humano… yo me atrevería a decir que no parece posible, salvo que el sistema aprenda todos los objetos que pueden aparecer: sus formas, su comportamiento y sus variantes… lo cual implicaría un entrenamiento largo, como el que podamos tener las personas… pero no veo por qué no podría hacerse.

En conclusión, considero que sí es posible que los ordenadores reconozcan fenómenos concretos en imágenes o en vídeo. Serán necesarias, eso sí, estructuras más avanzadas que la computación tradicional, y que estas estructuras hayan sido entrenadas con cierto volumen de datos. No obstante, será muy complicado que reconozcan todas las situaciones posibles sin que hayan sido previstas, tal y como hacemos nosotros, y en grados variables de detalle… Pero sin duda, más tarde o más temprano, la respuesta a la pregunta de Patxi será un S?.

Cuando aparecieron los primeros ordenadores, hubo quien dijo que jamás tendrían éxito por el increíble coste que tendrían… es mejor tener la mente abierta, uno siempre se lleva sorpresas ;-)

PD: Perdón por el post kilométrico, pero el tema lo merece…

La verificación de texto…

16 de febrero de 2006

Si es aficionado al mundo bloguero y además comenta de vez en cuando los posts, seguro que ha visto ésto más de una vez:

Como posiblemente sepa, la verificación de palabra sirve para que nadie pueda enviar publicidad, utilizando programas que manden comentarios de forma automática… ¿el truco? que sólo un humano podrá reconocer texto en esa imagen distorsionada. Es una consecuencia directa de lo que nos diferencia de los ordenadores…

Sin embargo, esto no está tan claro… la idea funciona bien en la práctica, pero con cierto esfuerzo se puede hacer que los ordenadores reconozcan texto. Por ejemplo, pongamos que escribimos un «2» de nuestro puño y letra:

¿Sí? Un bonito y gran número. Ahora pensemos en un ordenador que almacena este 2 en memoria y le superpone una cuadrícula, así:

Parece ridículo, pero acabamos de dar un gran salto: en este momento un ordenador ya puede tratar este número, no como un trazo, sino como una tabla donde una casilla puede tomar dos valores: blanco o negro (0 ó 1… qué curioso :P). Ahora, pongamos que el ordenador tiene grabado el siguiente gráfico en su memoria (y que tiene también la «tabla» con el valor de cada casilla)

Hasta aquí no hemos hecho magia… quizá el paso más complicado es que el ordenador lea la imagen original y construya la tabla con el color de cada casilla… pero es bien posible, se lo aseguro. El siguiente paso es fantástico:

Bueno, no es tan fantástico, pero ¿se imaginan qué podemos hacer ahora? Comparemos las dos tablas que tenemos en memoria, con las casillas que están a negro o a blanco… Bien, no van a coincidir todas, pero quizá sí el 80%… y si hacemos los cuadros muy muy pequeños podremos tener aun más precisión. Luego lo único que nos faltaría es hacer una comparación entre las tablas utilizando estadística… y eso sí lo sabe hacer el ordenador :)Así que nuestro estúpido armatoste de silicio terminará comprendiendo que eso que alguien escribió es, efectivamente, un «2»… Con esto tal vez pueda hacerse una idea de lo extremadamente estúpidos que son los ordenadores si los comparamos con un humano…

¿Y qué pasa entonces con la verificación de palabra? Pues fíjese atentamente en la imagen que pusimos como ejemplo antes:

Las letras están retorcidas y en contacto para despistar al ordenador. Es todo extremadamente sutil: para diferenciar las letras como la ‘t’, la ‘j’ y la ‘i’, podríamos recortar valiéndonos de los espacios en blanco, pero entonces no sabríamos separar la ‘b’, la ‘x’, la ‘z’ y la ‘a’… cualquier programa informático se haría un verdadero lío con estos trucos tan infantiles. Si no se lo cree compruébelo.

Este tipo de tecnología ha sido ampliamente estudiada, por ejemplo, para el reconocimiento de texto de los escáneres con tecnología OCR (Reconocimiento óptico de caracteres). Hoy en día no lo hacen nada mal, siempre que no se les líe a conciencia ;-)

El portátil de los cien dólares

15 de febrero de 2006

Es, desde mi punto de vista, una de esas ideas fantásticas que tiene la humanidad y que nos dejan ser optimistas… En esta ocasión se trata de este proyecto, dirigido por Nicholas Negroponte. No podría resumir aquí quién es Negroponte ni dar una idea de la influencia de su figura en el mundo de las tecnologías… toda una personalidad…

Negroponte, como digo, está al frente del proyecto OLPC (One Laptop per Child). Esta organización ha logrado diseñar un portátil (más bien lo que se viene denominando tablet PC) que tiene como objetivo costar menos de 100 dólares, para que todo lo positivo de la tecnología llegue a todos los rincones de la tierra… El ordenador tiene un diseño compacto y muy versátil, y lo que es más sorprendente: una manivela (se entiende que así podrá ser utilizado sin electricidad)

Quizá a algún lector le extrañe mi euforia con el asunto, pero es que pienso que el hecho de que alguien consiga desarrollar un equipo funcional por menos de 100$ tendrá una repercusión muy positiva en todo el mundo… Además, soy un incondicional de Negroponte :-) Es un ejemplo a seguir…

¿Internet o carretera?

14 de febrero de 2006

Ayer comentaba las diferencias entre el cerebro y un ordenador… hoy toca otra entrega de comparaciones extrañas pero curiosas…

Ignoro si alguna vez se ha planteado usted lo que voy a exponer… pero puede ser que Internet no sea tan rápido y tan maravilloso… Seguramente, usted se conecte a 56 Kbps con una línea telefónica convencional, o a cierta cantidad de megas (Mbps) a través de una ADSL. Hay más sistemas, pero hoy en día, prácticamente todo el mundo utiliza uno de estos dos…

Bien, imaginemos que quien anuncia 20 Mbps pudiera, efectivamente, proporcionarlos. Antes de nada, decir que son 20 Megabits por segundo y no 20 Megabytes por segundo. La diferencia es sutil pero importante: 1 Byte = 8 bits (la ‘B’ mayúscula se usa para el Byte y la ‘b’ minúscula para el bit, de modo que 1B = 8b*). Cuando nos dicen 20 «Megas por segundo» podemos pensar que son 20 Megabytes por segundo, pero en realidad sólo son 20 Megabits por segundo… 20/8 = 2,5; con lo cual nos quedamos en 2,5 Megabytes por segundo (2,5 MBps, con la M mayúscula)

Aclarado esto, tenemos nuestro ordenador con nuestra línea de 2,5 MBps. Suponemos que la compañía nos da todo lo que pagamos, lo cual es mucho suponer (sólo está obligada a proporcionar el 10% de lo contratado)

Imaginemos que quiero transmitir una copia de mis ficheros de Salamanca a Santander (365 Km.) y que todos mis ficheros ocupan 100 Gigabytes. No es descabellado, los bancos hacen este tipo de operaciones a menudo para garantizar la seguridad de sus datos, y los volúmenes transferidos pueden ser de Terabytes (1 TB = 1024 GB)

Con mi línea ADSL puedo transferir 2,5 Megabytes cada segundo, así que 100 GB = 102.400 Megabytes. Tardo algo más de 11 horas en transferir todo (suponiendo que no se cometen errores). Ahora imagine que copio los 100 GB en 25 DVD (1 DVD = 4 GB más o menos), los meto en el maletín y los llevo a Santander con el coche. Suponiendo que viajo a una media de 100 Km/h, lo cual implica respetar los límites de velocidad, tardo algo menos de 4 horas… ¿qué ha pasado?

Simplemente sucede que para grandes cantidades de datos, es más eficiente el transporte físico que la transferencia a través de redes… Sin embargo, llevar las copias en coche tampoco es lo mejor, porque el tiempo de respuesta es muy elevado. Si hubiera que hacer algún cambio o hubiera un error (o incluso el del coche se matara por el camino) sería necesario volver a enviarlo todo. Además, hay que grabar los DVD y poner gasolina al coche… No obstante, la lección es dramática: no subestime nunca el poder de un coche cargado de discos.

* Para los puristas, 1 byte no siempre es igual a 8 bits, pues depende de la plataforma y del equipo que utilicemos. No obstante, esta equivalencia es la más habitual…

El hombre contra la máquina

13 de febrero de 2006

Tal vez en alguna ocasión se haya preguntado qué nos diferencia de los ordenadores en nuestra forma de pensar que nos hace tan especiales a unos y a otros… Los grandes ordenadores actuales tienen una enorme potencia y una velocidad que hace sólo unos años era inconcebible… aunque, como decíamos en este artículo, máquinas son y máquinas serán…

Sintiéndolo mucho por los ordenadores, el más estúpido de los humanos es más inteligente que el mejor computador. Aunque no estemos siendo muy justos. Por ejemplo, somos mucho mejores que las máquinas realizando trabajos abstractos, como reconocer patrones y todos los que se nos plantan en los tests de inteligencia.

Por ejemplo, en la sucesión 2, 4, 6, 8, 10… rápidamente vemos que cada número es el anterior más 2, pero a un ordenador le costaría bastante más: si le diéramos varias sucesiones con un incremento cualquiera no podría en principio reconocer la forma general, salvo utilizando tanteo. La cuestión es que quizá el ordenador tarde menos en dar la respuesta por tanteo que nosotros intuitivamente…

Decía más arriba que no es muy justo porque, en sentido estricto los ordenadores no están dotados de inteligencia tal y como la conocemos, aunque hay avances muy interesantes sobre ésto. Si nos rebajamos un poco y planteamos nuestro cerebro como un tipo de sistema computacional (que nadie se rasgue las vestiduras) veremos que hay diferencias muy interesantes:

En la tabla anterior hay conceptos, como la arquitectura, que son términos heredados de la informática. Los ordenadores sólo pueden ejecutar una instrucción en cada instante de tiempo, aunque tengamos la ilusión de hacer muchas cosas a la vez… Sin embargo nosotros podemos cantar a la vez que escuchamos música, trabajamos con el ordenador y bebemos café (propia experiencia).

El número de procesadores quiere simbolizar la cantidad de elementos de cálculo. En nuestro cerebro acumulamos del orden de varios cientos de miles de millones de neuronas (incluso billones). Sin embargo los ordenadores sólo tienen, a lo sumo unas cuantas decenas de procesadores. En el caso de los PC, tienen sólo uno (aunque se pueden comprar con varios). Con este esquema, el cerebro humano puede tener varios miles de conexiones frente a las pocas que tiene un ordenador medio.

El almacenamiento es otro punto interesante. En los computadores convencionales se realiza en memoria volátil y en memoria persistente, según interese conservar los datos. El cerebro humano distribuye el almacenamiento en diferentes áreas, lo cual le hace ser mucho más resistente ante los fallos… Los accidentes pueden producirnos amnesias parciales algunas de las cuales pueden incluso recuperarse. Sin embargo, el almacenamiento computacional es enormemente delicado. Acerque un imán a un disquete, pase una lija sobre un CD… ¿se imagina que nos sucediera lo mismo? :-P

El tema de la inteligencia es muy controvertido y sin duda seguirá dando que hablar durante muchos años… Pero habrá cosas que seguiremos haciendo mejor que ellos, de la misma forma que los computadores se mueven con soltura en terrenos en los que somos manifiestamente torpes, como la simulación, el cálculo matemático, el procesamiento de grandes cantidad de datos…

Un ordenador no habría sido capaz de escribir esta entrada sin una mente diciéndole que tiene que hacer (aunque yo no lo habría publicado jamás de no ser por él…) Qué mundo éste, ¿eh?

El verdadero nombre las cookies

12 de febrero de 2006

Es increible como uno siempre aprende algo nuevo… un amable lector nos enviaba el siguiente comentario al anterior post sobre las cookies:

[…] Las cookies son esas tarjetas que te dan como recordatorio en los guardarropas de Londres. Besos a todos y todas

De modo que, en contra de lo que se suele leer, el término cookie no proviene de galleta como comentábamos en nuestro anterior post (es curioso, pero ahora que lo se, me pregunto por qué diablos me creí lo de la galleta… qué cosas…) No obstante, me da pena quitar a mi idolatrado monstruo de las galletas del post original, y la red está llena de maravillosas alegorías como ésta:

Aclarado esto, quisiera dar las gracias a nuestro anónimo y amable colaborador… y es que me maravillan estas cosas :-) Tras algunas investigaciones, parece que el origen y la traducción del término cookie no están nada claros… ¡se admiten nuevas propuestas!

La invasión de las cookies asesinas

12 de febrero de 2006

Un nombre inocente, ¿verdad? Las cookies forman parte indisoluble de nuestra existencia, aunque muchos seguimos prefiriendo las galletas de toda la vida ;-)

¿Qué es una cookie? Una «cookie» (galleta o tarta en inglés). [Actualización: esto no es del todo correcto…] no es más que un ficherito de texto que una página web puede almacenar en nuestro equipo. ¿Por qué? Pues empecemos diciendo que hasta hace unos años, la navegación era completamente estática: las páginas web mostraban información y el mayor grado de interactividad existente consistía en los clics del ratón sobre los hipervínculos… saltar de un documento a otro.

Con la popularización de Internet, las páginas web comenzaron a demandar más funcionalidad. Una parte de esa funcionalidad es la interactuación con el usuario: se mejoró el diseño, apareció la animación, el flash… Otra parte es el almacenamiento: muchas veces se hace necesario almacenar contraseñas, preferencias de visualización… Sobre esto último, el almacenamiento puede hacerse en dos sitios: en el servidor (donde está almacenada la web) o en el cliente (el que está viendo la web)

En el servidor se almacenan algunos datos críticos: nombres de usuario, contraseñas, datos personales, etc. Sin embargo, hay otros datos poco importantes que se almacenan en el cliente: el color elegido para el fondo de la web, la última búsqueda, si ya ha votado en tal o cual encuesta… este tipo de cosas. Ahora podemos preguntarnos: ¿por qué no en el servidor? Por que no parece óptimo que un servidor acumule gran cantidad de información sobre visitantes que quizá no regresen nunca… evidentemente, la solución a esto ha sido almacenar estos datos en el cliente. ¿Cómo? ¡Usando cookies! ¡Premio!

Con este panorama, y la creciente popularización de las cookies, pronto surgió una leyenda negra… imagine, ¡cualquier servidor puede escribir en nuestro ordenador! Sin embargo, hay que decir que estos ficheros apenas entrañan riesgos: estas galletas son texto plano e inofensivo. Sí que podría utilizarse en ciertas condiciones para ejecutar código en nuestro ordenador, pero esto es tan complicado (sobre todo si se usa Firefox) que no merece mucha consideración… (bueno, puedo dejarlo para otra entrega en modo experto)

De modo que, querido lector, puede dormir tranquilo: entre todas las posibilidades de intrusión de las que probablemente dispondría cualquier atacante, no figuran estas galletitas. Realmente existen muy pocos riesgos reales derivados de las cookies, y en cualquier caso, sólo representan un riesgo en su privacidad, nunca en la seguridad de su sistema.

Existe mucho software que permite gestionar y borrar las cookies. Los mismos navegadores lo permiten con relativa sencillez. Yo recomiendo el Norton Advanced Cleanup, que tiene esta pinta:

Espero haber aclarado algunos conceptos sobre estas sospechosas aunque honradas amigas que son las cookies :-) ¡Tenga una navegación segura!

Deprímase: El límite computacional

11 de febrero de 2006

Vamos a imaginar una extraña máquina… una máquina que consta de simplemente de una cinta de papel y un cabezal que sea capaz de hacer estas tres acciones:

Moverse una posición a la derecha o a la izquierda
Leer un caracter
Escribir un caracter

Parece sencillo, ¿no? Esta máquina se conoce como Máquina de Turing, en honor a su creador, Alan Turing. Y es bastante sencillo construir una. Hay quien ha optado por el Lego, aunque también podemos simular una con papel y lápiz…

Ahora agárrese a la silla: esa máquina inocente puede hacer exactamente lo mismo que su potente ordenador. Dicho de otro modo más impactante: no podrá hacer nada con su ordenador que yo no pueda hacer con mi máquina de Turing.

Piense en algo que pueda hacer con su equipo, lo más complicado… puedo jurarle que la máquina de Turing puede hacerlo. Probablemente más despacio, pero lo hará… ¿Se lo imagina? Esto no es vudú ni magia negra, sino que se debe al hecho (dramático) de que un ordenador no es más que una máquina de Turing.

Si queremos una explicación más detallada, tenemos que entender que los ordenadores no son más que unos dispositivos que computan, esto es, que calculan cosas a partir de otras cosas. Dibujar algo en una pantalla no es una tarea complicada para un ordenador, en absoluto… sus problemas vienen cuando se trata de realizar operaciones o decidir sobre problemas… de hecho, si pudieramos meter en una bolsa todos los problemas del universo, veríamos que los ordenadores sólo son capaces de resolver unos pocos… Otro día comentaré algunos problemas que los computadores convencionales jamás podrán solucionar…

El panorama es un poco deprimente… mi potente equipo no puede hacer nada que no pueda hacer la máquina de Lego que comentaba antes… esto, en teoría de computación se conoce como el «límite computacional», que delimita esa pequeña porción de problemas en los que los ordenadores se sienten cómodos… Este límite no ha cambiado, ni cambiará… los ordenadores son capaces de resolver problemas que antes no podían resolverse en un tiempo razonable, pero no hacen nada ahora que no pudieran hacer antes.

Alan Turing postuló que el poder de su máquina llegaba hasta el mismo límite computacional. Y parece que no se equivocó…

Nosololinux_

Ahora puede freír el huevo

febrero 2006

SF restablecido y funcionando

20 de febrero de 2006

Bienvenido, mister CPI

18 de febrero de 2006

Consultorio SF (II). Las redes neuronales

17 de febrero de 2006

La verificación de texto…

16 de febrero de 2006

El portátil de los cien dólares

15 de febrero de 2006

¿Internet o carretera?

14 de febrero de 2006

El hombre contra la máquina

13 de febrero de 2006

El verdadero nombre las cookies

12 de febrero de 2006

La invasión de las cookies asesinas

12 de febrero de 2006

Deprímase: El límite computacional

11 de febrero de 2006