La balsa del sentido en el mar de la (des)información – Alejandro Piscitelli*


*Piscitelli, Alejandro. 2002.Ciberculturas 2.0. En la era de las máquinas inteligentes. Paidós, Buenos Aires. Págs. 173-174.

Texto fuente - Módulo 3

El problema de la recuperación de la información (especialmente en las condiciones tormentosas de la vida real) tiene una doble dimensión problemática. Por un lado, cuanta más información existe menos fácil es encontrar lo que se busca. Pero la cosa se complica todavía más, porque lo que se busca depende materialmente de un contexto y de cierta dimensión de relevancia que es totalmente extrínseca a al información, y depende puramente de la historia de búsquedas previas (Seeley Brown y Duguin, 2000).

Cuando alguien tipea en un motor de búsqueda la palabra “impresora”, seguramente recibirá decenas o centenares de referencias a páginas con instrucciones para conectar impresoras a computadoras, pero probablemente lo que el usuario está buscando es averiguar por qué su impresora no funciona, por qué se “cuelga”, cuánto cuesta adquirir una, o si es mejor comprar una impresora láser o una de chorro de tinta bajo ciertas condiciones.

La homonimia no es precisamente un buen negocio cuando se trata de recuperar información, pero lamentablemente los motores de búsqueda viven de confundir homónimos.

Precisamente, si conocemos a un usuario individual, y si además podemos reconstruir su historia de búsquedas, entonces estaremos en una inmejorable posición para factorizar sus estrategias de búsqueda en términos de estrategias bayesianas de recuperación de la información.

Lo que más sorprende de la efectividad de las redes neuronales bayesianas es que modelizan mucho mejor la forma en que los humanos encontramos el sentido a partir de palabras no dichas y de las sutiles formas en las que hablamos, que como lo hacen los rígidos esquemas de apareamiento de expresiones literales.

Mientras que las empresas clásicas en la materia como Excalibur y Verity utilizan toneladas de lingüistas expertos durante meses para crear una taxonomía estándar de términos para cada cliente, las estrategias bayesianas apuntan a que sean los propios entramados de textos que ocurren en el lenguaje natural los que le enseñen a la computadora qué relación tienen las distintas palabras entre sí –independientemente del idioma elegido-.

Rosario, Pcia. de Santa Fe, Argentina, 28 de Marzo de 2009
Editado por María Elena Sánchez a las 08:51 PM | Palabras: [ 350 ]
Archivado en: [ Texto fuente-Módulo 3 ]
Enlace permanente | Comentarios (0)
| TrackBack (0)

Comentarios
Publicar un comentario









¿Recordar información personal?



Negrita Itálica Subrayada Blockquote Enlaces email


Atención: Para poder enviar un comentario, deberá ingresar el código que aparece en la imagen y luego oprimir el botón Publicar.






Optimizado para 800 x 600
Navegador Mozilla Firefox
Get Firefox!

Desarrollado por:
logo-adm.gif

Con la colaboración de:
logo88x25.gif

Facultad de Ciencia Política y Relaciones Internacionales
Riobamba 250 bis C.U.R.
S2000EKF Rosario - Tel. (0341) 480-8520