The 1970s librarians who revolutionised the challenge of search

Un grupo de bibliotecarios universitarios de los años 70 previeron nuestro mundo de conocimiento e investigación distribuidos, y diseñaron herramientas de búsqueda para ello

A lo largo de un otoño inusualmente soleado de 1970, cientos de estudiantes y profesores de la Universidad de Siracusa se sentaron de uno en uno ante un terminal informático de impresión (similar a una máquina de escribir eléctrica) conectado a un ordenador central IBM 360 situado al otro lado del campus, en el estado de Nueva York. Casi ninguno de ellos había utilizado nunca un ordenador, y mucho menos un sistema informático de recuperación de información. Les temblaban las manos al tocar el teclado; varios dijeron más tarde que habían tenido miedo de romper todo el sistema mientras tecleaban.

Los participantes realizaban sus primeras búsquedas en Internet, introduciendo palabras cuidadosamente elegidas para encontrar resúmenes de psicología relevantes en una base de datos totalmente nueva. Escribieron un término clave o instrucción por línea, como “Motivación” en línea 1, “Estima” en línea 2, y “L1 y L2” en línea 3 para buscar artículos que incluyeran ambos términos. Tras ejecutar la consulta, el terminal producía una impresión que indicaba cuántos documentos coincidían con cada búsqueda; los usuarios podían entonces limitar o ampliar esa búsqueda antes de generar una lista de citas de artículos. Muchos usuarios estallaron en carcajadas al ver la respuesta de un ordenador tan lejano.


El sistema informático mainframe IBM 360 con terminal de impresión. Cortesía de IBM

En una encuesta telefónica posterior, se pidió a los participantes que dijeran dos o tres palabras para describir la experiencia. De las 78 palabras totales proporcionadas, 21 eran el mismo adjetivo: “frustrante”. Los participantes tuvieron problemas para acceder al sistema y experimentaron fallos impredecibles, “resultados irrelevantes” y, sobre todo, no saber “qué palabras utilizar en una búsqueda”. Sin embargo, el sistema les pareció intrigante y emocionante (“divertido”, “minucioso”, “me encantan los ordenadores”), y el 94% afirmó que volvería a utilizar el SUPARS (Servicio de Recuperación de Resúmenes Psicológicos de la Universidad de Syracuse) si estuviera disponible. Varios se ofrecieron a mantener el experimento en marcha más allá de su fecha límite pidiendo a sus departamentos que contribuyeran a financiar el proyecto.

Este grupo de conejillos de indias académicos, en su mayoría estudiantes de postgrado en educación, psicología y biblioteconomía, formaban parte de un experimento radical de búsqueda en línea dirigido por la Facultad de Biblioteconomía de la Universidad de Siracusa. SUPARS fue uno de los muchos y ambiciosos estudios de recuperación de información que tuvieron lugar entre finales de los años 60 y mediados de los 70 en los campus universitarios de EE.UU. Varios factores provocaron el auge de esta investigación. Los avances en la capacidad de procesamiento informático en cuanto a velocidad y almacenamiento habían permitido digitalizar y poner en línea bases de datos y catálogos académicos. Los terminales informáticos eran modulares y podían colocarse en los campus para acceder de forma descentralizada a los ordenadores centrales. Y la financiación militar e industrial para la investigación informática era más abundante que nunca. Dada la oportunidad, los bibliotecarios académicos aprovecharon para explorar esta nueva y costosa tecnología. A su vez, las universidades ofrecían entornos no clasificados para colaborar con empresas tecnológicas y grupos militares; el SUPARS estaba patrocinado por el Centro de Desarrollo Aéreo de Roma, el laboratorio de las Fuerzas Aéreas estadounidenses.

Es fácil comprender por qué los bibliotecarios de la década de 1970 se propusieron revolucionar la búsqueda. El trabajo en la academia se estaba expandiendo hasta tal punto que, pronto, no habría suficientes bibliotecarios humanos para soportarlo todo. Sin embargo, para obtener la información que necesitaban, los investigadores se enfrentaban a un proceso que requería mucho tiempo y esfuerzo físico y la intervención de un bibliotecario. Aunque los investigadores académicos podían hojear los nuevos números de las revistas de su especialidad, para realizar una búsqueda centrada en todo lo anterior aún tenían que consultar a un bibliotecario de referencia para buscar los encabezamientos de materia correctos de la Biblioteca del Congreso en un manual de varios volúmenes. Armado con un conjunto de encabezamientos de materia, el investigador buscaba entonces libros en el catálogo de la biblioteca y artículos de revistas en los índices de citas, incluidas las bases de datos de suscripción como el Science Citation Index, así como bibliografías elaboradas a mano por los bibliotecarios especializados de su universidad. Por último, localizaban físicamente los libros correctos y las publicaciones periódicas encuadernadas que incluían artículos que pensaban que podían ser relevantes, si los volúmenes se encontraban en las estanterías de la biblioteca.

No es de extrañar que los participantes en el SUPARS encontraran el sistema convincente, a pesar de sus limitaciones. Y dado lo familiarizados que estaban los bibliotecarios universitarios con los retos de la búsqueda, tiene sentido que el sistema que diseñaron pasara por alto los encabezamientos de materia y los índices de citas. Lo más sorprendente es que, de todos los experimentos de búsqueda en línea que tuvieron lugar durante este periodo -incluidos los sistemas de búsqueda con fines comerciales como Dialog de Lockheed, que desde entonces se ha convertido en un producto empresarial- SUPARS imitaba la búsqueda web contemporánea más que ningún otro, prefigurando varias características principales de los protocolos de búsqueda web en los que confiamos más de 50 años después.

SUPARS y otros experimentos de búsqueda en línea que tuvieron lugar durante este periodo -incluidos los sistemas de búsqueda con fines comerciales como Dialog de Lockheed, que desde entonces se ha convertido en un producto empresarial-.

SUPARS y otros sistemas en gran parte olvidados fueron los precursores de los motores de búsqueda contemporáneos que tenemos hoy. Aunque la historia popular de Internet valoriza a los programadores de Silicon Valley -o, a veces, al ex vicepresidente de EE.UU. Al Gore-, muchos de los conceptos originales de búsqueda surgieron de científicos bibliotecarios centrados en la accesibilidad de los documentos en el tiempo y el espacio. Trabajando con fondos de investigación y desarrollo del ejército y la industria, sus avances se pueden ver por todas partes en el actual panorama de la información en línea: desde enfoques generales para la ingesta e indexación de documentos de texto completo, hasta la búsqueda de texto libre y un sofisticado algoritmo que utiliza búsquedas guardadas anteriores de otros, un componente básico para la expansión contemporánea de las consultas y el autocompletado. De hecho, estos y muchos otros enfoques desarrollados por los pioneros del campus siguen siendo utilizados hoy en día por las multimillonarias empresas de búsqueda web y bases de datos de bibliotecas comerciales, desde Google a WorldCat.

Pauline Atherton Cochrane (centro) con colegas que trabajan en las Bibliotecas de la Universidad de Siracusa en SUPARS. Foto cortesía de Syracuse Libraries Special Collections

SUPARS fue diseñado por una bibliotecaria llamada Pauline Atherton (que hoy se hace llamar Pauline Atherton Cochrane). En 1960, a la edad de 30 años y al principio de su carrera bibliotecaria, había sido la editora de referencias cruzadas de la revisión de ese año de la World Book Encyclopedia, asegurándose de que los enlaces cruzados entre los distintos artículos fueran minuciosos y precisos. En 1966, ya trabajaba en las bibliotecas de la Universidad de Siracusa y en la Escuela de Biblioteconomía, donde en 1968 demostró el primer uso de un archivo de clasificación decimal en línea para ayudar en la búsqueda (AUDACIOUS). Ese mismo año, creó el primer laboratorio de enseñanza por ordenador que integraba la búsqueda en línea en la enseñanza habitual en las aulas de la escuela de biblioteconomía (LEEP). (En el contexto del mundo anterior a Internet, “en línea” significaba establecer una conexión en red y en tiempo real entre un ordenador central y algún otro dispositivo remoto, como un terminal).

Al año siguiente, en 1969, Atherton diseñó SUPARS con su coinvestigador, Jeffrey Katzer, otro profesor de biblioteconomía de Siracusa. El objetivo principal del proyecto SUPARS era proporcionar búsquedas en línea a escala masiva para aprender todo lo posible sobre cómo buscaban los usuarios en línea, cómo se sentían al hacerlo y qué necesitaban para buscar mejor. Para ello, el equipo creó un corpus de búsqueda de contenido académico a disposición de todo el campus: más de 35.000 entradas recientes de Psychological Abstracts de la American Psychological Association. Utilizada para la indexación y recuperación en el sistema SUPARS, constituyó la primera base de datos de tamaño significativo disponible en línea en un entorno no clasificado. Aunque, obviamente, no se acercaba ni de lejos al tamaño y alcance de la búsqueda web de hoy en día, tanto el grupo de usuarios como el contenido en el que se podían realizar búsquedas eran enormes para la época.

Dos decisiones de Atherton y su equipo hicieron que SUPARS fuera realmente novedoso. En primer lugar, eliminaron todos los encabezamientos de materia de las entradas de Resúmenes Psicológicos e hicieron que todas las palabras se pudieran buscar directamente, excepto conectores como “y” y artículos como “a” o “el”. Esto convirtió a SUPARS en el primer sistema en el que un amplio texto libre estaba disponible en línea tanto para la búsqueda como para la salida. (Titularon su informe final “Evaluación de la recuperación de texto libre”.) En segundo lugar, guardaron cada búsqueda SUPARS en una base de datos paralela que podía consultarse junto con los propios resúmenes, lo que convirtió a SUPARS en el primer experimento que permitía a los usuarios acceder y utilizar búsquedas anteriores para encontrar términos o enfoques alternativos.

SUPARS prefiguró la búsqueda en la web dando a los usuarios la posibilidad de buscar texto libre directamente en los propios documentos

Cada una de estas funciones habría sido novedosa por sí sola, pero para contextualizar lo adelantada que estaba la combinación, merece la pena observar cómo funcionan hoy los servicios de búsqueda en Internet. Google, Bing y otros motores de búsqueda indexan las páginas web utilizando dos componentes principales: los rastreadores buscan nuevas páginas y vuelven a rastrear periódicamente las páginas ya encontradas; los analizadores sintácticos analizan el contenido de las páginas y almacenan la información resultante, incluido todo el texto libre, en una base de datos interna. Cuando un usuario introduce una consulta de búsqueda, Google intenta hacer coincidir las palabras y frases de la consulta con las páginas de su base de datos y ofrecer al usuario los resultados más relevantes.

Además de las palabras y frases de la consulta, los analizadores sintácticos analizan el contenido de las páginas.

Además de las palabras que introducen los propios buscadores, los algoritmos de búsqueda web actuales también tienen en cuenta otros términos estrechamente relacionados con los de la consulta de búsqueda, incluidos los sinónimos (por ejemplo, si se busca “bicicleta” se obtienen resultados de “bicicleta” y “ciclo”) y otras palabras directamente relacionadas.

La mayoría de los buscadores tienen en cuenta las palabras y frases que aparecen en la consulta de búsqueda.

La mayoría de los motores de búsqueda también incluyen palabras que formaban parte de consultas similares realizadas por otras personas, que pasan a formar parte de los tesauros internos utilizados para añadir términos de búsqueda a la consulta de un usuario. Este proceso de incluir palabras relacionadas, conocido como expansión de la consulta, mejora significativamente la relevancia de los registros devueltos. Del mismo modo, Google y otros motores de búsqueda también sugieren términos de búsqueda adicionales a los usuarios a través de la función de autocompletar, creando predicciones basadas en búsquedas anteriores para ayudar a los usuarios a completar rápidamente sus consultas.

De este modo, SUPARS prefiguró la búsqueda en la web al ofrecer a los usuarios la posibilidad de buscar texto libre directamente en los propios documentos, y al permitir a los buscadores aprovechar las estrategias de búsqueda utilizadas por otros que vinieron antes. Mientras tanto, SUPARS determinaba la utilidad de todas estas búsquedas individuales mediante el análisis de su registro de transacciones. Tras un proyecto piloto inicial, se realizaron dos sesiones de pruebas del SUPARS entre octubre y diciembre de 1970 (SUPARS I) y noviembre y diciembre de 1971 (SUPARS II). El equipo de Atherton llegó a la conclusión de que la búsqueda de texto libre era una forma eficaz de mejorar la relevancia (conocida como “recuerdo” en la jerga de los científicos) de los resultados de la búsqueda, y podría ser tan eficaz como una búsqueda dirigida por un bibliotecario de investigación del tipo humano. Es más, el vocabulario en constante evolución de un sistema que se adapta continuamente a la información y el comportamiento humanos suponía una mejora con respecto a un sistema basado en un vocabulario fijo y controlado “de una sola vez” de los sistemas de búsqueda hasta el momento. El equipo de SUPARS no tenía forma de saber que los algoritmos de búsqueda en la web impulsados por IA harían este preciso trabajo unas décadas más tarde, pero claramente intuían que sería una forma nueva y eficaz de actualizar continuamente los resultados de las búsquedas.

En una carta de 1972 al editor del Diario de la Sociedad Americana de Ciencias de la Información, Katzer describió el razonamiento que había detrás de proporcionar una base de datos de todas las consultas de búsqueda anteriores:

El objetivo de esta base de datos de búsqueda es ayudar al usuario cuando intente formular consultas a la base de datos de documentos (Psychological Abstracts.) Dado que SUPARS utiliza actualmente un vocabulario no restringido, el resultado de la base de datos de búsqueda podría ayudar al usuario a descubrir otras formas de atacar su tema en la base de datos de documentos: Proporcionará palabras clave utilizadas por otros expertos en el tema, junto con una representación de sus procesos de pensamiento… [P]ensamos que éste es un comienzo en un área que no se ha explorado lo suficiente: el uso de la inteligencia del usuario para aumentar todo el esfuerzo que se ha dedicado a la inteligencia de la máquina.

Es tentador describir al equipo de Atherton como futuristas utópicos, pero el experimento SUPARS no se diseñó teniendo en mente una visión rectora como la web abierta. Se creó específicamente para un futuro en el que habría menos bibliotecarios disponibles para ayudar a los investigadores en persona. Ampliar la inteligencia colectiva de los demás era una solución práctica, no idealista.

El grupo de Atherton observó que, como las nuevas ubicaciones de los terminales informáticos en Siracusa estaban “alejadas de un bibliotecario de referencia o de cualquier otro especialista humano en el área de interés del usuario”, necesitarían una fuente adicional de ayuda, que podría encontrarse en “la inteligencia humana de todos los demás usuarios del sistema”. Las decisiones agregadas de otros investigadores sólo eran un sustituto de un experto bibliotecario, escribieron:

.

Idealmente, un usuario podría hablar con alguien familiarizado con su área de interés y se le proporcionaría una variedad de palabras y otras pistas. A continuación, el usuario podría desarrollar o formular una consulta de búsqueda al sistema que tuviera la especificidad o exhaustividad necesarias para maximizar la recuperación.

Mientras trabajaban con el terminal modular del campus, el equipo de SUPARS vio el futuro que se avecinaba y lo que perdería un mundo basado en la informática distribuida y en red: un número cada vez mayor de investigadores iban a trabajar fuera de la biblioteca, por su cuenta, necesitados de un apoyo que los bibliotecarios no podrían proporcionarles. El equipo de Atherton no estaba prediciendo un mundo en el que los bibliotecarios expertos no serían necesarios; se estaban preparando para un mundo en el que la investigación se llevaría a cabo en muchos lugares dispares, demasiado lejos de un mostrador de referencia como para que pudieran ayudar.

Las personas acreditadas como visionarias imaginaban un mundo en el que la tecnología mejoraría la comunicación humana

Los experimentadores del SUPARS también llegaron a la conclusión de que, aunque utilizar los términos de búsqueda de otros era una alternativa prometedora a la búsqueda por temas, tenía limitaciones reales. Una de las recomendaciones finales del SUPARS fue seguir desarrollando un vocabulario controlado, explicando que “sigue existiendo la necesidad en la búsqueda interactiva de texto libre de alguna forma de vocabulario de usuario o de control de sinónimos”. Llegaron a esta conclusión después de ver con qué frecuencia los participantes en el SUPARS tropezaban con problemas de vocabulario de búsqueda, como, en uno de sus ejemplos, buscar “personas” en lugar de “humanos” y no obtener ningún resultado. Los propios participantes echaban de menos la exhaustividad de los encabezamientos de materia. De hecho, como parte de la encuesta SUPARS, se les preguntó si preferían un sistema de texto libre o uno en el que el vocabulario estuviera más controlado: 42% prefería el sistema de texto libre, el 36% prefería el vocabulario controlado, y el 12% quería ambos.

De este modo, SUPARS es significativo como diseño adelantado a su tiempo y como contraejemplo a las historias tecno-utópicas establecidas de Internet y la World Wide Web. Las personas acreditadas como visionarias en esta historia casi siempre imaginaron un mundo en el que la tecnología mejoraría absolutamente la comunicación, la inteligencia y la eficacia humanas.

Por ejemplo, una de las figuras más célebres de esta historia es Joseph Carl Robnett “Lick” Licklider, cuya idea de una red universal inspiró directamente la invención de ARPANET, descrita a menudo como “la primera Internet”. (Licklider también estuvo muy implicado en experimentos similares en los campus de los años 60 y 70 para la búsqueda en línea; financió y asesoró varios estudios en las bibliotecas del MIT que se llevaron a cabo durante el mismo periodo que el SUPARS.)

En 1968, el año en que se creó el SUPARS, Licklider se unió al MIT y al MIT.

En 1968, el año anterior al diseño de SUPARS, el artículo de Licklider “El ordenador como dispositivo de comunicación” declaraba que: Dentro de unos años, los hombres serán capaces de comunicarse más eficazmente a través de una máquina que cara a cara” y describía una sociedad gratificante y dichosa mediada por interacciones informáticas humanas. Licklider predijo que “la vida será más feliz para el individuo en línea” y que “la comunicación será más eficaz y productiva, y por tanto más agradable”. El ensayo de Licklider es típicamente predictivo y optimista para este género futurista sobre el potencial de la tecnología de la información.

La cultura celebra a personas como Licklider por ser visionarios en un sentido positivo. Pero, del mismo modo, Atherton y el equipo de investigación de SUPARS deberían ser celebrados por haber visto y luego diseñado para lo que el futuro perdería. Ampliando nuestro grupo de visionarios establecidos de Internet para incluir a gente como Atherton, vemos un retrato más complejo de cómo distintos tipos de investigadores imaginaron el mundo que vendría. Mientras que Licklider vio lo que ganaríamos al poder comunicarnos en línea con cualquier persona del mundo, el grupo de Atherton vio que perderíamos intermediarios expertos; diseñaron para este coste.

En 2022 y 2023, cuando los primeros motores de búsqueda de IA generativa, incluidos los motores de búsqueda académica como Elicit y Consensus, se presentaron a un amplio conjunto de usuarios tanto con gran entusiasmo como con escepticismo, resulta igualmente útil analizar lo que se perderá cuando los investigadores lleguen a confiar en estas herramientas. Cuando podamos simplemente introducir preguntas de investigación para crear revisiones bibliográficas instantáneas, por ejemplo, no habrá simplemente un gran avance positivo. Esta nueva tecnología creará una falta de base y contexto, incluso cuando se realicen nuevos descubrimientos increíbles: una pérdida diferente a la que vio Atherton, pero igualmente intangible y de profundas consecuencias. Ser capaces de predecir estas consecuencias de antemano, no lamentándolas como luditas sino considerando activamente cómo ayudar a los investigadores a superarlas, es una lección que podemos aprender del equipo de SUPARS.

•••

Monica Westin

Es bibliotecaria con experiencia en bibliotecas académicas y publicaciones académicas. Trabaja en la política de derechos de autor de Google e imparte clases en el programa de Maestría en Ciencias de la Información de la City, Universidad de Londres.

Total
0
Shares
Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Related Posts