La importancia de la relevancia de la Informacion

Alfons Cornella.

 

Leo en el Bulletin de la ASIS (American Society for Information Science) el discurso del brillante profesor Dagobert Soergel con ocasión de haber recibido el Premio de Honor de la ASIS. El discurso, titulado "An Information Science Manifesto" esta accesible en texto entero en http://www.asis.org/Bulletin/Dec-97/Soergel.htm. Para cualquiera que quiera enterarse de hacia dónde va esta disciplina, este es un fantástico Manifiesto.

Soergel considera que la tensión entre las necesidades de información del usuario y las formas de representación de esta información en algún tipo de almacén es la clave de la disciplina de la ciencia de la información. En otras palabras, el problema fundamental para quien estudie científicamente el campo de la información es cómo una necesidad de información de alguien es resuelta o no mediante una búsqueda de información en algún sistema que la almacene. Esta relación entre "necesidad de información" e "información almacenada" define el concepto clave: "relevancia".

La idea de relevancia es muy compleja. Primero, y para simplificar, se pueden definir dos tipos fundamentales de relevancia. La relevancia "formal": cuando los resultados de una búsqueda de información responden a la ecuación de búsqueda que se había planteado. Y la relevancia semántica: cuando los resultados obtenidos responden a las necesidades del usuario (he sacado estas dos ideas de un útil librito de J. R. Pérez Alvarez-Ossorio, Introducción a la información y documentación científica).

De estas dos definiciones se entiende ya algo que va a tomar más y más importancia en esta era de Internet: los internautas van a ir descubriendo, ya lo están haciendo de hecho, por qué lo que obtienen en sus búsquedas en el Web no les sirve de mucho. La razón por la que no tan sólo consiguen información muy poco relevante formalmente (sus ecuaciones de búsqueda son simplemente pobres, o el lugar en el que buscan no es el adecuado), sino que lo que consiguen es, frecuentemente, también irrelevante semánticamente, es decir, que no les sirve para resolver la necesidad de información que tenían, porque confunden la información que desean obtener con lo que realmente preguntan. Los grandes depósitos de información que constituyen Internet no sirven de nada si no se les interroga adecuadamente, pero tampoco sirven de nada si quien pregunta no sabe realmente cuál es el problema que quiere resolver buscando información. Por lo general, se dirigen al Web antes de haber meditado sobre cuál es en realidad el problema, es decir, sobre cuál es la información que necesitan. E incluso en ese caso, no se conocen adecuadamente las formas de interrogar el Web. ¿Cuántos internautas, por ejemplo, se han atrevido a indagar cómo se plantean búsquedas complejas (mediante operadores booleanos, por ejemplo) en los motores de búsqueda universalmente conocidos? O sea: que la práctica en el Web lleva a miles de personas a encontrarse con el problema de la relevancia. Y frente a la irrelevancia de muchas de sus búsquedas sólo se les ocurre dar las culpas a la poca organización de la información en Internet, a la poca calidad de la misma, etc. Una gran oportunidad, de hecho, para que aparezcan intermediarios que prometan una mayor relevancia en la búsqueda de información para profesionales. Algo que, sin embargo, resulta siempre difícil de conseguir.

La principal razón es que la verdadera relevancia, es decir obtener información relevante para un problema, no consiste simplemente en definir una ecuación de búsqueda correctamente, o en ir a hurgar en una buena base de datos. Porque, como nos recuerda Stéfano Mizzaro en un brillante artículo en el Journal del ASIS de septiembre de 1997 (p810), la relevancia es en realidad una relación entre dos entidades cualesquiera escogidas cada una de ellas entre los componentes de dos grupos distintos. En el primer grupo están: el problema (aquello que un humano tiene que resolver), la necesidad de información (cómo el humano en cuestión representa en su mente el problema al que se enfrenta), la petición de información (cómo expresa el humano esa necesidad de información a alguien, normalmente en lenguaje natural), y finalmente, la interrogación (la ecuación de búsqueda a plantear a una base de datos, por ejemplo).

En el segundo grupo están: el documento (el soporte físico donde está la información, por ejemplo un artículo de revista en papel), el subrogado (la representación de ese documento, por ejemplo, el resumen de un documento en una base de datos), y finalmente, la información (lo que el usuario capta al leer un documento).

Así, hablaríamos de diversos tipos de relevancia. Por ejemplo, podemos hablar de un subrogado que es relevante de acuerdo con una cierta interrogación (los registros que se han obtenido de una búsqueda en una base de datos satisfacen correctamente la ecuación de búsqueda planteada).

O podemos hablar de la relevancia de un documento con respecto a una petición (el documento obtenido responde a la necesidad expresada por el peticionario). Pero ninguna de las dos relevancias garantiza que el documento en cuestión responda al problema real del usuario, que, por otra parte, puede que incluso no conozca bien.

Todo ello nos lleva a que va a ser más y más importante instruir a la gente, en especial a los miembros de una empresa, en cómo reconocer bien los problemas, cómo plantearlos en forma de necesidad de información, y cómo plantear ecuaciones de búsqueda que lleven a documentos "relevantes" para el problema, eso dejando de lado la necesidad de conocer bien cuáles son las fuentes de información y cómo se usan. Estas habilidades forman parte de lo que en otras ocasiones hemos denominado "cultura de la información" de los miembros de una empresa.

Este problema, muy conocido por los profesionales de la información desde hace décadas, toma ahora una nueva dimensión con la divulgación universal de Internet.

 

Publicado en Extra!-Net, edición del 19 de enero de 1998.