Para poder evaluar un Sistema de Recuperación de Información es necesario también tener en cuenta algunas variables como lo son exhaustividad y precisión. Una vez se han tomado estas dos variables se procede a determinar si un determinado Sistema de Recuperación de Información puede llegar a cubrir la necesidad de información.
Número de documentos relevantes recuperados
Exhaustividad = _________________________________________________ X 100
Número total de documentos relevantes presentes en el fondo documental
Número de documentos relevantes recuperados
Precisión = ______________________________________________ X 100
Número total de documentos recuperados
Exhaustividad: Ejemplo. Supongamos que hacemos una búsqueda de un tema X, sobre una colección de 100 documentos, y como resultado de esta búsqueda obtenemos solo 6 documentos, quiere decir que si aplicamos la formula que acabamos de ver, entonces el índice de exhaustividad es del 6%.
Precisión: Ejemplo. Supongamos que la búsqueda es sobre 1000 documentos, caso en el que como respuesta solo se obtuvieron 100 documentos pro únicamente 20 responden directamente a los que se solicito, es decir relevantes, entonces el índice de precisión es del 20%.
Algo que es claro, es que el índice de exhaustividad proporciona una medida al sistema para recuperar documentos que puedan denominarse relevantes para el usuario, el índice de precisión demuestra la habilidad del sistema para evitar el ruido.
Como el objetivo es llevar a la construcción de un sistema que brinde 100% de exhaustividad y precisión, en otras palabras sistemas que recuperen relevantes documentos realmente ; de esta manera en teoría suena muy sencillo, pero en la práctica estos dos se comportan de forma antagónica, puesto que es necesario aumentar el nivel de exhaustividad se requiere disminuir la precisión y en sentido contrario, y la razón es que si se quiere asegurar la precisión del sistema se hace necesario tomar medidas para hacer mas especifica la indización.
Es decir, si un documento trata sobre archivos, entonces tendremos que diseñar un adecuado sistema de indización que tienda a indizar el documento con un descriptor archivos, y no con el descriptor de gestión documental, archivistas, archivística, etc. Y así, se logrará el esfuerzo de tener un sistema preciso, aunque si alguien llegase a buscar documentos sobre archivística, dejara de recuperar documentos relevantes sobre el tema general.
En la práctica se puede observar que por medio de los buscadores más usados en internet, como Google o AltaVista, se pueden determinar buenas tasas de exhaustividad y esto lo podemos comprobar inmediatamente en la cantidad de resultados que se nos entregan, pero es claro que la precisión es poca, pues de los cientos y miles de resultados que obtenemos, solo unos pocos nos van a servir para satisfacer una necesidad de información.
También, existen sistemas muy especializados como ADAM o Cercador, entre otros, los cuales usan un sistema de indización automatizada e intelectual. Pueden brindar menor exhaustividad, pues los resultados que estos ofrecen suelen ser pocos, pero es seguro que la precisión esta casi en el 100%.
Publicado por: Nubia Cortés
GOMEZ DIAZ, Raquel. La evaluación en recuperación de la información [on line]. "Hipertext.net", núm. 1, 2003. <http://www.hipertext.net> [Consulta: 01/11/10]. ISSN 1695-549.
GARCÍA GÓMEZ, Juan Carlos. Aproximación a la evaluación cuantitativa de los Sistemas de Recuperación de Información de la prensa en Internet: Exhaustividad y precisión. [on line] <ibersid.eu/ojs/index.php/scire/article/download/1145/1127>. [consulta: 01/11/2010].
No hay comentarios:
Publicar un comentario