Mostrando entradas con la etiqueta Métodos de recuperación. Mostrar todas las entradas
Mostrando entradas con la etiqueta Métodos de recuperación. Mostrar todas las entradas

lunes, 31 de octubre de 2011

Tendencias de los recursos de información en internet: Formato Dublin Core

Resumen[1]

“Se muestran diferentes tendencias que caracterizan las herramientas de búsqueda de información existentes en Internet con respecto a la utilización de los metadatos. Se aborda también el tema del empleo de los formatos normalizados de metadatos para la descripción de los recursos de información, con énfasis en los principios, las características y la codificación del formato Dublín Core en HTML”.

Palabras clave: Herramientas de búsqueda, metadatos, Dublin Core, HTML. 

Los usuarios de Internet se encuentran siempre inmersos en grandes volúmenes de información y cuya utilidad se ve cada vez más reducida, tanto por las características propias de los recursos digitales: volatilidad, inestabilidad, entre otros, como por carecer de semántica necesaria como para que las herramientas diseñadas para la búsqueda y recuperación de la información en Internet puedan recobrarlos según sean las necesidades. 

Estas herramientas se basan fundamentalmente en la automatización de tareas de clasificación e indización; la mayoría emplean un robot que se ocupa de recorrer constantemente la Web para clasificar y organizar automáticamente la información encontrada y confeccionar a partir de ella sus bases de datos. Este tipo de indización es, sin lugar a dudas, menos costosa que la indización humana, pero, a diferencia de esta última, la indización automática es bastante imperfecta y no puede identificar las características de los documentos (materia, autor, fecha de publicación), o distinguir el tipo de documento, por ejemplo, si se trata de un artículo o de un libro.

Todo esto se debe a que la mayoría de estas herramientas no soportan metadatos y, en los casos en que están preparadas para reconocerlos, la mayoría de los autores de páginas Web no los emplean en la creación de los documentos, bien sea por el desconocimiento de su importancia o de cómo hacerlo.

Si los autores de páginas Web utilizaran modelos de metadatos estándares para agregar una descripción en los documentos que ellos generan, se facilitaría, tanto el trabajo de las herramientas para la recuperación de información en la Web que reconocen metadatos, como de los usuarios que realizan esas consultas, quienes podrían valorar el contenido de los documentos sin tener la necesidad de acceder al original, y ahorrarse un tiempo valioso. 

En el contexto de Internet, existen diversos mecanismos o herramientas utilizadas para la recuperación de información, cada una de ellas, con tendencias diferentes hacia la utilización o no de los metadatos; entre las herramientas más destacadas, se conocen: los directorios o índices, los motores de búsquedas, meta-buscadores y portales temáticos. 

Los índices o directorios son las mismas listas de recursos, organizados en categorías temáticas por los expertos. 

Las categorías temáticas se organizan jerárquicamente sobre un árbol de materia que le permite descender desde las más generales a las más específicas, las categorías presentan una lista diversa de enlaces a las páginas Web referidas en el buscador. 

Los directorios son sistemas pre-coordinados de recuperación de información, que ofrecen inventarios de materias. Los directorios han comenzado a evolucionar hacia el mundo de los portales temáticos. El ejemplo más representativo de directorio hasta el momento es Yahoo (http://www.yahoo.com), que se ha convertido también en un portal, pero mantiene aún su estructura, según categorías. 

Es clave agregar que no se puede hablar en sentido estricto de metadatos asociados a este tipo de sistemas de recuperación de información en Internet, sin embargo, las categorías clasificatorias que establecen estos sistemas podrían entenderse como meta-información que anticipa, de algún modo, el contenido de los recursos clasificados al interior de cada tema, al agrupar la información en listas pre-coordinadas del encabezamiento de materia. 

La organización de los recursos que realizan estos directorios nos podría llevar a considerarlos sistemas de recuperación de información con organización de tipo bibliotecaria; porque aun cuando no son bibliotecas digitales en sentido estricto, sí se basan en criterios que son semánticos y de organización del conocimiento. 

Se puede hablar de metadatos estrictos, que están vinculados a directorios generales dado el caso del Open Directory Proyect (ODP) (http://dmoz.org), un directorio puro, que sirve para la clasificación cooperativa de información en RDF[2].

Los buscadores de información conocidos como sistema de recuperación de información en Internet Altavista, Excite y otros, son sistemas post-coordinados de recuperación de información, consistentes en bases de datos que son voluminosas, generadas a partir de la indización automática de los textos completos o de partes significativas de los documentos que son encontrados en Internet por los robots, que emplean principalmente unas técnicas de análisis estadísticos y ponderación. 

En opinión de Méndez, los metadatos que se consideran en la indización -y en su caso, en el cálculo de relevancia-, son los que se denominan meta-etiquetas o meta-tags, creadas como estructuras genéricas de meta-información (cabeceras HTML) por los autores o editores de los recursos Web. 

1.   Si estos sistemas utilizan metadatos HTML para indizar (AltaVista, Hotbot, MetaCrawler, Inktomi, Infoseek, entre otros), lo hacen sobre valores básicos (Description, Keywords) de las meta-etiquetas HTML o a lo sumo las meta-etiquetas author u otras partes del documento HTML que puedan entenderse en cierto sentido, como meta-información.

2.    No existe un acuerdo sobre los motores de búsqueda que utilizan las etiquetas <META> para el cálculo de relevancia de sus búsquedas, porque habitualmente el funcionamiento interno de los buscadores es transparente para los usuarios y los propios creadores de este tipo de software tampoco realizan mucha publicidad sobre las funcionalidades. 

Rodríguez Gairín , en un artículo escrito sobre el buscador AltaVista, plantea que muchos motores de búsqueda emplean la información que está almacenada en los meta-elementos para crear sus índices y permitirle al usuario un acotamiento por campos, y que posibilite que el ruido generado por la indización del texto completo pueda reducirse fácilmente[3].

3.   En el caso de Altavista, por el momento, sólo utiliza la metainformación almacenada en “KeyWords” para generar sus índices y la almacenada en Description para elaborar el breve resumen que presenta en la hoja de resultados. 

En opinión de Koch, los sistemas de recuperación globales que se basaban, de alguna forma, en metaetiquetas HTML para la indización eran: Altavista, Infoseek, SwistSearch, Hotbot, Webcrawler, los motores de búsquedas de información en alemán, Aladin y Eule y los sistemas de recuperación de información en Internet especiales para metainformación, Fireball, Polish Academic Web Index, Hotmeta Search Engine (que indizaba metadatos DC) y Nordis Metadata Index -que indizaba los modelos IAFA, DC y Gil[4].

Publicado por Nubia Cortés y Myriam Gil.




[1] Fuente (Vancouver): Daudinot Founier, Isabel. Descripción de los recursos de información en Internet: formato Dublín Core. Acimed 2006;14(4). Disponible en: http://bvs.sld.cu/revistas/aci/vol14_4_06/aci09406.htm Consultado: día/mes/año.
[2] Méndez Rodríguez EM. Metadatos y recuperación de información: estándares, problemas y aplicabilidad en bibliotecas digitales. Gijón: Trea; 2002.
[3] Rodríguez Gairín J. M. Valoración del impacto de la información en Internet. Altavista, el “Science Citation Index” de la red. Revista Española de Documentación Científica 1997;20(2):175-181. Disponible en: http://bd.ub.es/pub/rzgairin/altavis.htm [Consultado: 8 de enero del 2006].
[4] Koch T. Documentation to: metadata Indexing and searching in large search. 1998. Disponible en: http://www.lub.lu.se/~traugott/Mdsearch-docu.html [Consultado: 15 de enero del 2006].

La labor de los especialistas o intermediarios de la información

Hace mención a los profesionales y aquellos especialistas en recuperación de información los cuales deben tener en cuenta que problemas se enfrentan para resolver y qué técnicas y conocimientos deben poseer para hacer posible esa búsqueda y recuperación de la información. Estos especialistas conocidos también como intermediarios, son aquellas personas con capacidades y habilidades para conocer esa necesidad de la información real del usuario y para la posterior búsqueda y recuperación en diferentes SRI y bases de datos.

Con el fin de hacer posible la satisfacción de la información a los usuarios por parte de los especialistas de información o intermediarios, ellos pueden ayudar a diagnosticar el problema del usuario y a formular la consulta, sugieren los sistemas o bases de datos que sean apropiadas para la búsqueda, traducen la consulta en estrategias de búsqueda adecuadas para el sistema o bases de datos a utilizar, y realizan o modifican la búsqueda, evalúan los resultados, proporcionando al usuario los resultados adecuados y le aconsejan sobre las actividades que deben realizar posteriormente.

1. El proceso de búsqueda:

Es la actividad principal que realiza el especialista en recuperación de información. En dicho proceso se reflejan los conocimientos que deben poseer, las tareas y problemas a resolver y las técnicas a emplear, todo encaminado en lo posible a la satisfacción de necesidades de un usuario en general.

El proceso de búsqueda, según Bárbara Quint, se dividen en siete etapas:

1.1. Entrevista de referencia: Esta entrevista es realizada entre el usuario y el profesional de la información con el propósito de que sea determinada  la necesidad de información solicitada, y es aquí donde entra a jugar la interacción y búsqueda de información por parte del profesional de información, utilizando las herramientas que sean necesarias para efectuar la búsqueda y obtener los resultados esperados por el usuario.

1.2. Revisión táctica: esta fase consiste en la revisión de la revisión de respuestas obtenidas por el usuario para efectuar la búsqueda, en donde se analizan todos aquellos aspectos que influyan en ese proceso de búsqueda.

1.3. Selección de la(s) base(s) de datos: aquí el profesional de información valora las características de búsqueda que están disponibles en cada sistema o herramienta (catálogos, bases de datos, directorios, boletines, entre otros).

Después de determinar las características de cada una, se elige una o algunas de ellas que tenga relación con la información que se ha solicitado.

1.4. Formulación de estrategia de búsqueda: la finalidad de ésta etapa es traducir la petición que hace el usuario en las sentencias de búsqueda que se van a introducir en la herramienta elegida para tal fin.

Esta búsqueda exige una serie de pasos:

• Análisis conceptual del tema de búsqueda y determinar los conceptos más relevantes.
• Elegir los términos que mejor han de representar la petición de información.
• El profesional debe escribir en el lenguaje del sistema que vaya a utilizar, las sentencias de búsqueda; establecer relaciones lógicas entre los términos buscados utilizando los interfaces de búsqueda que posea el sistema empleado.

1.5. La búsqueda de información: una vez diseñada la estrategia de búsqueda, se ejecutan las búsquedas en el sistema que ha sido elegido. Puede que se encuentren resultados satisfactorios en la búsqueda,y caso contrario, el profesional de información debe crear nuevas estrategias, con el objetivo de mejorar y conseguir esa información que el usuario necesita.

1.6. Feedback o revisión de los resultados: el profesional de información revisa los resultados obtenidos en el sistema. Si los resultados no son suficientemente relevantes, se revisa y se modifica esa estrategia de búsqueda utilizando otros términos y otras bases de datos.

1.7. Presentación de los resultados de la búsqueda: cuando el profesional de información hace entrega de los resultados de búsqueda al usuario, debe explicarle al usuario qué fuentes consultó, que estrategia de búsqueda utilizó y los registros que encontró, asegurándose que el usuario comprenda e interprete plenamente la información

Publicado por: Nubia Cortés

lunes, 10 de octubre de 2011

DIFICULTADES DE LOS USUARIOS EN LAS ETAPAS DE BUSQUEDA


Hay que tener en cuenta que hay varios problemas que influyen en la búsqueda de información de los usuarios, dificultando los resultados de búsqueda de una manera satisfactoria, generándose mayores necesidades, pérdida de tiempo e impotencia, en clase de Recuperación de Información el objetivo es aclarar esos vacios que tienen los usuarios y hacer unas búsquedas satisfactorias, algunas de las dificultades que se identifican son las siguientes vistas en clase con el profesor Laureano Gómez:

Establecer el Objetivo de la búsqueda (Baró-Maña)
-Presentan los temas sin delimitar
-Presentan demandas excesivamente imprecisas
-No son conscientes del trabajo que conlleva la búsqueda documental
-No parten de sus conocimientos previos
-No plantean la búsqueda en función del tipo de trabajo

   
Búsqueda de los documentos (Baró-Maña)
-No se orientan en el espacio de la biblioteca
-No conocen los instrumentos de búsqueda: catálogos y clasificaciones
-Tienen dificultades para utilizar el orden alfabético como sistema de búsqueda
-Buscan sistemáticamente en los estantes
-No tiene en cuenta la existencia de fuentes de información complementarias al libro/Internet
-Esperan que el bibliotecario solucione la consulta

Localización de la información en los documentos impresos (Baró-Maña)
-Esperan dar con un título que responda exactamente a su consulta
-No utilizan los instrumentos que facilitan la consulta de los documentos: sumarios e índices
-No comprenden las distintas formas de presentación de la información: imágenes, esquemas, textos, tipografía
-No saben leer textos documentales: leen de principio a final, no seleccionan

Obtención de la información (Baró-Maña)
-Acumulan los documentos sin ningún método selectivo
-No consideran necesaria la consulta de distintas fuentes
-No distinguen los niveles informativos de las diversas fuentes

Reelaboración de la información (Baró-Maña)
-Copian mensajes completos de libros y enciclopedias
-No elaboran síntesis personales a partir de las distintas fuentes
-Tienen dificultades para reformular [1]
Si se tienen en cuenta las diferentes dificultades que se nombraron en el texto, nos sirven de guía para no cometer los errores de siempre al hacer una búsqueda, se debe hacer lo posible por optar por la mejor salida y así permitir hacer una búsqueda satisfactoria y solucionar nuestras necesidades de información de una forma concreta y concisa.


Publicado por: Myriam Gil
________________________________

[1] GÓMEZ DUEÑAS, Laureano Felipe Demanda Documental y Estrategias de Búsqueda. Dificultades de los usuarios en las etapas de búsqueda (Baró-Maña). Asignatura Recuperación de Información del Programa de Sistemas de Información de la Universidad de La Salle. 2011.
Imagen tomada de: Google.com. Dificultades en la búsqueda de información [en línea] (2011). Consultado: 08-10-2011. Disponible en: http://www.gruponeva.es/blog/categorias/internet/10.html


domingo, 25 de septiembre de 2011

¿Como encontrar una imagen en Google?


Esto es parte de un taller presentado al profesor Laureano Gómez en la clase de Recuperación de Información, necesito que me digan  el sito que corresponde la imagen presentada:


1. Se pega la Imagen en Paint y se guarda en formato JPG.


2.Entrar a Google Imágenes, en la opción Buscar por Imagen, subir una imagen, examinar se busca donde esta guardada, se le da abrir y nos arroja el resultado



3. Aparece una URL el-balcona.blogspot.com/2008_05_01_archive.html, con un tamaño de la imagen de 240 * 320, al dar traducir esta página nos lleva a un blog con fecha viernes 30 de mayo de 2008 con título El camino a Macondo,


4. Al seguir mirando la página se encuentra la imagen  dice que es de Monserrat, donde tuve la tentación de tomarme una foto solo del viaje, quiere decir que es un blog de un extranjero que estaba conociendo Colombia y tomo la fotografía.







Publicado por: Myriam Gil