jueves, 6 de octubre de 2011

Extracción de Información


                              
Extracción de información, corresponde a un proceso búsqueda, ya sea manual o automática, de palabras, párrafos, trozos de textos o preguntas que contengan información relevante buscada y que ha sido representada de forma estructurada. El proceso que antecede, de aplicar las reglas en los sistemas para llevar la información de un sitio a otro se llama de esta forma, Extracción de información. La recuperación de datos, como se ha relacionado en otros temas agregados, se supone como otro concepto que no resuelve el problema de la RI, solo, devuelve datos sobre un tema que es estructurado y para nada ambiguo en cuanto a consultas, en cambio para la recuperación, una necesidad de información puede ser planteada en preguntas de miles de formas. 


“Hoy en día existe un gran volumen de textos en formato electrónico dispersos por internet. De hecho, el volumen es tan grande que sobrepasa la capacidad de una persona para obtener información útil. Este hecho hace imperativo poner algo de orden en este caos de textos. Para poder hacerlo encontramos dos estrategias: La primera sería la recuperación de la información y la segunda sería la extracción de la información. Debemos tener en cuenta que estas dos estrategias son diferentes”[1]

La recuperación de informaciónprocura obtener documentos ante una solicitud al realizar la búsqueda.

La extracción de información - basado en la extracción de hechos de distintos documentos ante una solicitud cuando se realiza una búsqueda. 

Para crear un sistema de extracción de información es necesario iniciar con el proceso de recuperación de recuperación de la información, se obtienen documentos con información que sea significativa respecto a la solicitud de búsqueda y luego, el sistema de extracción de información (valga la redundancia) extrae la información y organiza de acuerdo al interés propuesto. 

“El objetivo principal y particular de los sistemas de extracción de información es obtener la información que sea relevante e ignorar la irrelevante”[2]

La extracción de información tiene muchas aplicaciones significativas, desde transferencia  de información no estructurada hacia las bases de datos tradicionales, mediciones de tendencias y mejora en la construcción de grandes índices para la recuperación de información. 


Podríamos decir que a largo plazo se contempla una posibilidad: conseguir sistemas de extracción de información que sean precisos a un mayor nivel, teniendo en cuenta que actualmente, los sistemas de extracción de información se ven en algunos aspectos como el tipo de texto, formas, idiomas, entre otros.

Publicado por: Nubia Cortés


[1] Recuperación y Organización de la Información - Extracción de Información. Latino Webs. Consulta en línea: http://extraccioninformacion.latinowebs.com/
[2] Tomado de  ¿Qué es relevancia para los usuarios de información?
Imágen extraída de http://t2.gstatic.com/images?q=tbn:ANd9GcQPbq80pZN3tTZWss0NYS9uiT9DVp63IaWAz_RBjJxkmiWoESpN 

No hay comentarios:

Publicar un comentario