3.3 Recuperació de la informació


La recuperació d'informació és el conjunt d'activitats orientades a facilitar la localització de determinades dades. 

Algunes eïnes  per determinar un major grau de precisió,  són: els índexs, internet, paraules clau, equacions de busqueda tesaurus etc. 








La recuperació de la informació pot ser de dues maneres:

  • Per elemets indexats, es a dir, per cadascuna de les dades que el arxivista hagi implementat a la base de dades sobre el document.
  • A text complet, quan la documnetació es troba digitalitzada i el sistema permet recuperar informació que conté el text del propi document, encara que no hagi sigut indexat.
A qualsevol sistema de gestió de base de dades, existeixen dues sistemes principals de recuperació:


  • Els filtres, que s'apliquen a tota la informació continguda en una tabla.
  • Les consultes, que requereixen un disseny previ i que es poden aplicar a varies tables a la mateixa vegada.

Uns dels problemes que sorgeixen en la cerca d'informació és si el que recuperem és “molt o poc,” és a dir, depenent del tipus de cerca es poden recuperar multitud de documents o simplement un nombre molt reduït. A aquest fenomen es denomina Silenci o Soroll documental.


  • Silenci documental: Són aquells documents emmagatzemats en la base de dades però que no han estat recuperats, a causa de que l'estratègia de cerca ha estat massa específica o que les paraules clau utilitzades no són les adequades per definir la cerca.

Com obtenir millors resultats en el silenci documental?
  1. Canviant d'estratègia i plantejant una cerca més genèrica.
  2. Afegint paraules clau.
  3. Utilitzant "Or" per combinar diversos termes de manera que apareguin un o altre, o tots dos.

  • Soroll documental: Són aquells documents recuperats pel sistema però que no són rellevants. Això normalment passa quan l'estratègia de cerca s'ha definit massa genèrica.

Com obtenir millors resultats en el soroll documental:
  1. Aplicant filtres limitant criteris d'interès: format, data, tipus de document, etc.

Components essencials per a una bona recuperació de la informació:

  • Els documents han d'estar estructurats. Cal establir un procés on s'estableixin eïnes d'indexació i control terminològic.
  • Bases de dades on estiguin emmagatzemats els documents. Definir llenguatges d'interrogació.





Cap comentari:

Publica un comentari a l'entrada

INDEX

TEMA 1. ELS ARXIUS, PÚBLICS I PRIVATS 1.1.   Introducció 1.2.   Concepte d’arxiu 1.3.   Concepte de document 1.4.   El cicle vi...