En la indización se tiene que llevar a cabo dos procesos:
-Elección de los términos
-Ponderación en cada documento
Objetivo: distinguir y localizar documentos.
Frecuencia:
La mayoría de las indizaciones automáticas comienzan con la observación de la frecuencia. Parece lógico que un término que tiene la misma frecuencia en todos los documentos de la base: NO PUEDE DIFERENCIAR.
Luhn:
“La representación del significado de un documento por parte de un término aumenta conforme lo hace la frecuencia Continuar leyendo “Indización: selección de términos y ponderación” »