Búsqueda de cadenas en un texto Exposicion
Busqueda de texto
Se encargan de verificar y recorrer documentos de texto,
localizando en ellos ocurrencias del patrón o patrones buscados. Se debe tener
en cuenta qué tipo de búsqueda se está realizando: palabras, frases, etc.
Es un algoritmo que busca elementos (patrones) de un
conjunto finito de cadenas (diccionario) dentro de un texto. Una de las
ventajas que presenta es que procesa el texto de entrada solamente una vez, es
decir, realiza la búsqueda de todos los patrones de forma simultánea. Si se
considera el tamaño del alfabeto al cual pertenecen los patrones como
constante, entonces la complejidad temporal del algoritmo es lineal en cuanto a
la suma de las longitudes de los patrones más la longitud del texto.
El motor
de búsqueda utiliza una tecnología concreta conocida como índices invertidos,
en la que para cada palabra que aparece en la Web, se almacena una lista de
todos los lugares donde aparece dicha palabra.
Las
máquinas con grandes cantidades de memoria principal mantienen disponibles las
listas más comunes, permitiendo que muchas personas busquen documentos de forma
simultánea.
Las
técnicas de índices invertidos no emplean autómatas finitos, pero los agentes
de búsqueda invierten mucho tiempo en copiar la Web y configurar los índices.
Existe una
serie de aplicaciones relacionadas que no son adecuadas para los índices
invertidos pero que son buenas para las técnicas basadas en autómatas.

Comentarios
Publicar un comentario