Búsqueda de cadenas en un texto Exposicion

 

Busqueda de texto

Se encargan de verificar y recorrer documentos de texto, localizando en ellos ocurrencias del patrón o patrones buscados. Se debe tener en cuenta qué tipo de búsqueda se está realizando: palabras, frases, etc.

Es un algoritmo que busca elementos (patrones) de un conjunto finito de cadenas (diccionario) dentro de un texto. Una de las ventajas que presenta es que procesa el texto de entrada solamente una vez, es decir, realiza la búsqueda de todos los patrones de forma simultánea. Si se considera el tamaño del alfabeto al cual pertenecen los patrones como constante, entonces la complejidad temporal del algoritmo es lineal en cuanto a la suma de las longitudes de los patrones más la longitud del texto.


                                                      Búsqueda de cadenas en un texto

El motor de búsqueda utiliza una tecnología concreta conocida como índices invertidos, en la que para cada palabra que aparece en la Web, se almacena una lista de todos los lugares donde aparece dicha palabra.

Las máquinas con grandes cantidades de memoria principal mantienen disponibles las listas más comunes, permitiendo que muchas personas busquen documentos de forma simultánea.

Las técnicas de índices invertidos no emplean autómatas finitos, pero los agentes de búsqueda invierten mucho tiempo en copiar la Web y configurar los índices.

Existe una serie de aplicaciones relacionadas que no son adecuadas para los índices invertidos pero que son buenas para las técnicas basadas en autómatas.










Comentarios