Carga datos desde el Rastreador de Contenido Web de Apify.
Apify es una plataforma de web scraping y extracción de datos que proporciona una tienda de aplicaciones con más de mil herramientas listas para usar llamadas Actors.
El Actor Website Content Crawler puede rastrear sitios web en profundidad, limpiar su HTML eliminando modales de cookies, pies de página o navegación, y luego transformar el HTML en Markdown. Este Markdown puede ser almacenado en una base de datos vectorial para búsqueda semántica o Generación Aumentada por Recuperación (RAG).