Puppeteer Web Scraper
Puppeteer es una biblioteca de Node.js que controla Chrome/Chromium a través del DevTools Protocol en modo headless. Ten en cuenta que al hacer scraping de sitios web, siempre debes revisar y cumplir con los términos de servicio y políticas del sitio web para asegurar un uso ético y legal de los datos.
Scraping de Una URL
(Opcional) Conecta Text Splitter.
Ingresa la URL deseada para hacer scraping.
Crawl y Scraping de Múltiples URLs
Visita la guía de Web Crawl para permitir el scraping de múltiples páginas.
Salida
Carga el contenido de la URL como Documento
Recursos
Last updated