# Apify Website Content Crawler

[Apify](https://apify.com/) es una plataforma de web scraping y extracción de datos que proporciona una tienda de aplicaciones con más de mil herramientas listas para usar llamadas Actors.

El Actor [Website Content Crawler](https://apify.com/apify/website-content-crawler) puede rastrear sitios web en profundidad, limpiar su HTML eliminando modales de cookies, pies de página o navegación, y luego transformar el HTML en Markdown. Este Markdown puede ser almacenado en una base de datos vectorial para búsqueda semántica o Generación Aumentada por Recuperación (RAG).

<figure><img src="/files/aoqOhw1zzwsjNXj7qRAS" alt="" width="266"><figcaption><p>Nodo del Rastreador de Contenido Web Apify</p></figcaption></figure>

## Rastrear Sitio Web Completo

1. *(Opcional)* Conecta [**Text Splitter**](/espanol/documentacion-oficial/integraciones/langchain/text-splitters.md).
2. Conecta Apify API (crea una nueva credencial con tu [token de API de Apify](https://my.apify.com/account#/integrations)).
3. Ingresa una o más URLs (separadas por comas) donde el rastreador comenzará, por ejemplo `https://docs.flowiseai.com/`.
4. Selecciona el tipo de rastreador. Consulta la [documentación de Website Content Crawler para más información](https://apify.com/apify/website-content-crawler/input-schema#crawlerType).
5. *(Opcional)* Especifica parámetros adicionales como la profundidad máxima de rastreo y el número máximo de páginas a rastrear.

## Salida

Carga el contenido del sitio web como un Documento.

## Recursos

* [Integración Apify-Flowise](https://docs.apify.com/platform/integrations/flowise)
* [Website Content Crawler](https://apify.com/apify/website-content-crawler)


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.flowiseai.com/espanol/documentacion-oficial/integraciones/langchain/document-loaders/apify-website-content-crawler.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
