Subidas
Aprende cómo subir imágenes, audio y otros archivos
Flowise te permite subir imágenes, audio y otros archivos desde el chat. En esta sección, aprenderás cómo habilitar y usar estas funcionalidades.
Image
Ciertos modelos de chat permiten ingresar imágenes. Siempre consulta la documentación oficial del LLM para confirmar si el modelo admite la entrada de imágenes.
El procesamiento de imágenes solo funciona con ciertas cadenas/agentes en Chatflow.
LLMChain, Conversation Chain, ReAct Agent, Conversational Agent, Tool Agent
Si habilitas Allow Image Upload, podrás subir imágenes desde la interfaz de chat.


Para subir imágenes con la API:
import requests
API_URL = "http://localhost:3000/api/v1/prediction/<chatflowid>"
def query(payload):
response = requests.post(API_URL, json=payload)
return response.json()
output = query({
"question": "¿Puedes describir la imagen?",
"uploads": [
{
"data": "", # cadena base64 o url
"type": "file", # file | url
"name": "Flowise.png",
"mime": "image/png"
}
]
})
Audio
En la Configuración del Chatflow, puedes seleccionar un módulo de speech-to-text. Las integraciones soportadas incluyen:
OpenAI
AssemblyAI
Cuando esto está habilitado, los usuarios pueden hablar directamente al micrófono. Su voz se transcribe a texto.


Para subir audio con la API:
import requests
API_URL = "http://localhost:3000/api/v1/prediction/<chatflowid>"
def query(payload):
response = requests.post(API_URL, json=payload)
return response.json()
output = query({
"uploads": [
{
"data": "data:audio/webm;codecs=opus;base64,GkXf", # cadena base64
"type": "audio",
"name": "audio.wav",
"mime": "audio/webm"
}
]
})
Files
Puedes subir archivos de dos maneras:
Carga de archivos para generación aumentada por recuperación (RAG)
Carga completa de archivos
Cuando ambas opciones están activadas, la carga completa de archivos tiene prioridad.
RAG File Uploads
Puedes hacer upsert de los archivos subidos al vector store sobre la marcha. Para habilitar la carga de archivos, asegúrate de cumplir con estos requisitos previos:
Si tienes múltiples vector stores en un chatflow, solo puedes activar la carga de archivos para un vector store a la vez.
Debes conectar al menos un nodo document loader a la entrada de documentos del vector store.
Document loaders soportados:

Puedes subir uno o más archivos en el chat:


Así es como funciona:
Los metadatos de los archivos subidos se actualizan con el chatId.
Esto asocia el archivo con el chatId.
Al consultar, se aplica un filtro OR:
Los metadatos contienen
flowise_chatId
, y el valor es el ID de la sesión de chat actualLos metadatos no contienen
flowise_chatId
Un ejemplo de un vector embedding con upsert en Pinecone:

Para hacer esto con la API, sigue estos dos pasos:
Usa la Vector Upsert API con
formData
ychatId
:
import requests
API_URL = "http://localhost:3000/api/v1/vector/upsert/<chatflowid>"
# Usa form data para subir archivos
form_data = {
"files": ("state_of_the_union.txt", open("state_of_the_union.txt", "rb"))
}
body_data = {
"chatId": "some-session-id"
}
def query(form_data):
response = requests.post(API_URL, files=form_data, data=body_data)
print(response)
return response.json()
output = query(form_data)
print(output)
Usa la Prediction API con
uploads
y elchatId
del paso 1:
import requests
API_URL = "http://localhost:3000/api/v1/prediction/<chatflowid>"
def query(payload):
response = requests.post(API_URL, json=payload)
return response.json()
output = query({
"question": "¿De qué trata el discurso?",
"chatId": "same-session-id-from-step-1",
"uploads": [
{
"data": "data:text/plain;base64,TWFkYWwcy4=",
"type": "file:rag",
"name": "state_of_the_union.txt",
"mime": "text/plain"
}
]
})
Full File Uploads
Con las cargas de archivos RAG, no puedes trabajar con datos estructurados como hojas de cálculo o tablas, y no puedes realizar resúmenes completos debido a la falta de contexto completo. En algunos casos, es posible que desees incluir todo el contenido del archivo directamente en el prompt para un LLM, especialmente con modelos como Gemini y Claude que tienen ventanas de contexto más largas. Este artículo de investigación es uno de muchos que comparan RAG con ventanas de contexto más largas.
Para habilitar la carga completa de archivos, ve a Chatflow Configuration, abre la pestaña File Upload, y activa el interruptor:

Puedes ver el botón File Attachment en el chat, donde puedes subir uno o más archivos. Internamente, el File Loader procesa cada archivo y lo convierte en texto.

Para subir archivos con la API:
import requests
API_URL = "http://localhost:3000/api/v1/prediction/<chatflowid>"
def query(payload):
response = requests.post(API_URL, json=payload)
return response.json()
output = query({
"question": "¿De qué tratan los datos?",
"chatId": "some-session-id",
"uploads": [
{
"data": "data:text/plain;base64,TWFkYWwcy4=",
"type": "file:full",
"name": "state_of_the_union.txt",
"mime": "text/plain"
}
]
})
Como puedes ver en los ejemplos, las cargas requieren una cadena base64. Para obtener una cadena base64 para un archivo, usa la Create Attachments API.
Last updated