Digitalización · IA · Mayo 2026 · Lectura ~18 min
En febrero de 2025 Andrej Karpathy popularizó en X el término vibe coding: dejar que el modelo escriba el código y guiarlo con conversación, intuición y revisiones rápidas en vez de teclear cada línea. Un año después, el concepto ha pasado de tweet provocador a categoría profesional. Claude Code, Cursor, Windsurf, Codeium, Codex y los agents de n8n permiten a una pyme construir herramientas internas, automatizaciones y prototipos en horas, no en semanas. Esta guía explica qué es vibe coding, cómo encajan los agentes de IA en el workflow diario, casos reales en pymes españolas y dónde están los riesgos serios (deuda técnica, calidad, seguridad) que ningún vendedor te va a contar.
Qué es vibe coding según Karpathy
El término nace de un tweet de Andrej Karpathy del 2 de febrero de 2025: "There's a new kind of coding I call 'vibe coding', where you fully give in to the vibes, embrace exponentials, and forget that the code even exists". Karpathy describe el patrón concreto: hablar con el modelo en lenguaje natural, ver lo que genera, ejecutar, pedirle que arregle errores sin necesariamente leerlos uno mismo, y construir herramientas pequeñas en minutos.
La frase tuvo eco porque dio nombre a un cambio ya en curso. GitHub publicó en su Octoverse 2024 que el 92 % de los desarrolladores profesionales usaba algún tipo de asistente IA en su workflow. Anthropic, OpenAI, Google y Cursor reportaron en 2025 que la mayor parte de su uso provenía de profesionales que no se identificaban como ingenieros de software pero escribían código a diario: analistas de datos, marketers, abogados, consultores. Vibe coding canaliza ese fenómeno.
Tres niveles de vibe coding
Conviene distinguir tres niveles operativos para no confundir la conversación:
| Nivel | Descripción | Quién | Riesgo |
|---|---|---|---|
| L1 · Asistido | Autocompletado avanzado tipo Copilot. El humano escribe y el modelo sugiere. | Cualquier dev | Bajo |
| L2 · Conversacional | El humano describe lo que quiere y el modelo genera bloques completos que el humano revisa. | Dev y profesional técnico | Medio |
| L3 · Vibe puro | El humano describe el objetivo, el modelo escribe, ejecuta, depura y entrega. El humano evalúa el resultado, no el código. | Prototipos, scripts, herramientas internas | Alto si va a prod |
Karpathy describe L3. Es el más excitante y el más mal entendido: solo es seguro cuando el alcance es pequeño, el dato es no sensible, hay tests automáticos que validan el comportamiento y existe la posibilidad de tirarlo y reescribirlo si va mal. Para producción crítica de una pyme con datos de clientes, L3 sin supervisión es peligroso.
El stack 2026: Claude Code, Cursor, Windsurf, Codeium
Cuatro herramientas concentran el grueso del mercado profesional en 2026. Cada una con su filosofía.
Claude Code (Anthropic)
CLI agéntica publicada por Anthropic en mayo de 2025 y consolidada durante 2025-2026 como referencia para vibe coding en terminal. Filosofía: agente que vive en tu shell, lee archivos del proyecto, ejecuta comandos, edita ficheros con permisos explícitos, integra MCPs (Model Context Protocol) para conectar fuentes externas (GitHub, Notion, bases de datos, APIs internas). Ventajas: control fino, transparencia (ves cada comando), persistencia de instrucciones vía CLAUDE.md en el repo. Buena para devs senior que quieren un copiloto serio en proyectos largos.
Cursor
Editor basado en VS Code con IA integrada. Lanzado por Anysphere en 2023, en 2024-2025 se convirtió en el editor preferido del segmento startup-tech. Filosofía: editor de toda la vida con un modelo (Claude, GPT, Gemini, modelos propios) que indexa tu codebase, contesta preguntas, completa bloques y ejecuta acciones agénticas con el modo "Composer". Ventajas: UX cuidada, atajos potentes, indexación semántica del repo. Es la opción más fácil para alguien que viene de VS Code y quiere subir un escalón.
Windsurf (Codeium)
Fork de VS Code creado por Codeium, lanzado en noviembre de 2024 y muy popular en 2025-2026 por su agente "Cascade" que combina edición de archivos y ejecución de comandos en un mismo flujo. Filosofía: editor + agente sin separación. Ventajas: precio agresivo en planes pro, agente fluido para tareas de varias horas, buenas integraciones con stack web (Vercel, Next.js, Astro).
Codeium · plugin clásico
Antes de Windsurf, Codeium era el autocompletado gratuito multi-IDE. Sigue activo como plugin para JetBrains, Eclipse, Sublime, Vim, Emacs. Para perfiles que no quieren cambiar de editor, sigue siendo la opción con mejor cobertura de IDEs.
Otros actores clave
- GitHub Copilot con su "agent mode" lanzado en 2025. Buena integración con el resto del ecosistema GitHub.
- OpenAI Codex CLI, agente en terminal de OpenAI lanzado en 2025.
- Cline, agente open source para VS Code que permite usar tu propia clave API.
- Aider, CLI open source con foco en git: cada cambio del agente es un commit. Excelente para auditoría.
- Replit Agent, agente integrado en Replit que construye apps full-stack a partir de prompt.
- Vercel v0 para generar componentes React/Next.js a partir de prompts.
Cuál elegir según el contexto
| Contexto | Recomendación 2026 |
|---|---|
| Marketing / consultor que quiere automatizar tareas | Claude Code con MCPs (Notion, Google Workspace) o Cursor |
| Equipo dev senior en SaaS | Cursor + Claude Code en paralelo, según tarea |
| Equipo que necesita auditoría granular | Aider (cada cambio es un commit firmado) |
| Diseñador UX que prototipa | Vercel v0 + Cursor |
| Empresa con stack JetBrains | Codeium classic o JetBrains AI Assistant |
| No-code mejorado | Replit Agent o Cursor en local sin codebase previo |
Agents en n8n y orquestación visual
Mientras Cursor y Claude Code ocupan el lado dev del workflow, en el lado operations el actor protagonista es n8n. La plataforma open-source de automatización publicó en 2024 sus nodos "AI Agent" y durante 2025-2026 los convirtió en el patrón estándar para componer agentes sin escribir código:
- Nodo AI Agent que admite Anthropic, OpenAI, Google, Mistral, Groq, modelos locales vía Ollama.
- Tools que el agente puede invocar: ejecución de código JavaScript/Python, llamadas HTTP, consultas SQL, lectura/escritura de Notion, Sheets, Airtable, Slack, Telegram.
- Memory persistente (Postgres, Redis, vector store).
- Workflow tools: un agente puede invocar otro workflow n8n como herramienta, encadenando agentes especializados.
El patrón típico en una pyme: un workflow que escucha un correo entrante, lo analiza con un agente IA, decide si es factura, lead, queja, ticket de soporte, y enruta automáticamente — todo sin que un dev mantenga código. La curva de aprendizaje es de horas, no semanas.
Alternativas a n8n para pymes
- Make (antes Integromat). Visual, comercial, con soporte de IA. Curva aún más suave que n8n pero menos control.
- Zapier AI. Integra agentes IA en sus zaps. Buena cobertura SaaS, precio elevado a escala.
- Pipedream. Code-first con IA, para perfiles más técnicos.
- Vercel Workflow / Workflow DevKit. Si tu stack ya vive en Vercel, conviene mirar la opción durable-execution con TypeScript.
- LangFlow / LangGraph. Si necesitas grafos complejos con bifurcaciones y revisión humana en el bucle.
Casos PYMES reales
Tres casos que ilustran el ROI cuando vibe coding se aplica bien — y dos donde fue mejor parar.
Caso 1 · Despacho de abogados (8 personas)
Problema: 6-8 h semanales del paralegal en revisar contratos tipo y extraer cláusulas para cuadro de seguimiento. Solución vibe-coded en Claude Code (2 sesiones de 3 h): pipeline en Python que descarga PDFs de DocuSign, los pasa a un agente Claude que devuelve JSON con campos extraídos, lo vuelca a Notion. Resultado: paralegal recuperó 5 h/semana, error de transcripción bajó de ~3 % a ~0,4 % medido sobre 200 contratos.
Caso 2 · E-commerce nicho (4 personas)
Problema: descripción de producto manualmente redactada para 600 SKUs, atrasada respecto al catálogo real del proveedor. Solución vibe-coded en Cursor (1 día): script que lee feed CSV del proveedor, usa Claude para generar descripción siguiendo guía de estilo de marca, sube a WooCommerce vía API, marca para revisión humana. Resultado: catálogo actualizado en 48 h, 580 fichas listas, 20 marcadas para revisión manual.
Caso 3 · Agencia de marketing (12 personas)
Problema: generación mensual de 30 informes de clientes con datos de GA4, Search Console, SEMrush. Tiempo previo: ~40 h/mes entre dos analistas. Solución vibe-coded en n8n (3 sesiones): workflow con triggers programados, agente que consulta APIs, genera narrativa en formato cliente, sube PDF a Drive del cliente, notifica por Slack. Resultado: 40 h → 4 h/mes (solo revisión y firma). ROI claro pero requirió revisión inicial intensa para evitar hallucinations en cifras (se añadió validación cruzada de números).
Anti-caso 1 · Startup que intentó vibe-codear su core SaaS
Equipo de 3 founders no-técnicos quiso construir su producto SaaS B2B desde cero con Replit Agent y Cursor en 6 semanas. Llegaron a un MVP funcional pero con tres problemas que reventaron al onboardear los primeros 20 clientes: (1) inyecciones SQL no detectadas porque los tests generados por el modelo no las cubrían, (2) lógica de autorización inconsistente entre módulos (el agente no mantuvo invariante de seguridad), (3) deuda técnica masiva — 18 000 líneas que ningún humano del equipo había leído. Refactor obligó a contratar un CTO senior por 3 meses. Lección: el vibe puro funciona para herramientas internas auto-contenidas, no para SaaS multi-tenant con datos de clientes en producción.
Anti-caso 2 · Migración de ERP por consultor junior
Consultor junior aceptó migrar un ERP legacy a base de scripts generados por Claude Code en cliente B2B. Sin reviews, sin tests funcionales, con datos reales en pre-producción. Tras dos semanas detectó que un campo "fecha de baja" se había mapeado mal y había marcado activos como inactivos a 1 200 clientes en el nuevo ERP. Rollback de 6 días de trabajo. Lección: vibe coding NO sustituye al diseño de migraciones por alguien con experiencia en el dominio de negocio.
Un workflow diario realista 2026
Para una pyme que arranca con vibe coding, el workflow productivo del primer trimestre tiene un patrón repetible. La sesión típica de una mañana de desarrollo se parece a esto:
- Daily de 10 minutos donde el equipo decide qué tareas son aptas para vibe coding (auto-contenidas, sin tocar pago o autenticación) y cuáles requieren codificación manual con revisión.
- Bloque de 90 minutos con Cursor o Claude Code para un objetivo concreto: refactorizar un módulo, automatizar un report, montar un endpoint nuevo. El agente trabaja, el humano evalúa y guía.
- Pasada de tests adversariales: el humano pide al agente que escriba 8-10 tests que intenten romper el código generado. Si alguno falla, se ajusta antes de seguir.
- Code review entre dos personas: cualquier merge a main pasa por review humana, aunque el código sea del agente. Si el revisor no entiende algo, el autor debe poder explicarlo (regla anti-vibe-puro).
- Merge + deploy en preview con verificación manual del comportamiento real en navegador.
- Cierre del día: actualizar
CLAUDE.md/.cursorrulescon cualquier convención aprendida durante la sesión, para que la siguiente arranque con más contexto.
Este patrón mantiene la velocidad del vibe coding sin descuidar la calidad. Equipos que se saltan los pasos 3, 4 y 6 son los que acumulan deuda técnica a los pocos meses.
Riesgos: deuda técnica, calidad, seguridad
Los vendedores de herramientas no van a contarte estos riesgos. Los conviene enumerar para tomar decisiones con criterio:
1. Deuda técnica invisible
El código generado por un agente puede funcionar al primer test y ser difícil de mantener. Variables mal nombradas, estructuras que no siguen el estilo del repo, lógica duplicada, dependencias innecesarias. Si nadie revisa, la deuda crece. La práctica sana: en cada sesión, después del prompt-vibe inicial, una pasada de "limpieza guiada" donde el agente refactoriza siguiendo guía de estilo concreta.
2. Calidad de tests engañosa
Los agentes tienden a generar tests que verifican el camino feliz y omiten edge cases. Resultado: cobertura 90 % aparente pero bugs en producción. La práctica sana: revisar manualmente los tests críticos o pedir al agente que escriba tests adversariales explícitos ("escribe 10 tests que intenten romper esta función").
3. Seguridad por defecto débil
Los modelos tienden a generar código funcional pero no seguro por defecto. Cadenas SQL concatenadas, validación de entrada laxa, secretos en código o logs, CORS permisivo. La práctica sana: integrar un linter de seguridad (Semgrep, CodeQL, Snyk) que corra en cada PR, e indicar explícitamente en el prompt "este código va a producción multitenant, aplica defensa en profundidad".
4. Hallucinations en código
El agente puede inventar funciones de librería que no existen, parámetros incorrectos, versiones inexistentes. Aunque en 2026 es mucho menos frecuente que en 2023, sigue ocurriendo en librerías nicho. La práctica sana: ejecutar siempre el código generado en un entorno aislado antes de aceptarlo y desconfiar de cualquier dependencia poco conocida.
5. Coste impredecible
Una sesión larga de Claude Code o Cursor con tokens muy generosos puede costar 5-20 €. A volumen de equipo, escala. La práctica sana: presupuesto mensual por persona, monitorización de gasto, modelos más baratos (Haiku, Mini) para tareas repetitivas y modelos premium solo para razonamiento complejo.
6. Pérdida de conocimiento operativo del equipo
Si los seniors delegan en agentes y los juniors no ven nunca el código, el equipo pierde capacidad propia. La práctica sana: dedicar 1-2 horas semanales a revisión humana del código generado, en formato de mentoring inverso (juniors explican al senior qué hizo el agente).
7. Cumplimiento legal y propiedad intelectual
Código generado por un LLM entrenado con repositorios licenciados puede arrastrar restricciones de licencia. Los principales proveedores (Anthropic, OpenAI, GitHub Copilot Enterprise) ofrecen indemnización condicionada — léela. Si tu producto va a venderse a la administración, valida que las licencias son compatibles con la cláusula de software libre del esquema nacional cuando aplique.
El perfil "vibe engineer" en 2026
El mercado dev está creando una nueva categoría profesional: el vibe engineer. No es un junior que usa Cursor para programar más rápido; es un senior con criterio que orquesta agentes y revisa output. Las competencias que el mercado valora:
- Diseño de prompts complejos (system prompts, ejemplos few-shot, gestión de contexto, MCPs).
- Lectura crítica de código generado en cualquier lenguaje (poliglota por necesidad).
- Diseño de tests adversariales que detecten lo que el modelo va a omitir.
- Arquitectura de software tradicional: sigue siendo decisiva. El agente programa funciones; el humano diseña sistemas.
- Cumplimiento y seguridad por diseño: RGPD, AI Act, OWASP, secrets management.
- Orquestación de pipelines de agentes en n8n, LangGraph o equivalentes.
Para una pyme española la implicación es que el perfil dev no desaparece: cambia. Un equipo de 4 puede dejar de necesitar a 8 (productividad multiplicada por el agente) pero los 4 que queden deben ser senior con experiencia en arquitectura, seguridad y dominio del negocio. La pyme que apueste por sustituir seniors por juniors con vibe va a pagar la factura en deuda técnica e incidentes 12-18 meses después.
Preguntas frecuentes sobre vibe coding
¿Qué diferencia hay entre vibe coding y programar con Copilot?
Copilot tradicional asiste línea a línea: el humano escribe y el modelo sugiere completar. Vibe coding va un paso más allá: el humano describe el objetivo en lenguaje natural y el modelo (Claude Code, Cursor Composer, Windsurf Cascade) escribe bloques completos, ejecuta comandos, edita varios archivos en paralelo y depura. La diferencia clave es el nivel de delegación: en Copilot el humano pilota, en vibe coding el humano dirige al agente piloto. Para tareas pequeñas y auto-contenidas, vibe coding es mucho más rápido; para producción crítica, hay que mantener supervisión.
¿Puedo construir un SaaS entero solo con vibe coding?
Técnicamente puedes llegar a un MVP funcional en semanas, como demostraron muchos founders en 2024-2025 con Replit Agent o Cursor. En la práctica, llevar ese MVP a producción multitenant con clientes reales casi siempre exige refactor por desarrolladores senior. Los problemas típicos son inconsistencias de autorización entre módulos, lógica de negocio duplicada, falta de tests adversariales, mala gestión de errores y dependencias innecesarias. Vibe coding es excelente para validar idea y captar primeros usuarios; para escalar y vender a clientes corporativos hay que invertir en arquitectura humana.
¿Qué herramienta de vibe coding elijo en 2026 si no soy desarrollador profesional?
Para un profesional no-dev (marketer, abogado, analista, consultor) que quiere automatizar tareas internas, la combinación más productiva en 2026 es Cursor (editor con IA) para crear scripts y herramientas locales más Claude Code para terminal y operaciones del sistema, complementado con n8n para automatizaciones visuales recurrentes. Si el caso de uso es full-stack web, Vercel v0 y Replit Agent permiten partir de cero con prompts. Lo importante es elegir una herramienta y profundizar 4-6 semanas antes de saltar a otra: el coste de cambio es la curva de prompts y configuraciones.
¿Es seguro pasar datos de clientes a Claude Code o Cursor?
Depende del plan contratado. Los planes empresa de Anthropic (Claude for Work / Enterprise) y Cursor Business / Enterprise incluyen cláusulas que impiden que tus datos se usen para entrenamiento de modelos futuros, residencia de datos en regiones específicas (UE disponible en 2026) y DPAs alineados con RGPD. Los planes gratuitos o de consumidor no garantizan lo mismo. Para una pyme española que maneje datos de clientes sujetos al RGPD, lo prudente es contratar el plan empresa y mantener una lista clara de qué datos pueden tocar los agentes y cuáles no.
¿Cómo evito la deuda técnica del código generado por agentes?
Cuatro prácticas concretas. (1) Define guía de estilo del repo (CLAUDE.md, .cursorrules, equivalente) que el agente respete en cada sesión. (2) Tras cada sesión productiva, una pasada de refactor donde el agente limpia siguiendo la guía. (3) Tests de regresión que se ejecuten en CI antes de cada merge. (4) Revisión humana periódica de código generado, en formato pair-review entre senior y junior o entre dos seniors. Estas cuatro prácticas reducen la deuda al nivel del código escrito por un equipo humano experimentado, sin perder velocidad de vibe coding.
¿El vibe coding sustituye a los desarrolladores en mi pyme?
No sustituye, recompone. Un equipo de 4 desarrolladores senior con vibe coding bien aplicado puede mantener el output de un equipo previo de 7-8 sin vibe. Pero ese equipo de 4 debe ser senior: con experiencia en arquitectura, dominio del negocio, seguridad y revisión crítica. Sustituir seniors por juniors con vibe coding es un error que se paga en deuda técnica e incidentes a 12-18 meses. El mercado va a pagar más por seniors que orquestan agentes que por juniors que solo prompetean — y va a pagar todavía más por seniors con experiencia en RGPD y AI Act.
¿Vibe coding y AI Act son compatibles?
Sí, con tres precauciones. (1) Si tu pyme desarrolla un sistema de IA del Anexo III (alto riesgo) y lo construye con ayuda de agentes, las obligaciones de gobernanza, documentación técnica y supervisión humana del AI Act no se relajan: el responsable sigues siendo tú como proveedor. (2) Si los agentes acceden a datos personales, el RGPD aplica plenamente (base legal, DPA con el proveedor del agente, derechos del interesado). (3) El Art. 4 del AI Act exige alfabetización en IA del personal: si tu equipo usa Claude Code o Cursor a diario, debes documentar la formación y la política interna de uso. Conviene crear esa documentación ahora, antes de agosto 2026, no después.