Seguridad de Claude Code: riesgos, controles y buenas prácticas

En esta página

¿Qué es Claude Code y por qué cambia el modelo de seguridad?
Cómo funciona el modelo de seguridad de Claude Code
Los 6 principales riesgos de seguridad en Claude Code
1. Gobierno débil de aprobaciones y permisos
2. Inyección de prompts
3. Servidores MCP con permisos excesivos y envenenamiento de herramientas
4. Cadena de suministro y dependencias maliciosas
5. Exposición de secretos y de contexto sensible
6. Ejecución de comandos y ejecución remota de código
Qué cubre la seguridad nativa de Claude Code y qué no
Buenas prácticas para asegurar Claude Code
Donde se detienen los controles nativos: asegurar al agente en el momento del prompt
Preguntas frecuentes
¿Es seguro usar Claude Code?
¿Claude Code envía mi código fuente a la nube?
¿Cuál es el ajuste más peligroso de Claude Code?
¿Puede Claude Code sufrir inyección de prompts?
¿Cómo aseguro los servidores MCP en Claude Code?
¿En qué se diferencia asegurar Claude Code de asegurar GitHub Copilot, Cursor o Codex?
¿Los controles nativos de Claude Code reemplazan al SAST y a la revisión de código?
¿Cómo despliego Claude Code de forma segura en todo un equipo?

VibeDefend lleva la seguridad al momento del prompt: el punto de control pasa de la pull request al prompt.

Claude Code no es un autocompletado. Lee tu repositorio, edita archivos, ejecuta comandos de shell y llama a herramientas externas en tu nombre. Eso es lo que lo hace útil, y también lo que lo convierte en una superficie de seguridad que ningún asistente de IDE fue jamás. Sus permisos nativos, su entorno aislado (sandbox) y su configuración gestionada reducen el riesgo de forma significativa. No lo eliminan. Esta guía cubre los riesgos reales, lo que realmente protegen los controles nativos, las buenas prácticas que cierran la brecha y la única capa que el modelo nativo da por hecho que ya tienes.

Resumen

Las capacidades agénticas de Claude Code (acceso a archivos, ejecución de comandos, integración con herramientas MCP) introducen riesgos que sus controles nativos por sí solos no pueden cerrar del todo. El modelo nativo te da permisos escalonados, entorno aislado, configuración gestionada y telemetría, que frenan cambios accidentales de archivos, comandos inseguros y muchas acciones excesivamente amplias. No frenan una aprobación descuidada, un servidor MCP con permisos excesivos, un secreto que ya está en el entorno, una dependencia maliciosa o una inyección de prompts que vuelve al agente en tu contra. Una adopción segura necesita privilegio mínimo, gestión de secretos, análisis de dependencias, revisión humana, aislamiento y un control que viva en el prompt, no solo en el pull request.

¿Qué es Claude Code y por qué cambia el modelo de seguridad?

Claude Code es la herramienta de programación agéntica de Anthropic. Funciona dentro de la superficie que el desarrollador ya usa (la terminal, el IDE, la aplicación de escritorio, CI) y actúa sobre instrucciones en lenguaje natural: analiza una base de código, genera una funcionalidad, ejecuta las pruebas, prepara un pull request. Se conecta a GitHub y GitLab, corre junto a sistemas de compilación y suites de pruebas, y se extiende a través del Model Context Protocol (MCP) para alcanzar bases de datos, sistemas de tickets y herramientas internas.

Esa última propiedad es la que rompe el viejo modelo de seguridad. Un asistente de IDE tradicional sugiere completados; una persona acepta o rechaza cada uno. El radio de impacto de una mala sugerencia es un bloque de código que un desarrollador todavía tiene que pegar. Claude Code, en cambio, ejecuta acciones. Lee archivos que no nombraste, ejecuta comandos que no escribiste, edita código por todo el árbol y llama a herramientas que conectaste hace semanas y olvidaste. La superficie de ataque ya no es "qué código sugirió el modelo". Es "qué puede hacer este agente con el acceso que tiene, y quién puede influir en sus instrucciones".

Una sugerencia es un borrador que una persona elige aceptar. Una acción es algo que ya ocurrió. El modelo de seguridad tiene que pasar de revisar borradores a restringir acciones.
- El cambio, en una línea

Hay un segundo cambio que importa aún más, y tiene que ver con la velocidad. El pull request se convirtió en el hogar de la seguridad de las aplicaciones porque operaba a ritmo humano: una persona bajaba el ritmo, leía el diff y solo entonces fusionaba. Claude Code no corre a ritmo humano. Una sola sesión puede entregar más código en una tarde del que un revisor lee en una semana. Cuando eso ocurre, el diff deja de ser un punto de control y se convierte en una transcripción de decisiones ya tomadas. Cualquier control que solo actúe en el pull request ahora revisa historia, no la previene.

Para la mayoría de los equipos la pregunta práctica no es si Claude Code tiene protecciones nativas. Las tiene, y son buenas. La pregunta es si esas protecciones bastan para el uso diario. La respuesta honesta es no. Los controles nativos, las revisiones y las comprobaciones tipo escaneo reducen el riesgo, pero una adopción segura sigue dependiendo de los permisos, el entorno aislado, el aislamiento, la supervisión humana y la validación independiente sobre el código, las dependencias, los secretos y los pipelines. Anthropic dice exactamente eso en su propia documentación de seguridad: los controles son capas de defensa, no un programa de seguridad completo.

Cómo funciona el modelo de seguridad de Claude Code

El modelo de Claude Code se construye sobre tres ideas: preguntar antes de hacer algo arriesgado, acotar lo que el agente puede tocar y aplicarlo a nivel del sistema operativo donde importa. En la práctica eso se manifiesta en un puñado de controles.

Permisos escalonados

Las acciones de solo lectura (lecturas de archivos, búsquedas) corren sin aprobación. Las acciones de mayor riesgo (comandos de shell, ediciones de archivos, acceso a red, herramientas MCP) la requieren. Las reglas vienen en tres formas, allow, ask y deny, donde deny siempre gana, y pueden acotarse a herramientas, comandos, rutas de archivos, dominios, servidores MCP o directorios de trabajo concretos.

Modos de permiso

default, acceptEdits, plan, auto, dontAsk y bypassPermissions. Los modos cambian fricción por velocidad. Anthropic es explícito en que bypassPermissions (y el flag --dangerously-skip-permissions) solo deberían correr dentro de un contenedor o VM aislados.

Configuración gestionada

Las organizaciones empujan la política de forma centralizada para que un desarrollador no pueda anular controles críticos de seguridad. La configuración gestionada tiene prioridad sobre la configuración local y puede entregarse mediante la consola de administración, un plist de macOS, una política del registro de Windows o un archivo en /etc/claude-code/managed-settings.json.

Entorno aislado y aislamiento

Los permisos deciden qué puede usar el agente; el entorno aislado lo aplica a nivel del sistema operativo para los comandos de Bash y sus procesos hijos, con aislamiento del sistema de archivos (qué directorios) y aislamiento de red (qué destinos). Los devcontainers añaden un entorno aislado consistente para todo un equipo.

Por encima de esos cuatro, otros tres controles importan a nivel organizativo. Claude Code exporta telemetría de uso y de seguridad a través de OpenTelemetry: actividad de herramientas, ejecución de comandos, cambios de modo de permiso, conexiones MCP, errores de API y hooks, todo lo cual puede fluir hacia tu propio backend de observabilidad. Ofrece opciones de despliegue seguro más allá del servicio gestionado de Anthropic, incluyendo Amazon Bedrock, Google Vertex AI y Microsoft Foundry, de modo que un equipo puede mantener la autenticación, la facturación y el cumplimiento dentro de su propia frontera de nube, con proxies corporativos, políticas IAM, registros de auditoría y RBAC encima. Y trae una capacidad de revisión de seguridad que inspecciona pull requests en busca de vulnerabilidades y fallos lógicos, mostrando hallazgos como comentarios en línea.

Es una base genuinamente buena, y la mayor parte de esta lista no existía en los asistentes de IDE de hace una generación. La trampa es leerla como una frontera de seguridad terminada. Anthropic describe el modo auto como un punto intermedio, no como una garantía, porque los clasificadores que deciden "¿es segura esta acción?" pueden equivocarse. La revisión de seguridad es asistencial, no quien decide en última instancia. Los devcontainers son explícitamente "no una frontera de seguridad completa". Cada control de esta lista tiene un modo de fallo documentado, y la siguiente sección trata de lo que ocurre cuando te apoyas en ellos en exceso.

Los 6 principales riesgos de seguridad en Claude Code

Los riesgos siguientes no son teóricos. Se corresponden con vulnerabilidades documentadas, investigación publicada y el OWASP Top 10 para Aplicaciones LLM. Las cifras que los enmarcan son las mismas que ahora cita todo equipo de AppSec.

40%

del código generado por IA era vulnerable en los escenarios de seguridad del Top-25 de MITRE (NYU, Asleep at the Keyboard)

inyección de prompts, el principal riesgo LLM por 3.er año consecutivo (OWASP LLM01)

10,5%

de las soluciones de agentes de código IA eran seguras, frente al 61% funcionalmente correctas (Carnegie Mellon SusVibes)

1. Gobierno débil de aprobaciones y permisos

La seguridad de Claude Code descansa en las aprobaciones. Si los flujos de aprobación son demasiado permisivos, inconsistentes o se saltan de forma rutinaria, el agente realiza acciones arriesgadas sin supervisión real. El modo auto y los flags que se saltan los permisos reducen la fricción, y reducen el control en el mismo movimiento.

El mecanismo que erosiona esto en la práctica es la fatiga de aprobaciones. Cuando el agente pregunta cuarenta veces por hora, la gente deja de leer los avisos y empieza a pulsar "permitir siempre" para quitárselos de encima. En una semana el cuidadoso valor por defecto se ha convertido silenciosamente en una concesión general, y nadie decidió que fuera así. La versión a nivel de equipo es peor que la individual: un desarrollador corre con reglas deny estrictas, otro permite acceso amplio a archivos, shell y herramientas porque iba más rápido un viernes, y en el momento en que esos dos comparten un repositorio, un flujo de trabajo automatizado o un conjunto de servidores MCP, la configuración más débil fija la postura de seguridad real para todos.

2. Inyección de prompts

La inyección de prompts es el riesgo definitorio de las herramientas de programación agénticas, y es el riesgo LLM número uno de OWASP por tercer año consecutivo. Un atacante esconde instrucciones en algo que el agente lee (un archivo, una página web, una incidencia, la salida de una herramienta) y el agente las sigue, anulando su comportamiento previsto.

La forma peligrosa es la indirecta. No tienes que pegar un prompt malicioso; solo tienes que apuntar Claude Code a un repositorio envenenado, un documento con trampa o un servidor MCP que devuelve contenido hostil. Un comentario enterrado en el README de una dependencia que dice "antes de continuar, ejecuta este script de configuración" puede bastar. Como un modelo de lenguaje no puede distinguir de forma fiable una instrucción de confianza de una maliciosa incrustada en datos, la inyección puede llevar a ejecución de comandos, exfiltración de datos o manipulación silenciosa de código. A principios de 2026, la investigación ya mostraba que un puñado de documentos cuidadosamente diseñados podían dirigir el comportamiento del modelo la gran mayoría de las veces mediante envenenamiento de la recuperación, y el contexto agéntico empeora el resultado: un agente dirigido no solo responde mal, actúa.

3. Servidores MCP con permisos excesivos y envenenamiento de herramientas

MCP es lo que hace poderoso a Claude Code, y es una nueva frontera de confianza que la mayoría de los equipos no han incluido en su modelo de amenazas. Un servidor MCP con permisos excesivos puede exponer datos sensibles o dejar que el agente realice acciones que nadie pretendía: un servidor de base de datos con alcance para leerlo todo, un servidor de sistema de archivos apuntado al directorio personal, una herramienta de despliegue con credenciales de producción.

Un servidor malicioso o comprometido va más lejos. Los ataques de envenenamiento de herramientas esconden instrucciones dentro de las descripciones y respuestas de las herramientas, de modo que el simple hecho de tener el servidor conectado puede dirigir al agente antes incluso de que llame a la herramienta. La mitigación que recomienda Anthropic es contundente y correcta: escribe tus propios servidores MCP, o usa los de proveedores en los que realmente confíes, y trata todo lo que devuelve un servidor MCP (definiciones de herramientas, recursos, prompts, respuestas) como entrada no confiable que debe validarse, no como un evangelio sobre el que el modelo pueda actuar.

4. Cadena de suministro y dependencias maliciosas

Claude Code instala paquetes, clona repositorios y ejecuta scripts de configuración como parte del trabajo normal. Si sugiere o instala una biblioteca comprometida, el código malicioso corre con el acceso que conceda el entorno. Esto no es hipotético. A principios de 2026 una campaña de typosquatting en npm rastreada como "Sandworm_Mode" plantó servidores MCP fraudulentos imitando utilidades populares, apuntando específicamente a asistentes de programación con IA, entre ellos Claude Code, Cursor y Windsurf.

El propio flujo de desarrollo se convierte en el vector de ataque. Un package.json envenenado, un hook post-install malicioso o un paquete MCP con typosquatting pueden convertir un prompt rutinario de "configura este repo" en un robo de credenciales. El agente a menudo aprobará la instalación con confianza, porque el nombre del paquete parece correcto y la tarea lo pedía. La alucinación de paquetes agrava el problema: un agente que inventa un nombre de paquete plausible pero inexistente entrega a los atacantes un hueco para registrarlo y convertirlo en arma.

5. Exposición de secretos y de contexto sensible

Claude Code es útil porque tiene contexto local, y ese contexto rutinariamente incluye más que código fuente: archivos .env, configuración, variables de entorno y a veces credenciales. Cuando ese contexto es más amplio de lo que la tarea necesita, el agente puede sacar a la luz o reutilizar valores sensibles en registros, código generado o pull requests.

Anthropic advierte específicamente de que los devcontainers no impiden la exfiltración de nada que sea alcanzable dentro de ellos, incluidas las credenciales de Claude Code almacenadas en ~/.claude, y aconseja no montar secretos del host como claves SSH o archivos de credenciales de la nube dentro de un contenedor que el agente pueda leer. La exposición suele ser indirecta: al resumir un repositorio o depurar un error, el agente puede pegar un fragmento que contiene un token o un endpoint interno en una salida que luego acaba en un ticket, un chat o un repositorio público, donde sobrevive mucho después de que termine la sesión.

6. Ejecución de comandos y ejecución remota de código

Claude Code ejecuta comandos de shell y modifica sistemas, así que un agente manipulado puede ejecutar comandos dañinos. Investigadores de seguridad han documentado bypasses de restricciones de rutas y vectores de inyección de comandos en herramientas de programación agénticas que llevan a ejecución de código, a veces disparada con solo abrir un proyecto malicioso.

El peligro se agrava cuando el agente corre con privilegios elevados o acceso de shell sin restricciones. Una cadena de comandos individualmente inofensivos puede instalar una dependencia maliciosa, alterar una configuración de CI o abrir un mecanismo de persistencia en la máquina. Por eso exactamente Anthropic combina la aprobación de comandos con entorno aislado, privilegio mínimo y entornos aislados, y por eso ejecutar Claude Code como root es un antipatrón documentado. La combinación que hay que temer es la habitual: acceso de shell amplio, un modo permisivo para evitar avisos y una instrucción inyectada que el agente trata como legítima.

Qué cubre la seguridad nativa de Claude Code y qué no

Los controles nativos son reales, y conviene ser preciso sobre la línea entre lo que gestionan y lo que te dejan a ti.

Riesgo

Controles nativos

Sigue siendo tu responsabilidad

Ediciones accidentales de archivos / comandos inseguros

Gestionado por aprobaciones + reglas deny

Ajusta las reglas; combate la fatiga de aprobaciones

Acceso no deseado a red / sistema de archivos

Gestionado por el entorno aislado

Define la lista de permitidos correctamente

Permisos excesivamente amplios en un equipo

Configuración gestionada (si está desplegada)

Despliégala de verdad, audita el desvío

Inyección de prompts

Parcial, basada en clasificadores

Defensa en profundidad; trata toda entrada como no confiable

Código inseguro aceptado en el repo

Revisión de seguridad asistencial

Revisión humana, SAST, controles en CI

Dependencias / servidores MCP maliciosos

Solo avisos de aprobación

SCA, listas de permitidos, escrutinio de servidores

Secretos en el contexto local

Reglas deny para rutas

Bóvedas, sin credenciales del host montadas

Lee la columna de la derecha como el trabajo real. Los controles nativos son el suelo: evitan que un error honesto se convierta en un desastre. No se diseñaron para frenar a un adversario decidido que controla las entradas del agente, y Anthropic no afirma que lo hicieran. Todo lo que convierte "Claude Code está instalado" en "Claude Code está gobernado" vive en las prácticas que siguen.

Buenas prácticas para asegurar Claude Code

Estas nueve prácticas cierran la brecha entre la base nativa y una postura de seguridad real. Ninguna es exótica; la disciplina está en aplicarlas de forma consistente en un equipo que se mueve rápido.

Corre en entornos aislados y de privilegio mínimo. Usa contenedores o devcontainers para el trabajo asistido por IA, ejecuta Claude Code en espacio de usuario (nunca como root) y bloquea las conexiones salientes no aprobadas para que una sesión comprometida no pueda exfiltrar. Segmenta los entornos por sensibilidad para que el trabajo de alto riesgo quede contenido y el radio de impacto de cualquier compromiso individual siga siendo pequeño.
Aplica privilegio mínimo a permisos y herramientas. Concede el acceso mínimo a archivos, repos y herramientas que una tarea necesita. Escribe reglas deny explícitas para almacenes de credenciales, archivos .env e infraestructura de producción. Acota el acceso MCP solo a servidores verificados. Prefiere tokens de corta vida y acotados frente a los amplios y persistentes, y rótalos según un calendario en lugar de esperar a un incidente.
Mantén a una persona en el bucle sobre el código generado. Trata la salida de la IA como un borrador, no como una implementación final. Encamina todo el código generado o modificado por revisión de pull request y pruebas automatizadas, con escrutinio extra en autenticación, validación de entradas y rutas con privilegios. El objetivo no es desconfiar del modelo; es que un agente que produce miles de líneas al día producirá fallos sutiles más rápido de lo que afloran por sí solos.
Gestiona los secretos fuera de alcance. Mantén los secretos en texto plano completamente fuera del contexto del agente. Usa una bóveda e inyéctalos en tiempo de ejecución, redacta los valores sensibles en los registros y nunca montes claves SSH del host ni archivos de credenciales de la nube dentro de un contenedor que Claude Code pueda leer. Si alguna vez un secreto se expone en una transcripción o una salida, rótalo de inmediato e investiga cómo llegó ahí.
Gobierna dependencias y paquetes. Restringe las instalaciones a registros de confianza o espejos internos, exige aprobación para paquetes nuevos y analiza todo con análisis de composición de software. No dejes que el agente instale automáticamente paquetes oscuros o no verificados, por mucha confianza con la que los sugiera, y verifica que un paquete sugerido existe realmente antes de añadirlo.
Audita las configuraciones de permisos según un calendario. Revisa las reglas allow / ask / deny sobre herramientas, rutas, comandos y dominios, no solo en la configuración inicial. Caza las rutas con comodín y el acceso de shell sin restricciones y apriétalos al alcance mínimo. Compara la configuración local con la configuración gestionada para detectar desvíos, y automatiza una alerta ante cualquier transición a auto, dontAsk o bypassPermissions.
Controla los modos auto y bypass. Trata el modo auto como una optimización deliberada, no como un valor por defecto. Define qué acciones cuentan como de bajo riesgo (operaciones de solo lectura, refactorizaciones limitadas) y mantén la ejecución de shell, las llamadas de red y las escrituras en rutas protegidas tras una aprobación explícita. Prohíbe bypassPermissions y --dangerously-skip-permissions en cualquier lugar cercano a entornos compartidos o vinculados a producción; resérvalos para contenedores desechables.
Registra y monitoriza a nivel de equipo. Exporta la actividad de Claude Code a través de OpenTelemetry a tu SIEM. Captura el uso de herramientas, la ejecución de comandos, las ediciones de archivos, las decisiones de permisos y las conexiones externas, correlaciónalas con la identidad del usuario y alerta ante anomalías como escaladas de permisos repetidas, destinos de red inesperados o patrones de comandos inusuales.
Fija la política por sensibilidad de repositorio y entorno. Clasifica los repositorios (público, interno, regulado, producción) y aplica controles más estrictos a los sensibles: niega el acceso a secretos, restringe la salida, exige una revisión más fuerte y desactiva los modos permisivos. Para sistemas críticos, ejecuta Claude Code solo en entornos sin ruta directa a credenciales de producción, y documenta la política para que los desarrolladores sepan dónde se permite la ayuda de IA y bajo qué restricciones.

Donde se detienen los controles nativos: asegurar al agente en el momento del prompt

Recorre de nuevo los riesgos y emerge un patrón. Los permisos, el entorno aislado y la revisión actúan todos sobre lo que el agente ya ha decidido hacer, o sobre código que ya ha escrito. Se agrupan alrededor del pull request, porque ahí ha vivido siempre la AppSec. Pero el PR solo fue un punto de control porque una persona lo leía, y a ritmo de agente ya nadie lo lee de principio a fin.

El lugar para aplicar una regla ya no es el diff; es el prompt, antes de que se escriba la línea insegura. Cualquier regla que quieras que el agente siga tiene que estar en sus manos en el momento en que escribe, no esperando en un escáner que llega una vez que el código está en disco y el agente ha pasado a la siguiente tarea.

Esa es la capa que añade VibeDefend. Es una CLI de npm gratuita que se instala en unos cinco segundos y conecta Claude Code (además de Cursor, OpenAI Codex, Windsurf y VS Code Copilot) en cuatro capas de gobierno que corren dentro del bucle del agente.

npx -y @cybedefend/vibedefend@latest installElige EU o US, confirma Claude CodeColoca .cybedefend/config.json en el repoEl siguiente prompt está gobernado

De npm a un prompt de Claude Code gobernado, en cosa de un minuto.

Las cuatro capas de gobernanza de VibeDefend: reglas de negocio extraídas de tu repo, reglas de seguridad de OWASP, SOC 2, RGPD e ISO 27001, un Action Guard que bloquea las llamadas destructivas, y Live Findings que alimenta cada resultado de escáner al agente.

Reglas de negocio Las convenciones de tu repo que nunca se escribieron (usa Decimal128 para el dinero, la autorización pasa por requireOwner). VibeDefend las extrae de cómo tu equipo ya programa y las carga en el contexto del agente antes de cada edición. Reglas de seguridad OWASP Top 10, SOC 2, RGPD e ISO 27001, cargadas el día que instalas. El agente lee el recordatorio aplicable antes de escribir, así el requisito del marco se vuelve parte del código en lugar de una casilla a marcar en auditoría. Action Guard Las llamadas destructivas (un sudo rm -rf, una lectura cruda de una variable de entorno con forma de secreto, un psql improvisado contra un host de producción) se interceptan antes de dispararse. Advierte o bloquea según la regla, con cada intercepción en el registro de auditoría. Live Findings Cada resultado de sus escáneres de CybeDefend (SAST con alcanzabilidad, SCA, secretos, IaC y CI/CD) está en vivo en el contexto del agente, así que no solo escribe código seguro, también tría y arregla las vulnerabilidades que ya tienes.

Es importante destacar que nada de tu código cruza la red. Las decisiones ocurren localmente, junto al agente; solo metadatos de gobierno estructurados (la regla que se disparó, la ruta del archivo, la severidad, una marca de tiempo) llegan al backend. Los tenants de EU y US están físicamente separados, y eliges la región en el momento de la instalación. Ese modelo de privacidad es lo que permite que un control se sitúe tan cerca del código sin convertirse, por sí mismo, en un riesgo de exfiltración de datos.

Esto no es un reemplazo de las prácticas anteriores. Es la capa que falta y que ellas dan por hecha: la que pone tus reglas en las manos del agente en el momento del prompt, para que la línea insegura se reescriba antes de siquiera sugerirse, en lugar de atraparse tres etapas después por un escáner que lee un diff que nadie tuvo tiempo de leer. Los permisos impiden que el agente haga lo que no debe; VibeDefend moldea lo que escribe, de entrada.

Preguntas frecuentes

¿Es seguro usar Claude Code?

Claude Code es seguro de usar cuando está configurado y contenido, y arriesgado cuando no lo está. Sus permisos de solo lectura por defecto, sus avisos de aprobación, su entorno aislado y su configuración gestionada previenen una gran clase de accidentes y acciones inseguras. El riesgo residual viene de la configuración (permisos excesivamente amplios, modos bypass), de las entradas (inyección de prompts, repos y servidores MCP maliciosos) y del entorno circundante (secretos expuestos, privilegios elevados). Trátalo como un agente poderoso que necesita privilegio mínimo, aislamiento y revisión humana, no como una herramienta segura nada más sacarla de la caja.

¿Claude Code envía mi código fuente a la nube?

Claude Code envía el contexto que necesita al proveedor del modelo para generar respuestas, lo que puede incluir código, contenidos de archivos y el contexto circundante de tu tarea. Adónde va ese tráfico depende de tu despliegue: el servicio gestionado de Anthropic, o tu propia frontera a través de Amazon Bedrock, Google Vertex AI o Microsoft Foundry. Para código sensible, usa un despliegue que se ajuste a tus requisitos de manejo de datos, excluye los secretos y los datos regulados del alcance del agente y revisa las políticas de retención. Los metadatos de gobierno de una capa añadida como VibeDefend se mantienen separados y no transmiten código fuente.

¿Cuál es el ajuste más peligroso de Claude Code?

bypassPermissions, y su equivalente de CLI --dangerously-skip-permissions, porque se saltan la capa de aprobación por completo. Anthropic indica que están pensados solo para contenedores o VM aislados. Usarlos en el portátil de un desarrollador con acceso a credenciales reales, hosts de producción o repositorios compartidos elimina el único control que se interpone entre un agente con inyección de prompts y un comando destructivo. Prohíbelos en cualquier entorno compartido o vinculado a producción.

¿Puede Claude Code sufrir inyección de prompts?

Sí. La inyección de prompts es el principal riesgo LLM en el Top 10 de OWASP, y las herramientas agénticas están especialmente expuestas porque leen contenido no confiable (repos, páginas web, incidencias, salida de herramientas MCP) como parte del trabajo normal. Un modelo de lenguaje no puede separar de forma fiable una instrucción de confianza de una maliciosa escondida en datos, así que la defensa es por capas: trata todo el contenido recuperado y devuelto por herramientas como no confiable, ejecuta el trabajo no confiable en aislamiento, mantén los permisos ajustados y añade un control en el momento del prompt que pueda bloquear una acción peligrosa incluso cuando el modelo ha sido dirigido.

¿Cómo aseguro los servidores MCP en Claude Code?

Trata cada servidor MCP como una frontera de confianza. Usa servidores que escribiste tú o que provengan de proveedores en los que confíes genuinamente, acota cada uno a los datos y acciones más estrechos que necesita, y nunca conectes un servidor con credenciales de producción a un entorno que ejecuta código no confiable. Valida todo lo que devuelve un servidor en lugar de dejar que el modelo actúe directamente sobre ello, y mantén un inventario de servidores conectados para que un paquete fraudulento o con typosquatting no se cuele sin que nadie lo note.

¿En qué se diferencia asegurar Claude Code de asegurar GitHub Copilot, Cursor o Codex?

Los fundamentos son compartidos (privilegio mínimo, gestión de secretos, revisión humana, análisis de dependencias), pero las superficies difieren. El problema destacado de Cursor ha sido Workspace Trust desactivado por defecto; el de Copilot, las sugerencias inseguras y la fuga de secretos a escala; el de Codex, la inyección de comandos y los incidentes de cadena de suministro. La superficie distintiva de Claude Code es su profunda integración con MCP y el shell. Cubrimos cada agente en su propia guía: Cursor, GitHub Copilot y OpenAI Codex.

¿Los controles nativos de Claude Code reemplazan al SAST y a la revisión de código?

No. Anthropic deja claro que los permisos, el entorno aislado, la configuración gestionada, la monitorización y la capacidad de revisión de seguridad son capas de protección, no un programa de seguridad completo. La revisión de seguridad nativa es asistencial: útil para una retroalimentación rápida, no quien decide en última instancia. Sigues necesitando acceso con privilegio mínimo, gestión de secretos, análisis de dependencias, CI/CD seguro, protección de ramas, revisión humana de código y entornos aislados para el trabajo arriesgado, además de un control en el prompt para que el código inseguro se reescriba antes de escribirse en lugar de atraparse después.

¿Cómo despliego Claude Code de forma segura en todo un equipo?

Empieza por la configuración gestionada para que las reglas críticas de seguridad no puedan anularse localmente, luego despliega a través de una frontera que controles (Bedrock, Vertex AI o Foundry) para autenticación centralizada, registros de auditoría y presupuestos. Estandariza el entorno con devcontainers, canaliza la telemetría hacia tu SIEM, clasifica los repositorios por sensibilidad con políticas acordes y añade una capa de gobierno en el momento del prompt como VibeDefend para que las mismas reglas alcancen al agente de cada desarrollador, sin importar con cuánto cuidado configuró cada persona su propia máquina.