Seguridad15 de marzo de 20265 min lectura

Coding assistants privados: por qué tu equipo no debería enviar código a APIs de terceros

El 63% de las empresas ha restringido qué herramientas de IA generativa pueden usar sus empleados y el 27% las ha prohibido directamente para determinadas aplicaciones (Cisco Data Privacy Benchmark 2024). Hay alternativa.

Copilot y Cursor han cambiado la productividad del desarrollo. También han creado el mayor canal de exfiltración de propiedad intelectual que jamás ha tenido una empresa de software — uno en el que cada desarrollador participa todos los días, con las mejores intenciones.

Qué viaja exactamente con cada prompt

Un prompt típico no es ‘hazme una función que sume dos números’. Es el fichero entero en el que trabajas, más el contexto: imports, nombres de variables, rutas, endpoints, secretos mal gestionados, nombres de clientes que aparecen en tests. El modelo necesita ese contexto — por eso funciona. Pero el proveedor se lo queda.

Copilot Business (GitHub)

No entrena con tu código. Pero transita por servidores en EEUU y puede ser requerido bajo CLOUD Act.

Cursor Pro

Transporta el archivo activo completo + contexto a OpenAI/Anthropic. Política de retención variable.

ChatGPT / Claude copy-paste

Sin garantías de residencia; entrenamiento opt-out no siempre aplicado.

Tabnine Enterprise (on-prem)

La excepción: despliegue local real. Coste e infra más elevados.

El coste real de un leak

Samsung prohibió el uso de ChatGPT internamente en 2023 tras descubrir que un ingeniero pegó código propietario de un chip para corregir un bug. El código quedó en los servidores de OpenAI. No hubo brecha técnica — hubo flujo normal de trabajo. El incidente aceleró en 3 años la inversión de Samsung en LLMs internos.

La lección operativa del caso Samsung no es técnica — es de producto interno: prohibir es fácil, sustituir es lo caro. Si no ofreces al equipo una alternativa rápida, segura y productiva, vuelven a pegar código en su cuenta personal y la prohibición se convierte en letra muerta.

Qué pide un coding assistant privado para ser viable

Modelos de calidad competitiva con GPT-4 / Claude — open-source como Qwen2.5-Coder-32B, DeepSeek-Coder-V3, Llama-3.3-70B alcanzan ya un 85-92% en benchmarks HumanEval+.
Latencia por debajo de 300 ms para autocompletado, lo que exige GPUs locales de última generación, no GPUs compartidas de hace dos años.
Integración con IDE (VS Code, JetBrains) sin pedir a cada desarrollador configurar un proxy manual.
Almacenamiento persistente para contexto de proyecto (RAG sobre el repo interno) sin que ese contexto se mueva.

Cómo lo montamos en GPU Solutions

Levantamos el sandbox con los modelos pre-cargados, montamos el almacenamiento Exascaler para el repositorio y el contexto, abrimos un endpoint SSH/HTTPS solo accesible desde tu VPN. El equipo instala la extensión de VS Code o JetBrains y apunta al endpoint. Desde ese momento ninguna línea de código sale del perímetro de Madrid. Tiempo de provisión: 48-72 h.

No es un POC. Es el setup de referencia que desplegamos para equipos de 10-200 desarrolladores, validado en nuestro propio laboratorio bajo cargas reales. El coste no compite con Copilot Business en €/dev/mes — y no tiene por qué competir ahí: lo que se paga es no enviar una sola línea de código fuera de tu perímetro y no quedar sujeto a la CLOUD Act. Cuando tu CISO firma el análisis de riesgo de IP, ese diferencial deja de ser una partida contable para convertirse en una cobertura.