Andrej Karpathy se une a Anthropic: qué cambia para Claude
En este artículo
El 19 de mayo de 2026, Andrej Karpathy anunció en X que se unía a Anthropic.
No dijo "me contrató Anthropic". Dijo que él eligió unirse. La diferencia importa, y voy a explicar por qué.
Quién es Andrej Karpathy
Si no seguís el mundo del deep learning desde antes de que ChatGPT fuera una palabra, acá va el contexto rápido:
- 2015: Co-fundador de OpenAI, parte del equipo original junto a Altman y Musk.
- 2017–2022: Director de AI en Tesla. Lideró Full Self-Driving y el equipo de visión artificial. Uno de los sistemas de IA más complejos del mundo en escala real.
- 2024: Fundó Eureka Labs, una startup de educación con IA. Creó LLM101n, un curso que miles de personas tomaron gratuitamente.
- 2026: Acuñó el término "vibe coding" — el modo de programar con IA que define cómo millones de desarrolladores trabajan hoy.
PhD de Stanford. Docente para millones a través de YouTube. Investigador que pasó años en la frontera real del campo, no en el lado de las demos.
Cuando alguien con ese perfil elige un lugar para trabajar, la decisión tiene peso.
Su rol en Anthropic: pre-training
Karpathy va a trabajar bajo Nick Joseph, Head of Pretraining de Anthropic.
La tarea concreta: armar un equipo nuevo enfocado en usar Claude para acelerar la investigación de pre-training.
Sí, leíste bien. Usar Claude para mejorar cómo se entrena Claude.
El loop es este:
Claude → investiga cómo mejorar pre-training → mejora Claude → repite
Esto no es un detalle de organigrama. Es una apuesta filosófica: la IA se entrena a sí misma. Y Karpathy, que estudió estos sistemas desde adentro durante más de una década, eligió apostar a que eso es posible y que va a importar.
Por qué dejó su propia empresa para venir
Eureka Labs no cerró. Está "pausada, no cerrada" — él mismo lo dijo en su anuncio:
"I remain deeply passionate about education and plan to resume my work on it in time."
Dejó su startup porque cree que los próximos años en la frontera de los LLMs van a ser especialmente formativos. Esas son sus palabras exactas:
"I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D."
No hay señal más clara de dónde va a pasar lo importante que alguien con opciones eligiendo dónde estar.
Por qué pre-training importa técnicamente
Este es el punto que más se pierde en los resúmenes de noticias sobre la contratación.
Hay varias formas de mejorar un LLM:
| Técnica | Qué hace |
|---|---|
| Pre-training | Entrenamiento masivo sobre billones de tokens. Define el conocimiento base del modelo. |
| Fine-tuning | Ajusta el modelo pre-entrenado para tareas específicas. Opera sobre lo que pre-training dejó. |
| RLHF | Refuerzo por feedback humano. Mejora alineación y comportamiento. Depende del modelo base. |
| RAG | Agrega contexto externo en runtime. No toca los pesos del modelo. |
Pre-training es la capa más profunda. Lo que el modelo puede saber, cómo razona, qué estructuras internas tiene — todo eso se construye en pre-training.
Fine-tuning, RLHF y RAG operan sobre lo que el modelo base ya es. Si mejora el base model, mejora todo lo de arriba sin excepción.
Karpathy no va a trabajar en la capa de aplicación ni en las demos. Va al fondo.
Qué significa para los que construimos sobre Claude
Tres implicaciones directas:
El modelo base de Claude va a mejorar más rápido. Karpathy lleva aceleración de investigación con IA a la capa más profunda del stack. Si el loop "Claude mejora cómo se entrena Claude" funciona, la velocidad de mejora del modelo base sube.
Anthropic gana la guerra de talento técnico. Que el mejor talento elige Anthropic no es un dato de PR — es una señal de dónde creen los expertos que va a pasar lo importante. Y si el mejor talento va ahí, los mejores modelos también.
Todo lo que construimos sobre Claude se beneficia. Agentes, MCPs, workflows, automatizaciones, sistemas multi-agente — todo eso corre sobre el modelo base. Un modelo base mejor es una mejora gratis para toda la capa de aplicación que construimos arriba.
La parte que más me llama la atención
No es la contratación en sí. Es el framing.
Karpathy podría haber seguido con Eureka Labs. Podría haber levantado más capital, construido su visión de educación con IA, que claramente le importa. Eligió pausarla para hacer esto.
Y lo que me llama la atención es la palabra que usó: "formative". No dijo "importante" ni "decisivo". Dijo formativo. Como si los próximos años fueran a definir la forma que va a tener el campo para décadas.
Eso no es hype de contratación. Es una lectura técnica del momento que estamos viviendo.
Si el tipo que estudió deep learning desde los cimientos, que construyó sistemas de visión artificial a escala real, que fundó una startup de educación porque quería enseñar estas cosas — si ese tipo dice que los próximos años en pre-training van a ser formativos, vale la pena tomar esa señal en serio.
Si construís sobre Claude, esto te importa. El modelo que vas a usar en 2027 va a estar moldeado en parte por lo que Karpathy y su equipo armen ahora.
Y si querés seguir de cerca cómo evoluciona el ecosistema Claude desde el lado técnico, cada semana publico análisis en este blog — sin resúmenes de newsletter ni listas genéricas de herramientas.
Nicolas Farchica
Especialista Claude Code
Argentino en Copenhague. Construyo sistemas de agentes IA con Claude Code — agentes, MCP servers y automatizaciones en producción.
Seguir en LinkedIn¿Te resultó útil?
Suscribite para recibir más guías de Claude Code y agentes IA.
Artículos relacionados
Claude for Small Business: Guía Completa del Lanzamiento de Anthropic (Mayo 2026)
Anthropic lanzó Claude for Small Business el 13 de mayo de 2026: 15 workflows listos, 8 conectores con QuickBooks, PayPal y Stripe, y sin costo extra. Acá explicamos qué son las Skills técnicamente, cuáles son las oportunidades reales, y lo que la mayoría de reseñas no te cuenta sobre privacidad.
/goal en Claude Code: dale una meta y dejá que itere solo
Claude Code 2.1.139 trae /goal: definís una condición de éxito y Claude itera turno tras turno hasta cumplirla. Sintaxis exacta, cómo funciona el evaluator interno, los 4 casos oficiales de uso y la receta de una condición que funciona.
CLAUDE.md, Skills, MCPs y Hooks: Cuándo Usar Cada Uno
Hay 4 mecanismos para inyectar contexto en Claude Code. La mayoría usa CLAUDE.md para todo y paga el costo en cada turno. Matriz comparativa con costos reales en tokens, anti-patterns y mi setup en producción.