Andrej Karpathy se une a Anthropic: qué cambia para Claude

El 19 de mayo de 2026, Andrej Karpathy anunció en X que se unía a Anthropic.

No dijo "me contrató Anthropic". Dijo que él eligió unirse. La diferencia importa, y voy a explicar por qué.

Quién es Andrej Karpathy

Si no seguís el mundo del deep learning desde antes de que ChatGPT fuera una palabra, acá va el contexto rápido:

2015: Co-fundador de OpenAI, parte del equipo original junto a Altman y Musk.
2017–2022: Director de AI en Tesla. Lideró Full Self-Driving y el equipo de visión artificial. Uno de los sistemas de IA más complejos del mundo en escala real.
2024: Fundó Eureka Labs, una startup de educación con IA. Creó LLM101n, un curso que miles de personas tomaron gratuitamente.
2026: Acuñó el término "vibe coding" — el modo de programar con IA que define cómo millones de desarrolladores trabajan hoy.

PhD de Stanford. Docente para millones a través de YouTube. Investigador que pasó años en la frontera real del campo, no en el lado de las demos.

Cuando alguien con ese perfil elige un lugar para trabajar, la decisión tiene peso.

Su rol en Anthropic: pre-training

Karpathy va a trabajar bajo Nick Joseph, Head of Pretraining de Anthropic.

La tarea concreta: armar un equipo nuevo enfocado en usar Claude para acelerar la investigación de pre-training.

Sí, leíste bien. Usar Claude para mejorar cómo se entrena Claude.

El loop es este:

Claude → investiga cómo mejorar pre-training → mejora Claude → repite

Esto no es un detalle de organigrama. Es una apuesta filosófica: la IA se entrena a sí misma. Y Karpathy, que estudió estos sistemas desde adentro durante más de una década, eligió apostar a que eso es posible y que va a importar.

Por qué dejó su propia empresa para venir

Eureka Labs no cerró. Está "pausada, no cerrada" — él mismo lo dijo en su anuncio:

"I remain deeply passionate about education and plan to resume my work on it in time."

Dejó su startup porque cree que los próximos años en la frontera de los LLMs van a ser especialmente formativos. Esas son sus palabras exactas:

"I think the next few years at the frontier of LLMs will be especially formative. I am very excited to join the team here and get back to R&D."

No hay señal más clara de dónde va a pasar lo importante que alguien con opciones eligiendo dónde estar.

Por qué pre-training importa técnicamente

Este es el punto que más se pierde en los resúmenes de noticias sobre la contratación.

Hay varias formas de mejorar un LLM:

Técnica	Qué hace
Pre-training	Entrenamiento masivo sobre billones de tokens. Define el conocimiento base del modelo.
Fine-tuning	Ajusta el modelo pre-entrenado para tareas específicas. Opera sobre lo que pre-training dejó.
RLHF	Refuerzo por feedback humano. Mejora alineación y comportamiento. Depende del modelo base.
RAG	Agrega contexto externo en runtime. No toca los pesos del modelo.

Pre-training es la capa más profunda. Lo que el modelo puede saber, cómo razona, qué estructuras internas tiene — todo eso se construye en pre-training.

Fine-tuning, RLHF y RAG operan sobre lo que el modelo base ya es. Si mejora el base model, mejora todo lo de arriba sin excepción.

Karpathy no va a trabajar en la capa de aplicación ni en las demos. Va al fondo.

Qué significa para los que construimos sobre Claude

Tres implicaciones directas:

El modelo base de Claude va a mejorar más rápido. Karpathy lleva aceleración de investigación con IA a la capa más profunda del stack. Si el loop "Claude mejora cómo se entrena Claude" funciona, la velocidad de mejora del modelo base sube.

Anthropic gana la guerra de talento técnico. Que el mejor talento elige Anthropic no es un dato de PR — es una señal de dónde creen los expertos que va a pasar lo importante. Y si el mejor talento va ahí, los mejores modelos también.

Todo lo que construimos sobre Claude se beneficia. Agentes, MCPs, workflows, automatizaciones, sistemas multi-agente — todo eso corre sobre el modelo base. Un modelo base mejor es una mejora gratis para toda la capa de aplicación que construimos arriba.

La parte que más me llama la atención

No es la contratación en sí. Es el framing.

Karpathy podría haber seguido con Eureka Labs. Podría haber levantado más capital, construido su visión de educación con IA, que claramente le importa. Eligió pausarla para hacer esto. Y desde el lado del producto, Anthropic también sigue moviendo el ecosistema con fuerza: si te interesa cómo los subagentes de Claude Code están cambiando la forma de construir sistemas, es el complemento técnico natural de esta apuesta en investigación.

Y lo que me llama la atención es la palabra que usó: "formative". No dijo "importante" ni "decisivo". Dijo formativo. Como si los próximos años fueran a definir la forma que va a tener el campo para décadas.

Eso no es hype de contratación. Es una lectura técnica del momento que estamos viviendo.

Si el tipo que estudió deep learning desde los cimientos, que construyó sistemas de visión artificial a escala real, que fundó una startup de educación porque quería enseñar estas cosas — si ese tipo dice que los próximos años en pre-training van a ser formativos, vale la pena tomar esa señal en serio.

Si construís sobre Claude, esto te importa. El modelo que vas a usar en 2027 va a estar moldeado en parte por lo que Karpathy y su equipo armen ahora.

Y si querés seguir de cerca cómo evoluciona el ecosistema Claude desde el lado técnico, cada semana publico análisis en este blog — sin resúmenes de newsletter ni listas genéricas de herramientas.

Andrej Karpathy se une a Anthropic: qué cambia para Claude

Quién es Andrej Karpathy

Su rol en Anthropic: pre-training

Por qué dejó su propia empresa para venir

Por qué pre-training importa técnicamente

Qué significa para los que construimos sobre Claude

La parte que más me llama la atención

Artículos relacionados

Claude Fable 5 vs Opus 4.8 vs Sonnet 5: Cuándo Usar Cada Uno

Claude Fable 5 volvió: EEUU levantó el bloqueo tras 19 días

Claude Sonnet 5: rendimiento de Opus a precio de Sonnet