AI Software Engineer
Formacion alternativa de alta calidad. Todos los recursos son de acceso gratuito verificado al momento de publicacion.
Duracion
12–18 meses
Dedicacion
~15h/sem
Ingenieria de Software
“Sin esta base, todo lo que sigue es scripting glorificado. La mayoria de "AI engineers" fracasan aqui, no en el modelo.”
Objetivo
Dominar Python a nivel profesional, diseno de sistemas, testing, CI/CD y SQL como ciudadano de primera clase.
CS50 (Harvard)
Intro a CS con rigor
Missing Semester (MIT)
Shell, Git, debugging, profiling
Python for Everybody
UMich / Dr. Chuck
Real Python
Concurrencia, profiling, testing
SQLBolt
SQL interactivo desde cero
Select Star SQL
SQL analitico con dataset real
System Design Primer
Trade-offs, escalabilidad
DDIA (Kleppmann)
Resumenes comunitarios
Un proyecto Python con tests (pytest), CI/CD (GitHub Actions), SQL, y documentacion.
Fundamentos Matematicos
“No para resolver ejercicios, sino para entender que hace un optimizer y por que ciertos modelos colapsan.”
Objetivo
Algebra lineal, calculo, probabilidad y estadistica bayesiana orientados a ML. Teoria de la informacion basica.
3Blue1Brown — Linear Algebra
Essence of Linear Algebra
3Blue1Brown — Calculus
Essence of Calculus
3Blue1Brown — Neural Nets
Backprop visual
Khan Academy
Estadistica y Probabilidad
StatQuest
Bayesian, distribuciones, tests
MML Book
Mathematics for Machine Learning
Chris Olah — Info Theory
Visual Information Theory
Entropia, KL divergence, cross-entropy loss — si no entiendes por que tu loss function es esa, estas operando a ciegas.
ML Clasico
“El objetivo no es "saber sklearn". Es desarrollar la intuicion de cuando NO usar deep learning.”
Objetivo
Bias-variance, regularizacion, feature engineering, seleccion de modelos. Metricas en contexto de negocio.
Stanford CS229
ML teorico riguroso (Andrew Ng)
CS229 Notas
Notas de curso oficiales
ML Zoomcamp
End-to-end con deployment
StatQuest — ML
Playlist completa de ML
Scikit-learn Guide
La mejor doc de ML aplicado
Kaggle Learn
ML practico con notebooks
Cuando random forest supera a un modelo lineal y por que?
Que significa recall 0.95 en fraude vs. recomendador?
Como detectas data leakage en cross-validation?
Deep Learning
“Transformers desde la mecanica, no desde la API.”
Objetivo
Attention, positional encoding, scaling laws. Training dynamics. PyTorch como herramienta, no como identidad.
Karpathy — Zero to Hero
Neural Networks from scratch
Karpathy — LLM Deep Dive
Deep Dive into LLMs
MIT 6.S191
Intro to Deep Learning (2026)
Stanford CS224N
NLP with Deep Learning
Illustrated Transformer
Jay Alammar — visual guide
Attention Is All You Need
Paper original
PyTorch Tutorials
Documentacion oficial
d2l.ai
Dive into Deep Learning
Lectura complementaria esencial
Ingenieria de LLMs
“Tres ramas: prompting, RAG, fine-tuning. La decision de cual aplicar es mas importante que saber ejecutar las tres.”
Objetivo
Dominar prompting como ingenieria, RAG como arquitectura de sistemas, fine-tuning como ultimo recurso informado.
HF LLM Course
Hugging Face, actualizado 2025
LLM Zoomcamp
RAG, fine-tuning, produccion
Anthropic Prompt Guide
Prompt engineering oficial
OpenAI Cookbook
Patterns de produccion
Maximizing LLM Perf
Survey de tecnicas (OpenAI)
RAG Chunking (Pinecone)
Chunking strategies
LoRA Paper
Low-Rank Adaptation
PEFT Docs
Hugging Face PEFT
LLM-Twin Course
RAG en produccion
¿El conocimiento cambia frecuentemente?
→ Si → RAG
→ No → ¿El comportamiento del modelo necesita cambiar?
→ Si → ¿Tienes >1000 ejemplos de calidad?
→ Si → Fine-tuning (LoRA/QLoRA)
→ No → Few-shot prompting
→ No → Zero-shot con system prompt optimizado AI en Produccion
“Aqui muere el 90% de los "AI engineers" del mercado.”
Objetivo
Serving, optimizacion de inferencia, observabilidad, costos como restriccion de diseno, orquestacion de agentes.
MLOps Zoomcamp
MLflow, Docker, monitoring
Made With ML
MLOps end-to-end
Full Stack DL
Produccion de ML (2022)
ML Engineering (Ng)
Coursera audit gratis
Evidently AI
ML Monitoring Course
vLLM
Serving de alta performance
llama.cpp
Inferencia local optimizada
BentoML
Model serving framework
Costo por query (tokens x precio + compute)
Latencia p50/p95/p99
Throughput (queries/segundo)
Cache hit rate y su impacto en costos
Seguridad y Gobernanza
“Lo que nadie ensena y todos necesitan.”
Objetivo
Prompt injection, evaluacion sistematica, red teaming, gobernanza de datos, etica practica.
OWASP Top 10 LLM
Guia 2025
OWASP GenAI
Detalle por vulnerabilidad
Promptfoo
Red teaming open-source
Simon Willison
Prompt injection research
NIST AI RMF
Risk Management Framework
Anthropic Research
Constitutional AI, RLHF
EU AI Act
Resumen ejecutivo
Ejecutar red team basico contra tu app LLM
Implementar guardrails de entrada/salida
Disenar evaluation framework con metricas humanas + automaticas
Identificar PII en pipelines de datos
Lectura Critica de Papers
“No como bullet point sino como practica semanal. 2-3 papers/semana.”
ArXiv Sanity Lite
Karpathy
Papers With Code
Papers + implementaciones + benchmarks
Yannic Kilcher
Paper reviews con analisis critico
Two Minute Papers
Overview rapido de papers nuevos
How to Read a Paper
Keshav — 3 paginas esenciales
Metodo de lectura
Primera pasada (5 min)
Abstract, figuras, conclusiones. ¿Cual es el claim?
Segunda pasada (30 min)
Metodologia, baselines, ablations. ¿La evidencia soporta el claim?
Tercera pasada (Si vale)
¿Es reproducible? ¿Que asumen que no mencionan? ¿Aplica a tu contexto?
Secuencia y Dependencias
Fase 0 (SWE) ──────────────────────────────┐
│
Fase 1 (Matematicas) ─────┐ │
├── Fase 3 (DL) ── Fase 4 (LLMs) ── Fase 5 (Produccion)
Fase 2 (ML Clasico) ──────┘ │ │
│ │
└───── Fase 6 (Seguridad) ─┘
Fase Transversal (Papers) ── desde Fase 2 en adelante Canales y Comunidades
Lo que NO incluye
Solo relevante si vas a escribir kernels CUDA. Si llegas ahi, ya sabras que lo necesitas.
Es una abstraccion que cambia cada mes. Entiende los patterns subyacentes.
Aprende los conceptos (containers, serverless) y el vendor sera intercambiable.
Integrado en Fase 4 como decision de ingenieria, no como habilidad decorativa.