Skip to the content.

17 — Data Science y Machine Learning

Programar para extraer conocimiento de datos.

🎯 Las 3 carreras de datos

Rol Qué hace
Data Analyst SQL + Excel + dashboards. Reportes para negocio
Data Engineer Pipelines, ETL, infraestructura de datos
Data Scientist Modelos, estadística, ML
ML Engineer Pone modelos en producción
AI Researcher Crea modelos nuevos (papers)

🐍 Stack base: Python

Librerías que SÍ o SÍ tenés que conocer

Librería Para qué
NumPy Operaciones matemáticas en arrays
Pandas Manipular dataframes (tipo Excel)
Matplotlib / Seaborn Gráficos
Plotly Gráficos interactivos
Scikit-learn Machine Learning clásico
PyTorch Deep Learning (lo usa todo el mundo en 2026)
TensorFlow / Keras DL alternativa
Jupyter Notebooks para experimentar
import pandas as pd
df = pd.read_csv('ventas.csv')
df.groupby('mes')['monto'].sum().plot()

📺 Cursos recomendados

Empezar

ML / Deep Learning

Mathematics for ML


🤖 El stack de IA moderno (2026)

Para usar modelos

Para apps con IA

Bases de datos vectoriales

Plataformas de inferencia


📊 SQL para Data

Tan o más importante que Python.

SELECT
  categoria,
  AVG(precio) as precio_promedio,
  COUNT(*) as cantidad
FROM productos
WHERE stock > 0
GROUP BY categoria
ORDER BY precio_promedio DESC;

🛠️ Herramientas del trade

Notebooks

Visualización profesional

Big Data


🎯 Proyectos para portfolio

Análisis

  1. EDA de un dataset de Kaggle — Titanic, COVID, etc.
  2. Dashboard de tus gastos — leer CSVs del banco
  3. Análisis de tu Spotify — usar API

Machine Learning

  1. Predictor de precios (casas, autos)
  2. Clasificador de spam
  3. Recomendador de películas
  4. Detector de fraudes

Deep Learning

  1. Clasificador de imágenes (perros vs gatos)
  2. Generador de texto (con LLM pequeño)
  3. Análisis de sentimientos en reviews

Apps con IA (lo MÁS de moda en 2026)

  1. Chatbot personalizado con RAG sobre tus PDFs
  2. Agente que automatiza emails
  3. Generador de imágenes usando APIs
  4. Buscador semántico de documentos

🏅 Kaggle (la red social de data scientists)


🎓 Camino sugerido

SQL básico  →  Python + Pandas  →  Estadística básica  →
Scikit-learn  →  Deep Learning (PyTorch)  →  LLMs + LangChain

Mes 1-2: SQL + Pandas Mes 3-4: Stats + ML clásico Mes 5-6: Deep Learning Mes 7+: especialización (NLP, CV, RL, LLMs)