Aplicación de modelos predictivos

Guía Pedagógica y de Evaluación del Módulo

Programa de estudios del módulo

Plan Clase y Sesion

Teoria 1.1.1 a

Preguntas

¿Cuáles son los puntos específicos para los que necesitas la teoría?

busca la teoría adecuada de el siguiente Tema:

Etapas de comprensión del negocio y los datos dentro del proceso de análisis predictivo, mediante la metodología CRISP-DM.

Comprensión del negocio.

- Definición del problema de negocio.

- Evaluación del contexto.

- Establecimiento de propósitos técnicos.

Comprensión de los datos.

- Descripción de los datos.

- Establecimiento del volumen de la información.

Comprensión del negocio

¿En qué consiste la fase de comprensión del negocio dentro de la metodología CRISP-DM?
¿Por qué es importante definir correctamente el problema de negocio antes de iniciar un proyecto de análisis predictivo?
¿Cuáles son los elementos clave en la definición del problema de negocio?
¿Cómo se diferencian un problema de negocio y un problema analítico?
¿Qué riesgos existen si el problema de negocio está mal planteado?
¿Qué aspectos deben considerarse al realizar la evaluación del contexto empresarial?
¿Cómo influyen los recursos disponibles (tiempo, presupuesto, personal) en la evaluación del contexto?
¿Por qué es importante identificar a los stakeholders en la etapa de comprensión del negocio?
¿Qué relación existe entre los objetivos estratégicos de la empresa y el análisis predictivo?
¿Qué son los propósitos técnicos dentro de CRISP-DM y cómo se establecen?
¿Cómo se traducen los objetivos del negocio en objetivos técnicos medibles?
¿Qué métricas pueden utilizarse para evaluar el éxito del modelo predictivo desde el punto de vista del negocio?

Comprensión de los datos

¿Qué actividades se realizan en la fase de comprensión de los datos?
¿Por qué es importante realizar una descripción de los datos antes de modelar?
¿Qué elementos deben incluirse en la descripción inicial de los datos (fuentes, formatos, variables, etc.)?
¿Cómo se puede evaluar la calidad de los datos en esta etapa?
¿Qué problemas comunes pueden detectarse al explorar los datos por primera vez?
¿Por qué es relevante establecer el volumen de la información disponible?
¿Cómo influye el volumen de datos en la selección de herramientas y técnicas de análisis?
¿Qué consecuencias puede tener trabajar con un volumen de datos insuficiente o excesivo en un proyecto predictivo?

Actividad: Mapa Mental – Etapas de Comprensión en CRISP-DM

Objetivo

Visualizar y relacionar los elementos clave de las etapas:

Comprensión del negocio
Comprensión de los datos

Instrucciones

Coloca en el centro del mapa mental el concepto:

Metodología CRISP-DM – Fases de Comprensión
Divide el mapa en dos ramas principales:
- 📌 Comprensión del negocio
- 📊 Comprensión de los datos
Desarrolla cada rama con los siguientes subtemas y conceptos clave.

Estructura del Mapa Mental

1 Comprensión del negocio

🔹 Definición del problema de negocio

¿Qué situación se quiere mejorar?
¿Qué decisión necesita apoyo?
¿Qué impacto económico o estratégico tiene?
Ejemplo: Reducir la tasa de abandono de clientes.

🔹 Evaluación del contexto

Recursos disponibles (humanos, tecnológicos, financieros)
Restricciones legales o éticas
Tiempo disponible
Competencia o entorno del mercado

🔹 Establecimiento de propósitos técnicos

¿Qué tipo de modelo se necesita? (clasificación, regresión, segmentación)
Métricas de éxito (precisión, recall, RMSE, etc.)
Criterios de aceptación del modelo

2 Comprensión de los datos

🔹 Descripción de los datos

Fuentes de datos (internas/externas)
Tipo de variables (numéricas, categóricas)
Significado de cada atributo
Calidad inicial de los datos

🔹 Establecimiento del volumen de la información

Cantidad de registros
Tamaño en almacenamiento
Periodo de tiempo cubierto
¿Es suficiente para entrenar un modelo predictivo?

Buscar en la IA la teoría bien desarrollada de los siguientes temas

Etapas de preparación y modelado de los datos del proceso de análisis predictivo.

Preparación de los datos.

Selección de características.

Generación de variables adicionales.

Limpieza de datos.

Cambios de formato.

Integración de diferentes orígenes de datos.

Modelado de datos.

Técnicas de minería (algoritmos predictivos).

Selección de técnicas de modelado,

Modelado del conjunto de datos.

Ejemplo de prompt

QUIERO QUE ME DES COMO UNA EMPRESA TIPO NETFLIX APLICA DCADA TER,IMO SIGUIETNEA Etapas de preparación y modelado de los datos del proceso de análisis predictivo. Preparación de los datos. Selección de características. Generación de variables adicionales. Limpieza de datos. Cambios de formato. Integración de diferentes orígenes de datos. Modelado de datos. Técnicas de minería (algoritmos predictivos). Selección de técnicas de modelado, Modelado del conjunto de datos.

¿Cómo aplica Netflix el análisis predictivo?

Imagina que Netflix quiere predecir:

Qué serie te va a gustar.
Si vas a cancelar tu suscripción.
Qué tipo de contenido debería producir.

Para lograr eso, pasa por varias etapas:

1️⃣ Preparación y modelado de datos en análisis predictivo

🔹 Preparación de los datos

Aquí Netflix reúne toda la información que tiene de los usuarios:

Qué ven
Cuánto tiempo ven
A qué hora ven
Desde qué dispositivo
Si pausan, adelantan o abandonan

👉 Básicamente: juntan todo el "historial de comportamiento".

🔹 Selección de características

De toda esa información, Netflix decide qué datos realmente sirven para predecir.

Por ejemplo:

✔️ Género favorito
✔️ Tiempo promedio de visualización
✔️ Frecuencia semanal
❌ Color del botón que presionaste (si no aporta nada)

👉 Aquí se eligen las variables más importantes.

🔹 Generación de variables adicionales

Aquí se crean nuevas variables a partir de las existentes.

Ejemplos:

"Nivel de adicción" = horas vistas por semana.
"Probabilidad de abandono" = días sin conectarse + historial de cancelaciones.
"Usuario nocturno" si ve contenido después de las 11pm.

👉 No solo usan los datos tal cual, sino que crean indicadores nuevos.

🔹 Limpieza de datos

Aquí eliminan errores como:

Registros duplicados.
Datos incompletos.
Usuarios que parecen bots.
Información mal registrada.

Ejemplo:
Si un usuario aparece viendo 300 horas en un día… algo está mal 😅

👉 Se corrigen o eliminan esos datos.

🔹 Cambios de formato

Los datos deben estar en formato que la máquina entienda.

Ejemplos:

Convertir "Masculino/Femenino" en 0 y 1.
Convertir fechas en números.
Transformar texto en datos numéricos.

👉 Se estandariza la información.

🔹 Integración de diferentes orígenes de datos

Netflix no solo usa lo que ves.

También puede integrar:

Datos de facturación.
Tipo de plan.
Ubicación.
Tendencias globales.

👉 Une todo en una sola base de datos grande.

2️⃣ Modelado de datos

Ahora viene lo interesante 👇

🔹 Técnicas de minería (algoritmos predictivos)

Netflix usa algoritmos como:

Árboles de decisión
Redes neuronales
Regresión logística
Sistemas de recomendación

Estos algoritmos permiten predecir:

Qué serie recomendarte.
Si vas a cancelar.
Qué portada mostrarte (sí, Netflix cambia la imagen según tu perfil 😎).

🔹 Selección de técnicas de modelado

No todos los algoritmos sirven para todo.

Netflix prueba varios modelos y se pregunta:

¿Cuál predice mejor?
¿Cuál es más rápido?
¿Cuál tiene menos error?

👉 Se queda con el que mejor resultados da.

🔹 Modelado del conjunto de datos

Aquí se entrena el modelo:

Se divide la información en:
- Datos de entrenamiento
- Datos de prueba
El modelo aprende patrones.
Se prueba si realmente predice bien.

Ejemplo:
Si el modelo dice que el 80% de usuarios que ven anime verán cierta serie… y acierta, funciona 🎯

Buscar en la IA la teoría bien desarrollada de los siguientes temas

B. Etapas de evaluación e implantación del modelo dentro del proceso de análisis predictivo.

Evaluación del modelo.

Matriz de confusión (umbrales de acierto).

Precisión del modelo (confiabilidad).

Implantación del modelo.

Visualización de resultados de salida.

Elaboración de conclusiones.

EJEMPLO DE MODELOS

1. Evaluación del modelo

En esta etapa se analiza qué tan bien funciona el modelo predictivo con datos que no utilizó durante el entrenamiento.

Ejemplo

Una empresa de telecomunicaciones crea un modelo para predecir si un

cliente cancelará su servicio.

Después de entrenar el modelo, se prueba con un conjunto de datos nuevos.

Resultado de prueba:

Cliente

Predicción del modelo

Resultado real

1 Cancelará Canceló

2 No cancelará No canceló

3 Cancelará No canceló

4 No cancelará Canceló

Aquí se compara lo que predijo el modelo vs lo que realmente ocurrió.

2. Matriz deconfusión (umbrales de acierto)

La matriz de confusión permite ver cuántas predicciones fueron correctas o incorrectas.

Ejemplo

Canceló

No canceló

Predijo Canceló

40 (Verdadero Positivo)

10 (Falso Positivo)

Predijo No Canceló

5 (Falso Negativo)

45 (Verdadero Negativo)

Interpretación:

Verdaderos

Positivos (VP): el modelo

acertó que el cliente cancelaría.
Falsos

Positivos (FP): el modelo

predijo cancelación pero no ocurrió.

Falsos

Negativos (FN): el modelo no detectó una cancelación.

Verdaderos

Negativos (VN): el modelo acertó que el cliente seguiría.

El umbral define qué probabilidad se considera como predicción positiva.

Ejemplo:

Si probabilidad > 0.5 → cliente cancelará.
Si probabilidad < 0.5 → cliente no cancelará.

3. Precisión del modelo (confiabilidad)

La precisión (accuracy) mide qué porcentaje de predicciones fueron correctas.

Ejemplo

Usando la matriz anterior:

VP = 40
VN = 45
FP = 10

FN = 5

Significa que el modelo acierta el 85% delas veces.

4. Implantación del modelo

Aquí el modelo se pone en funcionamiento en un sistema real para generar predicciones automáticamente.

Ejemplo

Un banco implementa un modelo de predicción de fraude en tarjetas de crédito.

Funcionamiento:

1.Un cliente realiza una compra.

2. El sistema envía los datos al modelo.

3. El modelo calcula la probabilidad de fraude.

4. Si la probabilidad es alta → se bloquea la transacción.

Esto se puede integrar en:

sistemas empresariales
aplicaciones web
sistemas de monitoreo

5. Visualización

de resultados de salida

Los resultados del modelo se

presentan en gráficas o dashboards para facilitar la interpretación.

Ejemplo

Un dashboard muestra:

porcentaje de clientes que podrían cancelar probabilidad de fraude por transacción segmentos de clientes con mayor riesgo

Herramientas comunes:

Tableau

Power BI
Python

Ejemplo de gráfico:

gráfico de barras con clientes de alto, medio y bajo riesgo.

6. Elaboración de

conclusiones

Se interpretan los resultados para tomar decisiones de negocio.

Ejemplo

Conclusiones del modelo de

cancelación:

El 15% de clientes tiene alto riesgo de cancelar.
Los clientes con más de 3 reclamos tienen mayor probabilidad de abandono.

Los clientes con planes más caros cancelan menos.

Decisiones:

ofrecer

promociones a clientes de alto riesgo

mejorar servicio al cliente

lanzar programas de fidelización

Actividad: Análisis de un modelo predictivo

Objetivo: que los alumnos interpreten resultados de un modelo.

Tarea

Entrégales una tabla de predicciones como esta:

Lo que deben hacer

Identificar:
- Verdaderos positivos
- Falsos positivos
- Falsos negativos
- Verdaderos negativos
Construir la matriz de confusión.
Calcular:

Accuracy
Error del modelo

UNIDAD 2.1

Abrir el archivo PDF y pasar la teroria en la libreta parte 1

Abrir el archivo PDF y pasar la teroria en la libreta parte 2

Abrir el archivo PDF y pasar la teroria en la libreta parte 3

Abrir el archivo PDF y pasar la teroria en la libreta parte 4

Tema 2.2.1

de los siguientes puntos realizar 50 preguntas abiertas que las pueses sacar desde la IA estas preguntas las vas a contestar en la libreta

A. Técnicas de optimización

• Algoritmos genéticos

- Operadores genéticos

- Selección

- Cruce

- Mutación

• Algoritmos de enjambre

- Interacción

- Comunicación

• Algoritmos de búsqueda local

• Algoritmos de optimización por

enjambre de partículas

• Algoritmos de optimización por colonia de

hormigas

• Algoritmos de optimización por

enjambre de luciérnagas

B. Evaluación de modelo de aprendizaje

automático

• Definición

• Modelos de aprendizaje automático

C. Técnicas de evaluación de modelos de

aprendizaje

• División de datos

• Validación cruzada

• Métricas de evaluación

- Puntuación F1

- Área bajo la curva ROC

- Error cuadrático medio

AAAU-20 14/ 17

Colegio Nacional de Educación Profesional Técnica

Actividades de evaluación Evidencias a recopilar Ponderación Contenidos

• Curvas de aprendizaje

• Validación en conjunto de datos de prueba

D. Aprendizaje de herramientas no código

• Análisis de datos

• Visión computacional

• Procesamiento de lenguaje natural

Page updated

Google Sites

Report abuse