Aplicación del Aprendizaje Automático
Aplicación del Aprendizaje Automático
Codigos para inscribirse en el grupo de CLASSROOM PARA ENTREGRAR LAS RUBIRCAS
NOTA
Por favor poner su nombre completo por apellidos al darse de alta MANUAL
Grupo 401 código de Classroom r22zh4vh
Grupo 402 código de Classroom umjqen63
ACTIVIDADES EVALUATIVAS:
AE 1.1.1(20%) 28-feb-2025
AE 1.2.1 (30%) 10-abr-2025
AE 2.1.1 (30%) 28-may-2025
AE 2.2.1 (20%) 27-jun-2025
código para importar base de datos a colab
este código se usa para poder importar el archivo CSV de la base de datos
from google.colab import files
datos = files.upload()
print(datos)
Investigar sobre los problemas típicos que pueden surgir en los datos, como valores faltantes, valores atípicos, datos duplicados o inconsistentes.
• Investigar sobre las técnicas de exploración de datos: como la visualización de datos, el análisis estadístico y la identificación de patrones.
• Elaborar un diagrama de procesos sobre las técnicas para manejar valores faltantes, como la eliminación de filas o columnas con valores faltantes, la imputación de valores faltantes utilizando técnicas como la media o la mediana, o el uso de algoritmos de imputación más avanzados.
• Elaborar un listado de las técnicas para detectar y manejar valores atípicos, como la identificación de umbrales basados en estadísticas, la transformación de variables o el uso de algoritmos de detección de anomalías.
Investiga en al menos dos IA y define cada uno de los siguientes puntos
A.Exploración de datos
• Análisis estadístico
• Visualización de datos
• Identificación de valores atípicos
• Datos faltantes
B.Limpieza de datos.
• Manejo de valores faltantes
• Imputación de datos
• Eliminación de duplicados
• Corrección de errores
C.Transformación de datos
• Normalización
• Estandarización
• Discretización
• Codificación de variables categóricas
D.Selección de características
• Métodos univariados
• Métodos multivariados
• Análisis de correlación
• Eliminación de características redundantes
E. Manejo de datos desequilibrados
• Técnicas de submuestreo
• Sobremuestreo
• Ajuste de pesos
F. Integración de datos
• Combinación de múltiples fuentes de datos
• Resolución de conflictos
• Manejo de datos inconsistentes
G.Reducción de dimensionalidad
• Técnicas PCA (Análisis de componentes principales)
• Técnicas LDA (Análisis discriminante lineal)
H.Validación de datos
• Particionamiento de datos en conjunto
• Entrenamiento
• Validación y prueba
• Técnicas de validación cruzada
I. Automatización de la limpieza y preparación de datos.
• Uso de herramientas y bibliotecas.
- Pandas (ptython)
- Numpy
- Scikit-learn
• Documentación y registro de procesos de limpieza y preparación de datos.
- Buenas prácticas
- Trazabilidad
- Reproducibilidad
• Consideraciones éticas en la limpieza y preparación de datos.
• Privacidad
• Confidencialidad
• Protección de datos sensibles
• Optimización de la eficiencia en la limpieza y preparación de datos
- Técnicas de procesamiento paralelo
- Técnicas de procesamiento distribuido
• Casos de estudio y ejemplos prácticos de limpieza.
• Preparación de datos en diferentes dominios y aplicaciones.
• Retos y tendencias en la limpieza y preparación de datos.
- Manejo de datos no estructurados.
- Aprendizaje automático en tiempo real.
- Integración de datos en la nube.