Ciencia de datos con Python
José Eduardo Padilla Beltrán
En un mundo donde el análisis de datos y la inteligencia artificial transforman sectores como la educación, la salud, el comercio o la investigación, este libro se convierte en una guía imprescindible para quienes desean adentrarse en el análisis de datos utilizando Python y las técnicas más actuales de Machine Learning.
A través de un enfoque práctico y didáctico, esta obra acompaña al lector desde los fundamentos de la ciencia de datos hasta la implementación de modelos predictivos avanzados. Aprenderás desde la preparación y limpieza de datos, pasando por el uso de librerías esenciales como NumPy, Pandas y Matplotlib, hasta técnicas avanzadas de transformación y selección de características clave para obtener resultados más precisos y robustos.
Con ejemplos paso a paso, fragmentos de código y recursos complementarios accesibles mediante código QR, este libro es ideal tanto para estudiantes como para docentes, investigadores y profesionales que quieran realizar proyectos de analítica de datos y aprendizaje automático sin necesidad de contar con experiencia previa en programación o estadística avanzada.
Domina el proceso completo: desde la adquisición de datos hasta la toma de decisiones basada en modelos predictivos fiables.
- Escritor
- José Eduardo Padilla Beltrán
- Colección
- Analisis de datos
- Materia
- Ciencia y análisis de datos
- Idioma
- Castellano
- EAN
- 9791387764715
- ISBN
- 979-13-87764-71-5
- Depósito legal
- M-15702-2025
- Ancho
- 17 cm
- Alto
- 24 cm
- Edición
- 1
- Fecha publicación
- 06-08-2024
Disponibilidad
Novedad. Próxima publicaciónÍndice de contenido
INTRODUCCIÓN
CAPÍTULO 1. EXPLORANDO EL APRENDIZAJE AUTOMÁTICO
1.1 UNA INTRODUCCIÓN A LA CLASIFICACIÓN DE MACHINE LEARNING
1.2 PROCESO DE MACHINE LEARNING
CAPÍTULO 2. CIENCIA DE DATOS EN EDUCACIÓN
2.1 ANALÍTICA DE DATOS EDUCATIVOS
CAPÍTULO 3. FUNDAMENTOS DE ANÁLISIS DE DATOS PYTHON
3.1 CONFIGURANDO EL ENTORNO PYTHON
3.2 LIBRERÍAS BÁSICAS DE PYTHON
3.3 BÁSICO DE SINTAXIS DEL LENGUAJE PYTHON
3.3.1 Strings y numéricos
3.3.2 Booleanos
3.3.3 Aritmética
3.3.4 Listas
3.3.5 Tuplas
3.3.6 Diccionarios
3.3.7 Variables
3.3.8 Conversión de tipos de datos
3.3.9 Condicional IF
3.3.10 Condicional ELSE
3.3.11 Condicional ELIF
8 CIENCIA DE DATOS CON PYTHON © RA-MA
3.3.12 Ciclo con FOR
3.3.13 Función RANGE ( )
3.3.14 Ciclo con WHILE
3.3.15 Iterar con Zip
3.3.16 Iterar con Enumerate
3.3.17 Funciones
3.4 BÁSICO DE NUMPY
3.4.1 Aspectos de NumPy
3.4.2 Matrices de NumPy
3.4.3 Atributos de los array de NumPy
3.4.4 Operaciones de NumPy
3.4.5 Indexaciones de NumPy
3.5 BÁSICO DE PANDAS
3.5.1 Aspectos de pandas
3.5.2 Dataframe en Pandas
3.5.3 Atributos de los dataframe de Pandas
3.5.4 Manipular un dataframe de Pandas
3.5.5 Seleccionar filas o columnas de Dataframe
3.5.6 Selección de elementos del Dataframe
3.6 BÁSICO DE MATPLOTLIB.
3.6.1 Aspectos de Matplotlib
3.6.2 Atributos de un gráfico en Matplotlib
3.6.3 Tipos de gráficos en Matplotlib
CAPÍTULO 4. EL PODER DE LOS DATOS
4.1 FUENTE DE DATOS
4.2 PROCESO DE CARGA DE LOS DATOS
4.3 PREPARACIÓN DE LOS DATOS
4.3.1 Identificación de columnas con varianza cero
4.3.2 Identificación de filas con datos duplicados
4.3.3 Identificación de Outliers
4.3.4 Identificación de outliers puntuales por método de desviación estándar
4.3.5 Identificación de outliers puntuales por método de Intercuartiles
4.3.6 Identificación de valores nulos o datos faltantes (NaN)
4.3.7 Manejo de valores nulos (NaN)
4.3.8 Codificar una variable categórica (one hot enconder)
4.3.9 Codificar una variable categórica (codificación de enteros)
4.4 ESTADÍSTICAS DE LOS DATOS
4.4.1 Funciones y estadísticas de un dataframe de Pandas
4.4.2 Agrupar datos de un DataFrame
4.4.3 Gráfico de los datos
4.4.4 Gráfico entre variables
CAPÍTULO 5. EXPLORANDO MÉTODOS PARA TRANSFORMACIÓN DE LOS DATOS
5.1 REESCALA DE DATOS
5.2 ESTANDARIZACIÓN DE DATOS
5.3 NORMALIZACIÓN DE DATOS
5.4 TRANSFORMACIÓN ROBUSTA O ESTANDARIZACIÓN ROBUSTA
5.5 TRANSFORMACIÓN DE BOX — COX
5.6 TRANSFORMACIÓN DE YEO-JOHNSON
CAPÍTULO 6. EXPLORANDO MÉTODOS PARA SELECCIÓN DE CARACTERÍSTICAS
6.1 MÉTODOS DE FILTRO
6.1.1 Correlación de Pearson
6.1.2 Anova
6.1.3 Chi-cuadrado
6.1.4 Información mutua
6.2 MÉTODOS DE ENVOLTURA (WRAPPER) O ENVOLVENTES
6.2.1 Eliminación de Características Recursivas (RFE)
6.2.2 Eliminación hacia atrás (Backward selection)
6.2.3 Selección hacia adelante (Forward Selection)
6.2.4 Eliminación bidireccional (Bi-directional elimination)
6.3 MÉTODOS EMBEBIDOS
6.3.1 Regresión lineal
6.3.2 Regularización Lasso
6.3.3 Regularización Ridge
6.4 METODOS DE ENSAMBLE
6.4.1 Árboles de decisión (CART)
6.4.2 Ramdom Forest (Bosque aleatorio)
6.4.3 ExtraTreesClassifier (Árboles extremadamente aleatorios)
6.4.4 Eliminación de características recursivas RFECV con métodos de ensamble
6.4.5 XGBoost
6.4.6 CatBoost
6.4.7 LightGBM
REFERENCIAS BIBLIOGRÁFICAS
Libros relacionados
(IFCT159) Introducción al Big Data e Inteligencia artificial
Big data e inteligencia artificial. Fundamentos, tecnologías y aplicaciones reales
(IFCD0011) Desarrollo y visualización de datos con Python
(IFCD092PO) Desarrollo de aplicaciones basadas en deep learning usando Tensorflow/Keras
(IFCD112) Resolución de problemas multisectoriales: Modelos de machine learning, deep learning y uso masivo de datos
(IFCT0022) Big Data
Excel y Power Bi. El cóctel perfecto
(IFCT56) Excel avanzado y Power BI
Power BI. Curso práctico
Ingeniería de datos. Diseño, implementación y optimización de flujos de datos en Python