Data Mining. Soluciones con Enterprise Miner.

La finalidad de este libro es presentar los temas de minería de datos con un enfoque eminentemente práctico. El contenido de cada capítulo comienza exponiendo los conceptos adecuados, ilustrándolos a continuación con ejemplos prácticos resueltos con Enterprise Miner, lo que constituye un valor añadido esencial de este texto.

Tras la presentación del concepto de Data Mining y la descripción del entorno de Enterprise Miner para la resolución de problemas prácticos, se detallan las distintas técnicas de minería de datos. Inicialmente se aborda la selección de datos y muestras, la exploración y análisis interactivo de datos y su depuración y modificación. Todo ello dentro del entorno de la aplicación más completa que hay en el mercado del software.

A medida que avanza el contenido del libro se tratan técnicas específicas de Data Mining, como son el clustering, los modelos, los árboles de decisión, las redes neuronales, las técnicas de predicción, de reducción de la dimensión y de clasificación. Cada una de estas técnicas se ilustra con un ejemplo práctico y, al final de cada capítulo, se presentan ejemplos completos resueltos con Enterprise Miner.

La interactividad de los ejemplos permite al lector ejecutarlos sobre la marcha basándose en los archivos contenidos en el CD-ROM que acompaña al libro.

Escritor
Colección
Profesional
Materia
Varios BBDD
Idioma
  • Castellano
EAN
9788478976959
ISBN
978-84-7897-695-9
Páginas
576
Ancho
17 cm
Alto
24 cm
Edición
1
Fecha publicación
09-01-2006
Edición en papel
34,90 €
720,34 MX$37,23 US$Añadir al carrito

Índice de contenido

Introducción
Capítulo 1. El concepto de Data Mining
Introducción
Una definición de Data Mining
El proceso de Data Mining
Selección de objetivos
La preparación de los datos
Tipos de problemas de Data Mining y enfoques para su resolución
Problemas descriptivos
Problemas predictivos
Técnicas de Data Mining
El éxito de un proyecto de Data Mining: consideraciones finales
Capítulo 2. El entorno de Enterprise Miner.
La herramienta Enterprise Miner
Preparación de los datos
Abrir Enterprise Miner
Navegador del Proyecto
Conjunto de herramientas de análisis de SAS Enterprise Miner
Zona de trabajo
Barra de Herramientas
Menú principal de aplicaciones
File
Edit
View
Options
Actions
Help
Comenzar un proyecto nuevo
Acerca de los dato y los nodos
Capítulo 3. Selección de datos y muestras. Exploración
El nodo de datos (Input Data Source Node)
Conexión de nodos en un diagrama activo
El nodo de muestreo (Sampling Node)
El nodo partición de datos (Data Partition Node)
Nodo explorador de distribuciones (Distribution Explorer Node)
Nodo multigráficos (Multiplot node)
Nodo de exploración de patrones (Insight Node)
Nodo de asociaciones (Association Node)
Node de selección de variables (Variable Selection Node)
Nodo de análisis de relaciones (Link Analisis Exp. Node)
Visor de resultados
Capítulo 4. Exploración y análisis interactivo de datos. El nodo Insight
El node de análisis interactivo (Insight)
Introducción de datos
Edición de datos
Presentación de ventanas
Trabajo con variables
Búsqueda y selección de datos
Análisis de datos
Análisis univariante y bivariante
Análisis de la distribución de una variable
Ajustar Modelos (Fit Y X)
Análisis Multivariante (Multivariate)
Capítulo 5. Depuración y modificación de datos
Nodo de asignación de atributos (Data Set Attributes Node)
Nodo de transformación de variables (Transform Variables Node)
Nodo de filtro de datos (Filter Outliers Node)
Nodo de reemplazo (Replacement Node)
Imputación de la información faltante
Resultados
Nodo para series temporales (Time Series Node, Exp.)
Trabajo con el nodo de series temporales
Visor de resultados
Capítulo 6. Análisis cluster
Métodos descriptivos: Técnicas del análisis de interdependencia
Análisis en componentes principales
Análisis factorial
Análisis de correspondencias
Escalamiento multidimensional
Análisis de conglomerados (análisis cluster)
Nodo de Enterprise Miner para el análisis cluster (Clustering Node)
Trabajando con el nodo de Análisis Cluster
Visor de resultados
Ejemplo de Clustering
Capítulo 7. Modelos: regresión múltiple y logística
Métodos explicativos: Técnicas del análisis de la dependencia
Regresión múltiple
Análisis canónico (correlación canónica)
Análisis discriminante
Modelos de elección discreta
Modelo ANOVA (Análisis de la varianza simple)
Modelo ANCOVA (Análisis de la covarianza simple)
Modelo MANOVA (Análisis de la varianza múltipe)
Modelo MANCOVA (Análisis de la covarianza múltiple)
Regresión múltiple y modelos de elección discreta con variables ficticias.. 180
Nodo de regresión de Enterprise Miner
Especificación del modelo
Resultados de la regresión
Model Manager
Ejemplo de regresión múltiple
Resultados
Ejemplo de regresión logística
Capítulo 8. Árboles de decisión
Extracción de reglas mediante árboles de decisión
Conceptos previos
Metodología de construcción de reglas del algoritmo del nodo Tree de Enterprise Miner
C&RT (Classification and Regression Trees)
C4.5 y C5.0
Nodo de árboles de decisión (Tree Node)
Opciones para los árboles de decisión
Elementos de los árboles de decisión
El visor de resultados del nodo de árboles de decisión
Entrenamiento interactivo (Interactive Training)
Ejemplo de árbol de decisión
Capítulo 9. Redes Neuronales
Introducción a las redes neuronales
Las Redes Neuronales Biológicas
Las Redes Neuronales Artificiales
Un poco de historia
Características generales de las RNAs
Una clasificación de las RNAs
El aprendizaje del MLP: el algoritmo Backpropagation
Principales ventajas y desventajas de las RNAs
Nodo de Redes Neuronales Artifíciales (Neural Network Node)
Trabajo con el nodo de redes neuronales
Ejecución del nodo de redes neuronales
Visor de resultados
Ejemplo de red nueronal
Capítulo 10. Redes neuronales y componentes principales. Modelos de usuario
Nodo de análisis de componentes principales para uso individual o en redes neuronales (PRINCOMP/DMNEURAL Node)
Funciones de activación
Trabajo con el nodo PRINCOMP/DMNEURAL
Ejecución del nodo PRINCOMP/DMNEURAL
Resultados del nodo PRINCOMP/DMNEURAL
Nodo de modelo creado por el usuario (User Defined Node)
Trabajo con el nodo Data Set Attributes
Visor de resultados
Nodo de combinación de modelos (Ensemble Node)
Trabajando con el nodo de combinación de modelos
Visor de resultados
Nodo de razonamiento basado en la memoria (Memory-Based Reasoning, Exp.)
Trabajando con el nodo de razonamiento basado en la memoria
Visor de resultados
Nodo de modelo en dos etapas (Two Stage Model Node)
Trabajando con el nodo de modelo en dos etapas
Visor de resultados
Nodo para mapas autoorganizados (SOM/KOHONEN NODE)
Kohonen VQ
Self Organizing Maps
Trabajo con el nodo de SOM/KOHONEN
Visor de resultados
Nodo para mapas autoorganizados (SOM/KOHONEN NODE)
Kohonen VQ
Self Organizing Maps
Trabajo con el nodo de SOM/KOHONEN
Visor de resultados
Ejemplo de PRINCOMP/DMNEURAL
Ejemplo de redes autoorganizadas SOM/KOHONEN
Capítulo 11. Valoración y comparación de modelos
Nodo de valoración (Assessment)
Trabajo con el nodo de valoración
Gráficos del nodo Assessment
LIFT (Gráfico de ganancias)
DIAGNOSTIC (Gráfico de clasificación)0
THRESHOLD-BASED (Gráfico de clasificación basado en el umbral)
Curvas ROC
Scatter Plot (Gráfico de dispersión)
Nodo de informes (Reporter Node)
Opciones por defecto del nodo Reporter
Localización de los fichero de informes
Ejemplo de combinación de modelos
Capítulo 12. Predicción y utilidades
Nodo de predicción de nuevos datos (Score)
Trabajo con el nodo de predicción
Nodo de predicción en lenguaje C (C*Score)
Principales limitaciones del nodo C*Score
Trabajo con el nodo C*Store
Visor de resultados
Nodo de utilidades (Utility) y nodo de tratamiento de grupos (Group Processing)
Trabajo con el nodo de tratamiento de grupos
Visor de resultados en model manager
Nodo de base de datos para Data Mining (Data Mining Database Node)
Trabajo con el nodo de base de datos para Data Mining
Visor de resultados
Nodo de código de programación SAS (SAS Code Node)
Trabajando con el nodo de código de programación SAS
Nodo de punto de control (Control Point Node)
Nodo de subdiagrama (Subdiagram Node)
Capítulo 13. Data Mining y reducción de la dimensión con variables cuantitativas: Componentes Principales