
- Argitaletxea:
- GRUPO ANAYA, S.A.
- Edizio-urtea:
- 2025
- Gaia:
- Ciencias/ecologia/tecnologia
- ISBN:
- 978-84-415-5228-9
ANÁLISIS DE DATOS A GRAN ESCALA CON PYTHON Y SPARK
GALAR, MIKEL / TRIGUERO, ISAAC
El análisis de datos a gran escala es clave para construir modelos de inteligencia artificial. Aprenda, con un enfoque práctico, a diseñar modelos de machine learning a gran escala con Python y Spark.El procesamiento y análisis de datos en inteligencia artificial requiere plataformas distribuidas capaces de gestionar grandes volúmenes de información. Esta guía práctica ofrece los conceptos clave y las habilidades necesarias para abordar tareas de análisis de datos y aprendizaje automático a gran escala. «Con la creciente disponibilidad de conjuntos de datos grandes y complejos, dominar modelos de programación como MapReduce y Spark se ha convertido en una habilidad imprescindible para científicos de datos, ingenieros de datos y especialistas en machine learning. Triguero y Galar aprovechan su amplia experiencia docente en este ámbito para ofrecer una obra rigurosa y accesible que aborda tanto los conceptos técnicos como las habilidades prácticas necesarias para el análisis de datos a gran escala. Alternan explicaciones claras e intuitivas con ejemplos relevantes de ingeniería de datos y pipelines clásicos de machine learning, todo ello acompañado de código bien estructurado y el resultado de su ejecución. Este libro no solo muestra cómo aplicar este conocimiento en la práctica hoy en día, sino que también prepara al lector para aplicarlo con éxito en escenarios futuros».-Arun Kumar, Universidad de California, San Diego.
Prefacio
Parte I: Entender y trabajar con big data
Capítulo 1. Introducción
Capítulo 2. MapReduce
Parte II. Plataformas de big data
Capítulo 3. Hadoop
Capítulo 4. Spark
Capítulo 5. Spark SQL y DataFrames
Parte III: Aprendizaje automático con big data
Capítulo 6. Aprendizaje automático en Spark
Capítulo 7. Diseño de algoritmos de machine learning para big data
Capítulo 8. Implementación de modelos clásicos: k-medias y regresión lineal
Capítulo 9. Ejemplos avanzados: Aprendizaje semi-supervisado, ensembles, y despliegue de modelos de deep learning
Bibliografía
Índice alfabético