Balance curso 2018-19 4 Jun 2019 Tras la magnífica charla de Junio sobre Big Data con Spark y R, Paco Rodríguez, uno de los organizadores de SevillaR, realizó una breve presentación a modo de balance del curso 2018-19. Ha sido un año muy bueno en el que hemos seguido creciendo a muy buen ritmo y hemos tenido encuentros muy interesantes. Evidentemente aún quedan cosas que se pueden mejorar y muchos temas por tratar en futuras reuniones. Pero eso será a partir de Octubre, cuando retomemos nuestra actividad tras la parada estival. ...
Big Data con Spark y R 4 Jun 2019 En nuestra reunión de Junio, Manuel Chacón y Juan Andrés Tejero, Data Scientist y Big Data Engineer en Isotrol, dieron una estupenda charla sobre cómo manejar volúmenes masivos de datos (Big Data) con Spark y R. Manuel comenzó repasando el concepto de ‘Big Data’ y las varias ‘V’ que lo caracterizan (Volumen, Variedad, Velocidad…), para después introducir los sistemas de computación distribuida basados en Hadoop, MapReduce, y Spark. Seguidamente, Juan Andrés dió un estupendo repaso a los distintos componentes de Spark (core, SQL, Streaming, MLlib, GraphX) para después comparar los dos principales paquetes disponibles para utilizar Spark desde un entorno R: SparkR y sparklyr. ...
Mapas leaflet interactivos con R 14 May 2019 En nuestra reunión de Mayo de 2019, Francisco Rodríguez-Sánchez, ecólogo computacional y Data Scientist, explicó cómo hacer mapas interactivos con R explotando todo el potencial de la librería ‘leaflet’ de javascript, e hizo un repaso de los principales paquetes de R en torno al ecosistema leaflet y su funcionalidad. Diapositivas Vídeo
Selección de variables en Machine Learning 2 Apr 2019 En nuestra reunión de Abril de 2019, Miguel Pavón Barrera, Data Scientist en Ayesa, hizo una espléndida presentación de distintas estrategias para llevar a cabo la selección de variables en modelos predictivos de Machine Learning. Diapositivas Vídeo
Programación funcional en tidyverse: introducción a purrr 6 Mar 2019 En nuestra reunión de Marzo de 2019, Juan Luis Pérez Carretero, de Genera Games, nos dio una excelente introducción a la programación funcional con purrr. Diapositivas Vídeo Juan Luis mostró cómo la consistencia y estructura organizada del tidyverse permite realizar operaciones iterativas sobre vectores, listas, o data frames, mediante código relativamente sencillo, breve, y consistente. En primer lugar, la función map aplica una función a cada elemento del vector: Y map2 trabaja con 2 vectores (o pmap con múltiples): ...
Cuadros de Mandos con Shiny 5 Feb 2019 En nuestra reunión de Febrero de 2019, José I. Tudó Ramírez, científico de datos en Helvetia Seguros, nos hizo una excelente introducción a los cuadros de mandos con Shiny. Diapositivas Vídeo
Depuración geométrica-topológica de datos geográficos 8 Jan 2019 En nuestra reunión del 8 de Enero, Jerónimo Carranza, fundador y director de ASTERIONAT nos habló sobre depurar datos topológicos usando el paquete SF Simple Features. Primero nos habló de las Simple Features tal como las define el estándar DE-91M, posteriormente Jerónimo explicó las principales funciones del paquete, y finalmente detalló un caso de uso de una red hidrográfica. En el siguiente link se puede descargar la presentacion: Presentación Si queréis ver el vídeo de esta magnífica presentación, podeís hacerlo en nuestro canal de Youtube. ...
Depuración geométrica-topológica de datos geográficos con R 8 Jan 2019 En nuestra última reunión del pasado día 8 de enero de 2019, Jerónimo Carranza nos habló sobre depuración de datos geográficos. La charla constó de tres partes: En la primera parte se presentaron los fundamentos de las relaciones espaciales entre objetos geográficos (topología geoespacial) y su importancia en la depuración geométrica de este tipo de datos (geográficos). En la segunda parte se hizo una introducción al paquete sf que implementa y da soporte al estándar de entidades geográficas simples (simple feature) y de relaciones espaciales entre las mismas. ...
Compitiendo en Kaggle - Predicción de Ventas 4 Dec 2018 Hoy tuvimos una charla muy interesante sobre Kaggle y Machine Learning, en la que se habló del proceso de competir prediciendo ventas. La charla tuvo dos partes. Presentación de Kaggle, de la competición Rossman y nociones básicas de cómo enfocarla Javier Tejedor, con categoría de maestro en Kaggle hizo una presentación para introducir este sitio web de competiciones, así como el caso concreto de Rossman y la predicción de ventas. ...
Regresión Avanzada con Machine Learning 6 Nov 2018 Hoy tuvimos la segunda charla del curso, en la que se habló de Regresión Avanzada usando técnicas de Machine Learning La charla tuvo dos partes. Introducción al Machine Learning y ejemplos con árboles de regresión Antonio Marín hizo una breve introducción del Machine Learning, sobre todo a la parte de Regresión, y seguidamente mostró un ejemplo sencillo usando tanto LightGBM como XGBoost. Aquí se puede descargar el código. A continuación ejecutó el magnífico Kernel de la competición de Kaggle House Price El código en Rmarkdown se puede descargar aquí ...