02 de Octubre del 2022 | Jhonatan Montilla

Gráficos con Plotly

La visualización de datos es la forma más cómoda e intuitiva para que el cerebro humano comprenda de manera efectiva cualquier información. Para cualquier persona que trabaje con datos, la capacidad de crear hermosas visualizaciones intuitivas es una habilidad muy importante para poder transmitir los hallazgos e impulsar acciones de manera efectiva.

R proporciona excelentes paquetes de visualización de datos (ggplot2, folleto) y tableros (usando R Shiny) con los que puede crear hermosas visualizaciones. Python, por otro lado, se queda un poco atrás en este aspecto ya que matplotlib no es un gran paquete de visualización.

Seaborn es una buena alternativa para crear gráficos estáticos en Python, pero no tiene la capacidad de hacerlos interactivos. Con el gráfico estático, no podemos hacer zoom en las secciones interesantes de los gráficos, pasar el cursor sobre los gráficos para ver la información específica y más.

Plotly es una biblioteca de Python para crear visualizaciones interactivas con calidad de publicación. Plotly no solo hace que los gráficos sean interactivos, una funcionalidad que falta en matplotlib o seaborn, sino que también proporciona una variedad de gráficos más, como:

En la siguiente sección, utilizaremos datos de gapminder para visualizar cómo India y China progresaron social y económicamente a lo largo de los años. Haremos la selección y manipulación de datos en el marco de datos de pandas, si es nuevo en pandas, entonces puede aprender Python para el análisis de datos.

Puede abrir el cuaderno jupyter y usar los códigos directamente sin ninguna modificación. Comencemos instalando el paquete plotly e importando los paquetes necesarios.

Usando el módulo graph_objects, crearemos los diferentes tipos de gráficos y el módulo express se usará para leer los datos de gapminder.

Ahora, leamos los datos de gapminder usando plotly express y observemos las 5 filas superiores.

En la tabla anterior, podemos ver que los datos contienen información sobre la esperanza de vida, la población, el PIB per cápita de diferentes países en diferentes años.

Ahora, filtraremos el marco de datos para India y China.

La siguiente tabla muestra los datos de la India. Los datos van desde el año 1952 hasta el 2007.

Población de India y China

Ahora, crearemos un gráfico de barras que muestre la población de India y China a lo largo de los años.

La creación de parcelas utilizando el módulo de objeto de gráfico plotly es un proceso de 2 pasos:

Esperanza de vida a lo largo de los años.

Siempre que tengamos una serie de datos de tiempo (medidas durante años/meses/semanas, etc.), el gráfico de líneas es la mejor opción para mostrar la tendencia.

Con el siguiente código, mostramos cómo cambió la esperanza de vida a lo largo de los años en India y China.

Esperanza de vida vs pib per cápita a lo largo de los años

Cuando queremos ver la interacción entre 2 características continuas (numéricas), el gráfico de dispersión es el gráfico de referencia.

En el siguiente código, estamos creando el diagrama de dispersión entre la esperanza de vida y el pib per cápita de los 2 países.

Desarrollo mundial a lo largo del tiempo: una animación

Usando el gráfico de burbujas, podemos mostrar 3 dimensiones (eje x, eje y y tamaño de la burbuja) sobre un gráfico 2D.

Usando el siguiente código, podemos crear un gráfico de burbujas usando la función de dispersión del módulo plotly express.

Entendamos algunos argumentos importantes de la función: