@
leyendo...
Tecnología

Ejemplo de uso de Power BI Desktop – IMDb Demo

Usaré Power BI Desktop para mostrar como conectarse a un conjunto de datos familiar y obtener datos rápidamente para análisis, haciendo uso de algunas características de la herramienta.

Aclaro que me basé en una demostración que se mostró en el Webinar de lanzamiento de disponibilidad general de Power BI y cuyo video está en el canal de YouTube, precisamente en https://youtu.be/RlWeQOneq8U.

Para ello, se consultará el Top 250 de películas según Internet Movie Database o IMDb.

La URL para sacar los datos es http://www.imdb.com/chart/top.

Abrimos Power BI Desktop.

Power BI Desktop

Clic en Get Data.

En la ventana que aparece, pueden escribir Web para ir directamente a la opción de fuente de datos.

Oprimir Connect.

En la pantalla que aparece, escribir la URL mencionada arriba:

Web Page URL

Presionar OK.

Al finalizar la conexión, se aprecian tres tablas. La que se necesita es “Table 0” porque contiene el dataset requerido:

IMDb Top 250 Movies Dataset

Se selecciona entonces la tabla y se da clic en “Edit”.

Luego de unos cuantos segundos, se apreciará en pantalla lo siguiente:

IMDb Top 250 Movies Dataset in Power BI

De toda la tabla, solo me interesa tener las columnas “Rank & Title” y “IMDB Rating”. Las demás las obviaré.

Para ello, selecciono las dos columnas mencionadas anteriormente y dando clic derecho, selecciono la opción “Remove Other Columns”

Context Menu - Columns in Power BI

Ahora, en la primera columna, tengo datos agrupados y que quiero separar en Rank, Title y Year.

Así que voy a hacer un Split de esa columna, usando el comando disponible para ello en Power BI Desktop.

Simplemente selecciono la columna y en el comando de Split Column dejo la ventana como se ve a continuación:

Split Column - Rank

Clic en OK.

Con esto, tengo la primera columna con el Rank o clasificación según IMDB de las mejores 250 películas.

Doy clic en la columna y luego presiono la tecla F2 para renombrarla como Rank.

Ustedes deben tener algo similar a esto:

Rank Column in Dataset

Para obtener el título, se hará Split Column de nuevo. Esta vez la ventana debe verse así:

Split Column - Title

Clic en OK.

Ya se tiene la segunda columna, Title. Mismo procedimiento anterior para renombrar la columna obtenida.

Solo resta obtener el año. Para ello, se remplazará el paréntesis derecho con ningún carácter.

Remove Character - Year

Se renombra la última columna como “Year”.

Sin embargo, antes de entrar a revisar el conjunto de datos, voy a agregar una columna personalizada que muestre la década en la cual cada película fue liberada al público. Esto con el fin de analizar qué década ha sido la más exitosa, entrar a determinar qué películas estuvieron en dicha década y otras consideraciones asociadas.

Ubico el comando “Add Custom Column” bajo el menú “Add Column” y debe verse así:

Add Custom Column - Decade

Clic en OK, previo renombre de la columna como “Decade”.

Ahora mi Dataset se ve de la siguiente manera:

IMDb Top 250 Movies - Final Dataset

Renombro la consulta como Top 250 IMDB Movies.

Dataset Name - Top 250 IMDb Movies

Luego, en el menú principal, ubico la opción “Home” y doy clic en “Close & Apply”.

Apply Changes

Espero unos segundos y tengo el “Canvas” preparado para establecer ciertos análisis de acuerdo con el Dataset obtenido y preparado previamente.

En la parte derecha del “Canvas” se aprecia lo siguiente:

Power BI Desktop - Visualization & Fields

Ahí se tienen las visualizaciones y los campos que se podrán usar en dichas visualizaciones.

Cabe resaltar que algunas visualizaciones no podrán usarse o no tendrán efecto, mejor, en ciertos datos.

Voy a iniciar con una gráfica sencilla: Películas y su calificación IMDB. Para esto, simplemente arrastren al Canvas el campo “Title” y luego el campo “IMDb Rating”. Debe verse así:

Table in Power BI Desktop

Ahora bien, si en la parte de visualizaciones se da clic sobre el icono con las barras horizontales, se obtiene la siguiente gráfica:

Horizontal Bar Chart

Ummm… Pero ese orden alfabético no me dice mucho. Para organizar por una de las columnas del Dataset, se da clic en el menú “More Options” identificado por la elipsis y le digo que ordene por “IMDb Rating”, dando clic en la opción que se muestra a continuación:

Sort By in Chart

Con lo anterior, ahora el Dataset se ve de la siguiente manera:

Sorted Dataset in Chart

Bueno, pero así se ve en la página Web, más o menos. Es decir, para esto pues hubiese seguido consultando la página Web.

Es aquí en donde voy a hacer el primer análisis. ¿Qué década es la más representativa en películas de este Top 250?

Para ello, insertaré un “Pie Chart” o gráfica de torta en el Canvas.

Arreglándolo un poco, debe verse así:

Bar Chart + Pie Chart

Con el “Pie Chart” seleccionado, se pone el campo “Decade” en donde dice “Legend” y luego se pone el campo “Title” en donde dice “Values”.

Pie Chart Set with Values

Con esta gráfica, ya se ve que la década de los 2000, es la más participativa en número de títulos en la clasificación.

De hecho, si dan clic en el pedazo de torta etiquetada como “2000s”, los títulos de la gráfica de barra se iluminan para entonces relacionar qué títulos están en dicha década. Como hacer un drill-down…

Dataset with Values Highlighted

Otro análisis interesante con la década está relacionado con el rating de la película promedio.

Para ello, se crea otro elemento dentro del Canvas así:

Dataset Table with Average

Aquí se ha aplicado el promedio, simplemente dando clic derecho sobre el campo y seleccionando no la suma sino el promedio.

Sin embargo, esta manera de visualizar, aunque muestra que, en efecto, la década de los 90 tiene la mayor cantidad de películas con mejor ranking, tal vez no sea la mejor manera de analizar esta información; es mejor establecer otra forma de ver la misma información.

Al seleccionar un gráfico de líneas, se aprecia mucho mejor el análisis anterior:

Line Chart for Better Analysis

Si se selecciona en la gráfica de torta la década de los 90, se pueden ver incluso algunas de las películas dentro de dicho Top.

Ya lo que queda es guardar esta consulta y ponerla a disposición de usuarios con acceso a nuestro Power BI en la red.

Esto se hará en otro post, en donde se trabajará más en la interfaz Web.

Saludos.

Comentarios

Los comentarios están cerrados.

Categorías

Archivos

A %d blogueros les gusta esto: