Crítica vs. Público

Objetivo:

Crear un pipeline que ejecute la limpieza de un archivo de datos y enriquecimiento con datos consguidos a través de scraping y llamando a apis.

Hipótesis

El público nunca está de acuerdo con la crítica.

Estudiamos la lista de los 500 mejores discos de la historia según la publicación Rolling Stone. Artículo Cargamos los datos de esta lista con un archivo excel conseguido a través de muscicbrainz

Enriqueceremos estos datos con las siguentes webs:

Lista de los discos más reproducidos en Spotify, conseguida a través de la web de Chartmasters. La última actualización data del 11/07/21. (Scrapping)
De la web Insider hemos conseguido los datos de los 50 álbumes más vendidos de todos los tiempos. Artículo. (Scrapping)
Hemos conectado con las apis de la red social musical de Lastfm y hemos conseguido los siguientes datos:
- El top 50 de los álbumes más escuchados por sus usuarios
- El número total de usuarios y reproducciones que se han registrado de los 500 álbumes del artículo de Rolling Stone

Contenido:

Carpeta Data: varios csv de carga y exportación de datos.
Carpeta Images: logos para el readme + exportación de los gráficos creados con jupyter Notebooks
Carpeta Notebook con los archivos de prueba de manipulación de datos:
- limpieza: carga de datos, limpieza y primer enriquecimiento
- scra_api: con la extración de datos a través de apis y scrapping
- visualización: estudio de los datos a través de gráficos. (ver con nbviewer: visualización)
Carpeta Output: archivos creados al ejectuar el archivo main.py
Carpeta src:
- archivo apifunc: funciones que se ejecutan para llamar a las apis
- archivo scrappingfunc.py: funciones que se ejecutan para scrapear por las webs
Archivo main.py (ejecutables del pipeline)

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
data		data
images		images
notebooks		notebooks
output		output
src		src
.gitignore		.gitignore
README.md		README.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Crítica vs. Público

Objetivo:

Hipótesis

Contenido:

About

Releases

Packages

Languages

emarfer/Pipelines-project

Folders and files

Latest commit

History

Repository files navigation

Crítica vs. Público

Objetivo:

Hipótesis

Contenido:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages