使用的是paddle数据集,根据open_digger的教程加载了数据,并且配置好环境之后,在data/get_data.ipynb文件中进行使用,通过clickhouse连接数据库并且将所需要的数据保存在csv文件中,选取了在paddle数据集中数量最多的10个仓库进行分析并且以dashboard的形式展现。
index.html是dashboard的前端页面,scripts.js是实现方法,图表显示使用的是echarts的结构,并且还实现了点击图表之后能在中间最大部分展示的功能。展示了7个图表,分别是仓库贡献者的比例、每年各个仓库贡献者的数量、record的数量、star的数量、fork的数量、star+fork的数量和活跃用户的数量。
最终的dashboard页面可以访问最后实现的dashboard页面