主要自己做个记录吧,流程:pyodps读取数据源-->pandas-->pyecharts;每天调度会计算好数据落到odps,这边再加个自动发送就好了。

桑基图个人觉得某些场景还是蛮适合的,图像的表征能力还是很强的。

2022年6月1日记录;搞流量数据之后发现这个表有一个好处,做页面周转的图可太好了,记录当前页面从哪里来,到哪里去,之前怎么没想到呢。

画图部分主要参考了这个https://blog.csdn.net/akenseren/article/details/103416477,中间细节部分还是看了下官方文档。

# -*- coding: utf-8 -*-
import pandas as pd
from pyecharts.charts import Sankey
from pyecharts import options as opts
import logging
import logging.config
from odps import ODPS
from odps.df import DataFrameo = ODPS(access_id='********',secret_access_key='*********',project='*******',endpoint='http://service.odps.aliyun.com/api'
)# logging.basicConfig(
#     format='%(name)s:%(lineno)d - %(levelname)s - %(message)s',
#     level=logging.DEBUG)# 读取csv文件
#data = pd.read_excel('/Users/wangyuhang/Downloads/test.xlsx',sheet_name= 'Sheet2',header=None)data = DataFrame(o.get_table('tmp_download_table')).to_pandas()
print(data.head(5))# 生成nodes
nodes = []dataNew = pd.concat([data['first_level'],data['second_level']],axis=0,ignore_index=True).unique()
print(dataNew)for i in dataNew:dic = {}dic['name'] = inodes.append(dic)
print(nodes)
# for j in data[1].unique:
#     dic['name'] = i
#     nodes.append(dic)# 生成links
links = []
for i in data.values:dic = {}dic['source'] = i[0]dic['target'] = i[1]dic['value'] = i[2]links.append(dic)print(links)
# pyecharts 所有方法均支持链式调用。c = (Sankey(init_opts=opts.InitOpts(width="1200px", height="600px")).add(
"uv",nodes,links,linestyle_opt=opts.LineStyleOpts(opacity=0.2, curve=0.5, color="source",type_="dotted"),label_opts=opts.LabelOpts(position="right",),).set_global_opts(title_opts=opts.TitleOpts(title="日活流向")))
# 输出html可视化结果
c.render('/Users/wangyuhang/Downloads/result11.html')

这样输出一个本地的html文件,直接打开这个文件就是图:

细节上还有很多可以补充的,之后改了再加吧

阿里云数据读取做桑基图相关推荐

  1. 数据治理 Python桑基图处理表关系

    数据治理 Python桑基图处理表关系 需求 随着hive库表越来越多,调度出问题后,排查时间越来越长.计划通过桑基图以及血缘图谱解决,当前先用桑基图页面顶一段时间.后期做成web服务,如果有可能,尽 ...

  2. 数据可视化之桑基图制作,其实很简单,只需拖拽就能搞定

    人人都是数据分析师的时代,我们如何才能真正让普通用户拥有数据分析的能力,我们都知道要想掌握大数据分析,首先在技术层面就得有一定的技术深度和广度,数据分析大致分为数据采集,数据存储,数据建模计算,数据可 ...

  3. 大佬都在用的桑基图到底怎么做?告诉你个最简单的方法

    桑基图,即桑基能量分流图,也叫桑基能量平衡图.因1898年Matthew Henry Phineas Riall Sankey绘制的"蒸汽机的能源效率图"而闻名,此后便以其名字命名 ...

  4. 东软数据分析软件图表详解 - 什么是桑基图

    桑基图 这个看着很漂亮的图表叫做桑基图,也叫桑基能量分流图或者桑基能量平衡图.它是一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,所有主支宽度的总和应与所有分出去的分支宽度的总和相等,保 ...

  5. 设计桑基图_教你用pyecharts制作交互式桑基图,赶快学起来吧!

    由于工作的需要,经常需要进行可视化展示,除了一些常用的BI工具,我也会使用python对数据进行可视化. python的第三方可视化库有很多,比如matplotlib.seaborn.plotly.b ...

  6. 【Python基础】用Python制作漂亮的流动桑基图

    来源:Python数据之道 作者:Peter 整理:Lemon 桑基图绘制实践 本文中介绍的是如何制作桑基图,使用的可视化库是强大的 Pyecharts (版本1.7.1,版本一致很重要).文章将从如 ...

  7. 炫酷!用Python制作漂亮的流动桑基图

    作者:Peter 整理:Lemon 桑基图绘制实践 本文中介绍的是如何制作桑基图,使用的可视化库是强大的 Pyecharts (版本1.7.1,版本一致很重要).文章将从如下几个方面进行介绍: 什么是 ...

  8. Tableau:画桑基图(详细版)

    网上已经有很多教程讲解了怎么使用Tableau来画桑基图.该篇博客只是想把画桑基图过程中涉及到的各个部分都弄清楚,篇幅可能会很长. 1.基本函数 1.1 INDEX()   该函数可以返回分区中当前行 ...

  9. R语言多层桑基图_流量结构分布图——桑基图(Sankey)

    桑基图作为相对复杂的图表种类,平时很少用到,不仅仅是因为它的引用场景相对狭窄,另一方面则是制作难度相对较大,门槛较高. 不过针对第一个问题,如果你能很好地理解自己所涉及到的业务数据结构及想要表达和呈现 ...

最新文章

  1. 微软(中国)CTO韦青:人工智能是拿来用的,不是拿来炒的
  2. 超越梦想,追求卓越——图灵五周年生日聚会圆满成功
  3. EC笔记:第4部分:19、设计class犹如设计type
  4. HDU 1251 统计难题 字典树/STL
  5. Python 技巧篇 - 英文单词首字母大小写转换功能实例演示,字符串切片实现
  6. python画剖面图_如何创建Matplotlib图形与图像和剖面图相匹配?
  7. 多边形之间相交求交点的算法_路径规划算法总结
  8. ubuntu系统和ROS系统的版本对应关系
  9. C++继承中的对象模型
  10. eclipse tomcat新建一个_Javaweb07-Eclipse自动创建动态web项目
  11. 火焰传感器工作原理_不同接近传感器工作原理
  12. 用memoization优化递归算法[JS/PHP实现]
  13. ubuntu默认面板被删除后的恢复办法
  14. String类-拆分字符串
  15. mybatis 源码系列(四) 数据库驱动Driver加载方式
  16. 离散数学 集合的运算
  17. 信息安全三要素CIA
  18. canvas乱码的处理
  19. Android判断手机是否是小米MIUI系统
  20. 前端导出pdf以及导出内容截断的解决办法

热门文章

  1. Spring之Environment类详解
  2. 计组(day5)8086指令系统——算术运算指令(乘除指令)
  3. 如何下载video标签中的视频资源以blob:http开头地址的资源m3u8
  4. 孙茳涛:STO的全球监管趋势、机遇与挑战 |链捕手
  5. Node 非服务脚本调试
  6. 三种常见的http content-type详解
  7. 二十个未知数的方程用计算机,用科学计算器解方程 急!!! 如何学会解方程的方法...
  8. hhpoker线上游戏技术提升不可逾越的捷径
  9. python创意铅笔画_创意的铅笔画图片
  10. 3D角色 毛发制作 使用hair-strand-designer Part1