前言
如果想快速给公司搭建分布式BI系统,Superset 是首选,
如果是单机数据量不是很大的时候,可以不用。
BI界的王者,应该是Tableau ,因为它是一个真正零代码,拖拽式的业界老大哥算是一个业界标准,但是缺点金钱成本高,支持不了百人,千人的高性能查询,性能肯定是有瓶颈da~
Superset 是由Python中的Flask、Pandas ,SQLAlchemy 等 React 、web开发技术做出来的,还支持缓存,分布式等服务。
所以大数据项目一般应用它。它的优点弥补了Tableau ,缺点显而易见,需要代码基础的。安装也需要一定Python安装技术等等,所以复杂度上来了。 火热程度逐渐上涨,随着数据分析师,IT互联网公司的白领,逐渐掌握Python技术,so, 它就这样火起来了。
但是目前完全还颠覆不了Tableau, 它的教程比较少,官网的案例也少,so, 学习成本就比较高了,开发各种图形,扩展UI库撒撒的,还得自己百度研究。
如果用熟练了好处显而易见,第一不用自己开发web系统,配置和扩展就好了。报表的实时性,多人分享可以满足了。还是so easy~.
如果想学习直接观看官网教程,直接谷歌翻译就成,看了一遍Demo 挺详细的~,就是案例少
Superset 是一款由 Airbnb 开源的“现代化的企业级 BI(商业智能) Web 应用程序”,其通过创建和分享 dashboard,为数据分析提供了轻量级的数据查询和可视化方案。
以下是Superset的主要功能的概述:
- 开箱即用的丰富数据可视化集合
- 易于使用的界面,用于浏览和可视化数据
- 创建和共享仪表板
- 与大型身份验证提供程序(数据库,OpenID,LDAP,OAuth和REMOTE_USER通过Flask AppBuilder集成)集成的企业级身份验证
- 可扩展的高粒度安全性/权限模型,允许有关谁可以访问单个要素和数据集的复杂规则
- 一个简单的语义层,允许用户通过定义哪些字段应显示在哪个下拉列表中以及哪些聚合和功能度量可供用户使用来控制如何在UI中显示数据源
- 通过SQLAlchemy与大多数说SQL的RDBMS集成
- 与Druid.io的深度集成
Superset是云原生的,旨在提供高可用性。它旨在扩展到大型的分布式环境,并且在容器内可以很好地工作。虽然您可以在适当的设置上或仅在笔记本电脑上轻松测试Superset驱动器,但扩展平台几乎没有限制。
从灵活性上讲,Superset还是云原生的,它使您可以选择:
- 网络服务器(Gunicorn,Nginx,Apache),
- 元数据数据库引擎(MySQL,Postgres,MariaDB等),
- 消息队列(Redis,RabbitMQ,SQS等),
- 结果后端(S3,Redis,Memcached等),
- 缓存层(Memcached,Redis等),
Superset还可以与NewRelic,StatsD和DataDog等服务一起很好地工作,并且能够针对大多数流行的数据库技术运行分析工作负载。
目前,Superset已在许多公司大规模运行。例如,Superset在Kubernetes内的Airbnb生产环境中运行,每天为600多个活跃用户提供服务,每天查看超过10万张图表。