作者:和鲸社区Kesci
链接:https://www.zhihu.com/question/19929609/answer/268373550
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

数据可视化是一个化繁为简的过程,随着数据科学的发展,数据工作对可视化工具的需求更加明确:

  • 满足大数据处理的要求
  • 支持快速的收集、筛选、分析、归纳、展现
  • 响应新增的数据的实时更新

目前使用中的可视化工具非常多,在高票答案中都有展示。我们尝试对现行的常用可视化工具进行了分类,包括:

  • 编程语言的可视化库
  • 传统数据分析及BI软件
  • 专门用于可视化的成品软件

没有完美的工具,只有合适的应用,用户可依据可视化目标进行选择。

 

编程语言的可视化库

优势:

  • 支持海量数据处理,在海量数据深层关系挖掘上独具优势
  • 多种工具库满足丰富的展现方式,满足数据展现的多维度需求
  • 可实现数据归纳、挖掘、分析、可视化的一站式工程

缺点:

  • 依赖编程基础,入门门槛较高。

按照使用的编程语言,以下是我们的推荐。

 

Python语言(附实践项目案例)

  • Pandas–Pandas是一个能快速简单实现数据操作、整合及可视化的工具库

项目案例:

这十套练习,教你如何使用Pandas做数据分析

Pandas基础命令速查表

  • Matplotlib -Matplotlib的设计理念是能够用轻松简单的方式生成强大的可视化效果,然而它是一个低端库,相比于其他高端的库,需要去写更多的代码来实现可视化效果

项目案例:

从零开始学Python【1】–matplotlib(条形图)

从零开始学Python【2】–matplotlib(饼图)

从零开始学Python【3】–matplotlib(箱形图)

从零开始学Python【4】–matplotlib(直方图)

从零开始学Python【5】–matplotlib(折线图)

从零开始学Python【6】–matplotlib(雷达图)

  • Seaborn – Seaborn关注于统计模型的可视化,可以提供热力图等多种效果去描绘数据的整体分布情况

项目案例:

seaborn可视化之time series & regression & heatmap

seaborn可视化学习之 categorial visualization

seaborn可视化学习之distribution visualization

  • Bokeh – Bokeh的特点是在web端实现d3.js的交互可视化,并且独立于matplotlib

项目案例:Bokeh教程学习

  • Plotly – Plotly是一个基于web的可视化工具箱,在plotly网站上有许多强大的图表,可以通过API的方式实现调用

项目案例:在K-Lab中如何使用plotly

 

R语言

  • ggplot2 – R中最著名的可视化工具包
  • ggvis – 一个可以做基于web的交互可视化工具包
  • rgl – 在R中做3D交互可视化
  • htmlwidgets – 一个在R中快速建立基于JavaScript内核的交互可视化工具包
  • googleVis – 利用Google Chart工具在R中做数据可视化
  • shiny -一个用R做交互可视化的应用
  • R Makdown – 用R做数据分析报告的必备工具
  • xtable – 将R中的数据对象(如data frame)转换成HTML/LaTeX代码的工具
  • sp, maptols – 一个加载并使用包括shapefile在内的地理空间数据的工具库
  • maps – 在地图上绘制多边形地图的工具
  • ggmap – 一个可以下载谷歌街道地图并在ggplot库中将其设置为背景的工具
  • quantmod -下载金融数据并做可视化、技术性分析的工具

项目案例:

构建对球员的评价体系尝试【R语言】

 

其他语言

  • D3.js-一个比较基础的可视化 js 库,可以把数据和 HTML 结构或者 SVG 文档对应起来,擅长于操作 SVG 中的路径 (path) 和几何图形,使用JavaScript进行编译
  • Processing-数据可视化的老牌工具,使用java语言进行编译

 

总体而言,可视化库的多样性为数据展现提供了很多可能,但全部安装也不现实。有没有一种办法,让可视化库的调用更为高效便捷?安利一下科赛 Kesci的K-lab给大家。

K-lab是一个在线数据分析协作平台,目前已集成Python2、Python3、R三种语言环境,以上Python和R的可视化库K-lab已全部完成集成,用户可在K-lab直接调用,体验云端数据分析的愉悦。

K-lab工具包仍在持续集成中,如有需求,欢迎在K-lab帮助中心->K-lab工具包页面添加工具包集成建议~

<img src=”https://pic2.zhimg.com/50/v2-4b73e6e2e7dcab1f3a75a3b4517e865a_hd.gif?source=1940ef5c” data-caption=”” data-size=”normal” data-rawwidth=”750″ data-rawheight=”481″ data-thumbnail=”https://pic4.zhimg.com/50/v2-4b73e6e2e7dcab1f3a75a3b4517e865a_hd.jpg?source=1940ef5c” class=”origin_image zh-lightbox-thumb” width=”750″ data-original=”https://pic1.zhimg.com/v2-4b73e6e2e7dcab1f3a75a3b4517e865a_r.jpg?source=1940ef5c”>

版权声明:本文为KJXY原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/KJXY/articles/14267014.html