在天河二号上对比Julia,Python和R语言
Julia是一款高级高效为技术计算(technical computing)而设计的编程语言,其语法与其他计算环境类似。其为分布式计算和并行所设计,最知名的地方在于其接近C语言的高效率。
按开发者的话说,“我们希望这门开源语言像C一样快…像Python一样通用,像R做统计那么简单,像Perl做文本处理那么方便,像Matlab的线性代数一样强大,还和Shell一样可以把各种程序连接起来”。
打开Julia的首页http://julialang.org/,在一长串特性介绍后面,便是和各种语言的对比测试。
测试以C为标准,从结果上来看Julia的性能比Python高一个数量级,而比R语言高一到两个数量级。是否真的如此呢,笔者进行了简单测试。
测试使用Julia官方提供的测试程序,使用炼数成金提供的天河二号资源,使用1节点1核心计算(Intel(R) Xeon(R) CPU E5-4640 0 @ 2.40GHz),Julia = 4.5,Python = 2.7.9/3.5.2,R = 3.3.2
测试过程
1, 首先下载官方标准测试程序https://github.com/JuliaLang/julia/tree/master/test/perf
2, 这里测试micro-benchmark,阅读代码可知这里测试了7个项目:
“fib” = “Recursive fibonacci”
“parse_int” = “Integer parsing”
“quicksort” = “Sorting of random numbers using quicksort”
“mandel” = “Calculation of mandelbrot set”
“pi_sum” = “Summation of a power series”
“rand_mat_stat” = “Statistics on a random matrix”
“rand_mat_mul” = “Multiplication of random matrices”
可以看出这里测试了许多常见的场景如调用函数,解析string,排序,循环,随机数生成,向量操作等。代码如图。
3, 登陆天河二号进行测试
使用Xshell连接天河,并查看天河已经部署的Julia
可查看天河CPU信息
运行Julia提供的测试,结果如下:
结果整理如下,附上官方benchmark
可以看出Julia果然快得不可思议,转换成以Julia为标准的形式观察:
基本和官方数据一致,Julia 0.4.5甚至更快,稳定地比Python快一个数量级,而R语言则在计算斐波拉契和快排时落后两个数量级。这体现了Julia开发比C简单效率接近于C地特性。作者还贴心的比较了实现randmatstat的Julia和C的代码量,这里截图并横向显示(右上角为Julia代码量)。
总结,尽管Julia在国内并不算特别火热,但作为面向高性能计算语言,其高效易用的特点值得我们的关注。通过语言本身的设计,Julia从底层的循环到高级的编程风格应用,仅牺牲少量的性能就可以用简单的方式实现复杂的算法。
引用:
1. Julia主页 http://julialang.org/
2. Julia中文社区http://julialang.cn/
3. Julia语言:让高性能科学计算人人可http://www.csdn.net/article/2014-03-12/2818732
最后放上一张各语言官方benchmark对比图 http://julialang.org/benchmarks/
《大数据必知的java基础》立足于Java语言本身及Java技术开发。会涉及并贯穿有关学习大数据系统和软件必知的一些预备知识。点击下方二维码报名课程