CPU与GPU性能的比较报告

houkai 2018-09-18 原文

运行时间分析

不同的模型在cpu和gpu下的时间差异较大，一般来说gpu会比cpu快5-20倍。我们选用了最常用的inception v3的分类模型，输入图片尺寸为：3x299x299。

GPU

在一块P100GPU（显存16276MiB），性能如下：

由上图可见，随着进程数目的增大耗时会线性增加。

所以：如果服务中在同个卡上多开进程只是服务连接/下载图片的并发实现了并发提速（neuron框架中连接建立、下载图片、算法处理是并发独立的，可近似认为互不影响）；算法的吞吐量基本不变。而且从RT角度考虑单进程较好独占卡（任务可以占据Volatile GPU-Util 90%左右的情况下）。

当然，如果RT满足要求，卡上可以同时部署其他任务。

CPU

Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz 24核服务器下。TF默认为尽可能的占用所有的核，真正的neuron服务也是尽可能的占用所有的核，所以请求量大的时候RT会上升。

24核服务器下，QPS呈现log趋势。考虑RT，算法可以开启10个进程较优。此时CPU使用率已经逼近2400%。当然如果RT有限制，则采用更小的并发/更多的机器。

PS：一个进程下CPU占用率1600% 2个并发2000% 3个并发2100% 4个并发2200% 5个并发2250% 6个并发已达2280%。

CPU more

从另个角度来看，通过改变进程使用的核数统计RT值。这部分和前面CPU部分很类似。

对于这个分类任务，10核以后性能基本不会提升了（并发就到这水平了）。

如果要保证一定的RT，就要保证每个请求可以拿到足够多的核。

总结

单GPU QPS可以达到55；24核CPU的QPS可以达到24左右。但是GPU的TR要远低于CPU，不过GPU并发数上来，RT也会线性增加。

按照目前线上一个GPU的成本约等于96个CPU核，CPU性价比还是远优于GPU的。

PS:评测中P100性能较好价格较贵、CPU E5-2620已经较为(古老)便宜了。

本文链接：https://www.cnblogs.com/houkai/p/9671543.html

CPU与GPU性能的比较报告的更多相关文章

tensorflow加载embedding模型进行可视化

1.功能采用python的gensim模块训练的word2vec模型，然后采用tensorflow读取模型可 […]...

从YOLOv1到v3的进化之路

引言：如今基于深度学习的目标检测已经逐渐成为自动驾驶，视频监控，机械加工，智能机器人等领域的核心技 […]...

第一次作业：深度学习基础

第一次作业：深度学习基础经过了第一周的学习，对深度学习有了系统的认识。视频学习 1.1 绪论 1.2 深度 […]...

从极大似然估计的角度理解深度学习中loss函数

从极大似然估计的角度理解深度学习中loss函数为了理解这一概念,首先回顾下最大似然估计的概念: 最大似然估计 […]...

训练集、验证集和测试集的概念及划分原则

深度学习中,常将可得的数据集划分为训练集(training set),验证集(development set/ […]...

【转】为了修复打码女神脸，他们提出二阶段生成对抗网络EdgeConnect

当图像缺失部分太多的时候，结合多阶段方法和边缘先验信息，这个 GAN 实现了高还原度的图像修复，玩法还不止于此 […]...

【深度学习系列】用PaddlePaddle和Tensorflow实现AlexNet

　　上周我们用PaddlePaddle和Tensorflow实现了图像分类，分别用自己手写的一个简单的CNN网 […]...

线性回归

1. 介绍 a) 什么是线性回归 b) 形式化定义：用数学来表示 2. 梯度下降法 a) 梯度下降法介绍 […]...

随机推荐

阿里云如何基于标准 K8s 打造边缘计算云原生基础设施

作者 | 黄玉奇（徙远）阿里巴巴高级技术专家关注“阿里巴巴云原生”公众号，回复关键词 1219 即可下载 […]...

AspNet Core Api Restful +Swagger 发布IIS 实现微服务之旅（二）

AspNet Core Api Restful +Swagger 发布IIS 实现微服务之旅（二）上一步我 […]...

[Bzoj 3438] 小M的作物

3438: 小M的作物 Time Limit: 10 Sec Memory Limit: 256 MBSub […]...

告诉大家不挖矿也能轻松赚比特币的方法！

大家都知道要赚比特币需要挖矿，或者用现金去买，现在一个比特币兑换人民币高达4000多人民币了，挖矿我们是挖不来 […]...

Mysql 数据库介绍

数据库介绍　　数据库（Database）是按照数据结构来组织、存储和管理数据的仓库，每个数据库都有一个或多个 […]...

C语言I博客作业04 – 冲突

C语言I博客作业04 这个作业属于哪个课程 https://edu.cnblogs.com/campus/zs […]...

页面类跳转Demo

package baidumapsdk.demo; import android.app.Activity; […]...

三种方法在当前目录下打开cmd命令窗口

概述运行npm的时候，每次都要cd到目录，很麻烦，所以总结了三种在当前目录下直接打开cmd窗口的方法，供以后 […]...

CPU与GPU性能的比较报告

运行时间分析

GPU

CPU

CPU more

总结

CPU与GPU性能的比较报告的更多相关文章

随机推荐

热门专题

目录导航