NumPy 学习第三篇：矢量化和广播

ljhdo 2019-12-11 原文

矢量化

矢量化是指用数组表达式替换显式的for循环。在Python中循环数组或其他跟数组类似的数据结构时，使用循环会涉及很多开销。NumPy中的矢量化操作把内部循环委托给高度优化的C和Fortran函数，从而实现更清晰，更快速的Python代码。

矢量化是NumPy中的一种强大功能，可以把操作表达为“在整个数组上而不是在各个元素上”发生，Python隐式对数组的各个元素执行相同的操作。

矢量化对每个元素执行相同的操作，对于原生的Python代码，举一个简单的例子，考虑将1维数组中的每个元素与相同长度的另一个序列中的相应元素相乘的情况。如果数据存储在两个Python 列表 a 和 b 中，我们可以迭代每个元素，如下所示：

c = []
for i in range(len(a)):
    c.append(a[i]*b[i])

当涉及到 ndarray 时，逐个元素的操作是“默认模式”：

c = a * b

广播

两个形状相同的NumPy数组之间的操作是按元素操作的，对于大小不同的数组，按照广播规则来进行。广播（Broadcasting）描述了 numpy 如何在算术运算期间处理具有不同形状的数组。

1，广播的原理

NumPy 通常在数组的每个元素上执行相同的操作，在最简单的情况下，两个数组具有完全相同的形状，如下例所示，a和b都是数组，对数组执行相乘操作，Python内部执行的操作是对位置相同的元素执行相乘操作：

>>> a = np.array([1.0, 2.0, 3.0])
>>> b = np.array([2.0, 2.0, 2.0])
>>> a * b
array([ 2.,  4.,  6.])

当数组的形状满足某些约束时，NumPy的广播规则放宽了这种约束。当一个数组和一个标量值在一个操作中组合时，会发生最简单的广播示例，a是数组，b是标量：

>>> a = np.array([1.0, 2.0, 3.0])
>>> b = 2.0
>>> a * b
array([ 2.,  4.,  6.])

结果等同于前面的示例，在算术运算期间，想象b是被拉伸成跟数组a的形状相同的数组，数组b的每个元素都是2.0。

拉伸类比只是概念性的，NumPy足够聪明，可以使用原始标量值而无需实际构造数组。

2，广播规则

为了进行广播，在操作中两个阵列的末尾维度的尺寸必须相同，或者必须有一个维度的尺寸是相同的。

举个例子，数据a的shape是3row X 2col，数组b的shape是1row X 2col，两个数组的末尾维度是2，形状兼容：

技术细节：较小的数组会在较大的数组中“广播”，以便它们具有兼容的形状

广播使用以下2个规则处理具有不同形状的两个数组：

让所有输入数组都向其中形状最长的数组看齐，形状中不足的部分都通过在前面加 1 补齐。
当输入数组的某个维度的长度为 1 时，沿着此维度运算时都用此维度上的第一组值，也就是说，在任何一个维度上，如果一个数组的维度为1，另一个数组的维度大于1，那么在该维度上，就好像是对第一个数组进行了复制。

简单理解：对两个数组，分别比较它们的每一个维度（若其中一个数组没有当前维度则忽略），满足：

数组拥有相同形状。
当前维度的值相等。
当前维度的值有一个是 1。

若条件不满足，抛出 “ValueError: frames are not aligned” 异常。

参考文档：

NumPy 矢量化

NumPy 广播

Array Broadcasting in Numpy

本文链接：https://www.cnblogs.com/ljhdo/p/10571719.html

NumPy 学习第三篇：矢量化和广播的更多相关文章

python菜鸟教程学习1：背景性学习

https://www.runoob.com/python3/python3-intro.html 优点简 […]...

初探numpy

安装numpy 通过python pip安装numpy pip install numpy numpy nda […]...

python之numpy包知识要点总结

一、简介　　numpy主要是用来存储和处理大型矩阵，提供了一种存储单一数据类型的多维数组对象—& […]...

golang从context源码领悟接口的设计

注：写帖子时go的版本是1.12.7go语言中实现一个interface不用像其他语言一样需要显示的声明实现接 […]...

JavaScript学习

JavaScript三大核心：ECMAScript：JS基础语法Bom：browser object model 浏览器对象模型在bom中给我们提供了一些可以操作浏览器的属性和方法。Dom：document object model...

保持长时间高效学习的核心大招!

都说现在人越来也浮躁，我是真的很浮躁。我都不能完整的看个电影，剧情稍微不精彩了我就会不停的按快进，不知道有没有 […]...

python学习笔记 day1

一、编程语言计算机编程语言，本质上和人的语言一样，目的是用于和计算机交流沟通。计算机的本质是电路，电路只有 […]...

带着新人学springboot的应用01（springboot+mybatis+缓存上）

带着新人学springboot的应用01（springboot+mybatis+缓存上）　　上一篇结束，第 […]...

随机推荐

重学计算机组成原理（八）- 程序的装载

比尔·盖茨在上世纪80年代说的“640K ought to be enough for anyone” 也就是 […]...

Android位置权限以及数组寻找索引的坑

填坑与求解惑来的。一、Android 危险权限，来自官方文档的坑？？？ Android开发者都知道，Andr […]...

Linux远程复制

Linux远程复制两台机器IP分别为： A.104.6.26.75，B.43.8.9.73 1.在A服务器上 […]...

电脑选购指南&硬件介绍

　　处理器，英文简称 CPU ，相当于大脑，主要负责电脑所有的运算、控制任务，性能越强的 CPU，表现就是越快 […]...

对Flutter路由管理库Fluro的封装

1.增加page_router.dart文件在这里文件里面编写下面的代码一个PageRouter类，里面我 […]...

回复关键词的无限扩展机制

引言在微信公众号的开发中，自动回复关键词主要可回复的内容为文本消息、图文消息（目前仅支持一个链接）。为了让关 […]...

MySQL存储过程创建实例,双循环结果集并定时执行

使用navicat创建存储过程 BEGIN #Routine body goes here... DECL […]...

CosId 1.0.3 发布，通用、灵活、高性能的分布式 ID 生成器

CosId 通用、灵活、高性能的分布式 ID 生成器介绍 CosId 旨在提供通用、灵活、高性能的分布式系统 […]...

NumPy 学习第三篇：矢量化和广播

矢量化

广播