1. 蛮力构造法
2. 特殊数值法
3. 随机数值法
4. 定长分割法
5. 重复构造法
6. 网格构造法
7. 自定义数据类型
1. 蛮力构造法np.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)
import numpy as np
# 如果不指定数据类型,就会根据object参数自动选择合适的数据类型
a = np.array([[1, 2, 3], [4, 5, 6]])
# 也可以在创建数组时,指定元素的数据类型
b = np.array([[1, 2, 3], [4, 5, 6]], dtype=np.uint8)
2. 特殊数值法
这里的特殊数值指的是0、1、空值。特殊数值法适合构造全0、全1、空数组,或由0、1组成的类似单位矩阵(主对角线为1,其余为0)的数组。
np.zeros(shape, dtype=float, order='C')
np.ones(shape, dtype=float, order='C')
np.empty(shape, dtype=float, order='C')
np.eye(N, M=None, k=0, dtype=float, order='C')
固定参数shape表示生成的数组结构,默认参数dtype用于指定数据类型(默认浮点型)。order参数指定的是数组在内存中的存储顺序,'C'
表示C语言使用的行为优先方式,'F'
表示Fortran语言使用的列优先方式
import numpy as np
print(np.zeros(6))
print(np.zeros((2, 3)))
print(np.ones((2, 3), dtype=int))
print(np.empty((2, 3)))
print(np.eye(3, dtype=np.uint8))
如果需要一个3行4列,初始值都是255的无符号整型数组
方案1:全1数组乘以255
方案2:全0数组加255
方案3:使用填充函数fill()
import numpy as np
a = np.empty((3, 4), dtype=np.uint8)
a.fill(255)
print(a)
3. 随机数值法
np.random.random(size=None)
np.random.randint(low, high=None, size=None)
np.random.normal(loc=0.0, scale=1.0, size=None)
random()
函数用于生成[0,1)
区间内的随机浮点型整数,randint()
函数用于生成[low,high)
区间内的随机整形数组。参数size是一个元组,用于指定生成数组的结构
import numpy as np
print(np.random.random(3))
print(np.random.random((2, 3)))
print(np.random.randint(5))
print(np.random.randint(1, 5, size=(2, 3)))
normal()
函数用于生成以loc为均值、以scale为标准差的正态分布数组。
import numpy as np
# 导入绘图模块
import matplotlib.pyplot as plt
# 生成正态分布数据
tall = np.random.normal(170, 4, 1000)
# 从156厘米到190厘米,每2厘米一个分段
bins = np.arange(156, 190, 2)
# 绘制柱状图
plt.hist(tall, bins)
# 显示图形
plt.show()
4. 定长分割法
import numpy as np
np.arange(start, stop, step, dtype=None)
np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
arange()
函数和Python的range()
函数用法相同,并且还可以接收浮点型参数
import numpy as np
print(np.arange(5))
print(np.arange(5, 11))
print(np.arange(5, 11, 2))
print(np.arange(5.5, 11, 1.5))
print(np.arange(3, 15).reshape(3, 4))
linspace()
函数需要3个参数:一个起点、一个终点、一个返回元素的个数。linspace()
函数返回的元素包括起点和终点,可以通过endpoint
参数选择是否包含终点
import numpy as np
# 返回0到5之间的5个等距数值,包括0和5
print(np.linspace(0, 5, 5))
# 返回5个等距数值,包括0但不包括5
print(np.linspace(0, 5, 5, endpoint=False))
5. 重复构造法
repeat()
函数用来重复数组元素。但如果被重复的数组是一个多维数组,且repeat()
函数指定了axis
参数,情况就会变得有些复杂
import numpy as np
a = np.arange(5)
print(a)
# 重复一维数组元素3次
print(np.repeat(a, 3))
a = np.arange(6).reshape((2, 3))
print(a)
# 重复二维数组元素3次,不指定轴
print(np.repeat(a, 3))
# 重复二维数组元素3次,指定0轴
print(np.repeat(a, 3, axis=0))
# 重复二维数组元素3次,指定1轴
print(np.repeat(a, 3, axis=1))
tile()
将整个数组而非数组元素水平和垂直重复指定的次数
import numpy as np
a = np.arange(5)
print(a)
# 重复一维数组3次
print(np.tile(a, 3))
# 重复一维数组3行2列
print(np.tile(a, (3, 2)))
a = np.arange(6).reshape((2, 3))
print(a)
# 重复二维数组3次
print(np.tile(a, 3))
# 重复二维数组2行3列
print(np.tile(a, (2, 3)))
6. 网格构造法
用数组表示经纬度网格方式一:用两个一维数组表示。使用定长分隔函数linspace()
,将经度从-180°
到180°
分为间隔为10°
的37个点,将纬度从90°
到-90
分为间隔为10°
的19个点,得到两个一维数组
import numpy as np
# 精度为10°,共计37个经度点
lon = np.linspace(-180, 180, 37)
# 精度为10°,共计19个纬度点
lat = np.linspace(90, -90, 19)
用数组表示经纬度网格方式二:用两个二维数组分别表示经度网格和纬度网格。经度网格中每一列的元素都是相同的(同一个经度),纬度网格中每一行的元素都是相同的(同一个纬度)。生成二维经纬度网格的常用函数是np.meshgrid()
,该函数以一维经度数组lon和一维纬度数组lat为参数,返回二维的经度数组和纬度数组
import numpy as np
# 精度为10°,共计37个经度点
lon = np.linspace(-180, 180, 37)
# 精度为10°,共计19个纬度点
lat = np.linspace(90, -90, 19)
lons, lats = np.meshgrid(lon, lat)
print(lons.shape)
print(lats.shape)
print(lons[:,0])
print(lons[0])
构造经纬度网格,除了使用np.meshgrid()
函数外,还有一个更强大的方法,这个方法可以直接生成纬度网格和经度网格而无需借助于一维数组(请注意,纬度在前,经度在后)
import numpy as np
# 使用实数指定网格经度为5°
lats, lons = np.mgrid[90:-91:-5, -180:181:5]
print(lons.shape, lats.shape)
# 也可以用虚数指定分隔点数
lats, lons = np.mgrid[90:-90:37j, -180:180:73j]
print(lons.shape, lats.shape)
7. 自定义数据类型
结果显示:数组会将所有元素的数据类型都转为'<U32'
类型。这里的U标识Unicode字符串;<
表示字节顺序,意为小端在前(低位字节存储在最小地址中);32表示数组元素占用32字节,数组元素占用的字节数由所有元素中最长的那个元素决定
import numpy as np
print(np.array(['Anne', 1.70, 55]).dtype)
怎样在数组中保留用以生成数组的列表中的元素类型呢?这就需要用到自定义数据类型了。自定义数据类型类似于C语言的结构体,
其代码如下:
import numpy as np
mytype = np.dtype([('name', 'S32'), ('tall', np.float), ('bw', np.int)])
print(np.array([('Anne', 1.70, 55)], dtype=mytype))