认识Java底层操作系统与并发基础

一、现代计算机硬件结构

1.CPU内部结构

1.1.CPU缓存结构

1.2.CPU运行安全等级

2.操作系统内存管理

3.进程与线程

一、现代计算机硬件结构

核心部分： CPU、内存

1.CPU内部结构

控制单元： 整个 CPU 的指挥控制中心

运算单元： 运算器核心，执行算术运算与逻辑运算。运算器接收控制单元的指令而执行动作

存储单元： CPU 中暂时存储数据的地方，包括 CPU 片内缓存 Cache 和 寄存器组

1.1.CPU缓存结构

现代 CPU 为了提升执行效率，减少 CPU 与内存的交互(交互影响 CPU 效率)，一般在 CPU上集成了多级缓存架构，常见的为三级缓存结构

L1 Cache，分为数据缓存和指令缓存，逻辑核独占

L2 Cache，物理核独占，逻辑核共享

L3 Cache，所有物理核共享

此机器的三级缓存架构如下图：L1 Cache又分为两种，指令存储单元（存指令），和逻辑存储单元（存逻辑)。理论上一台机器可以有多个 CPU，由插槽决定，一个 CPU 又有多核，一个核又可以由多个逻辑处理器。

寄存器是 CPU 内部元件，读写速度非常快。 CPU 读取数据只会从寄存器中去取，每个 CPU 都有一个独有的寄存器，其他 CPU 无法访问。采用寄存器，可以减少 CPU 访问内存的次数，从而提高了 CPU 的工作速度。

越靠近 CPU 读取速度越快，摩尔定律中，CPU 以每18个月翻一番的速度在发展，而内存和硬盘的发展速度远远跟不上。为了解决 CPU 运算速度和 I\O 速度不匹配的问题，CPU 开始被内置了少量的高速缓存 Lx Cache（CPU空间有限，存储元件大小受限）。

存储器存储空间大小：内存 > L3 Cache > L2 Cache > L1 Cache > 寄存器
存储器读取速度快慢：寄存器 > L1 Cache > L2 Cache > L3 Cache > 内存
缓存是由最小的存储区块--- 缓存行(CacheLine) 组成，缓存行大小通常为64byte。我的机器L1的缓存大小时512K，则由512 * 1024/64个缓存行组成。

CPU读取存储器数据过程： CPU 仅能直接从寄存器中获取数据。 假设数据 x = 0 在内存中，则它的取值过程如下：

判断寄存器中是否存在

不存在则遍历L1 Cache 看是否存在，不存在遍历L2 Cache，L2 Cache 中没有，遍历L3 Cache。中间过程存在，则会把 Cache 行锁住，拷贝到上一级，直至到寄存器。

Cache 中没有则区内存中找，先通知内存控制器占用总线带宽，通知内存加锁，发起内存读请求，等待回应，回应数据拷贝到L3 Cache。注意：整个过程加锁直至到CPU才会解开

局部性原理：在CPU访问存储设备时，无论是存取数据还是存取指令，都趋于聚集在一片连续的区域中。

这种局部性原理又有两种：

时间局部性（Temporal Locality）： 如果一个信息项正在被访问，那么在近期它很可能还会被再次访问。比如循环、递归、方法的反复调用等。

空间局部性（Spatial Locality）： 如果一个存储器的位置被引用，那么将来他附近的位置也会被引用。比如顺序执行的代码、连续创建的两个对象、数组等。

空间局部性的例子： 一个很大的二维数组，累加求和一行一行加会比一列一列累加快很多。在CPU 在内存中读取数据时会将附件的数据都读进去。

1.2.CPU运行安全等级

CPU被划分为 4 个运行级别：

ring0 内核态

ring1

ring2

ring3 用户态

Linux 和 Windows 都只用到了两个级别:ring0、ring3，操作系统内部内部程序指令通常运行在 ring0 级别，操作系统以外的第三方程序运行在 ring3 级别，第三方程序如果要调用操作系统内部函数功能，由于运行安全级别不够，必须切换CPU运行状态，从 ring3 切换到 ring0, 然后执行系统函数，创建线程，线程阻塞唤醒是重型操作，因为CPU要切换运行状态。

JVM 创建线程是 CPU 的流程：