图解｜Go的GMP在计算密集型和IO密集型的区别

写在前面

Go的GMP我们很熟悉了，计算密集型和io密集型我们也很熟悉了，但 Go 的GMP在计算密集型和io密集型上有什么区别呢？ 这篇文章我们就来探讨一下！

当然这也只是我自己的理解，如果你有不同的理解，可以评论区留言！

GMP

调度模型：

How GMP Works

大部分时间在等待外部资源（磁盘、网络、数据库）响应，CPU常处于空闲或低占用。

IO-Bound

在IO密集型系统中，我们假设每一个G都是请求外部资源，比如RPC、Redis、DB等等… 当我们代码执行一次网络请求 (如http.Get) 时，GMP发生以下事情：

G (Goroutine)： 执行到网络读取操作，发现数据未就绪。
G->Netpoller： G将自己 注册到基于epoll的网络轮询器的Netpoller中，状态变为waiting并与M分离。
M (Machine)： M不会阻塞，会立刻通过 P 获取本地队列中的下一个G继续执行。
Netpoller->P： 当网络数据到达，Netpoller检测到事件，将之前的G状态改为running ，并将其注入到全局队列或某个P的本地队列。
P (Processor)： 在后续调度中，P再次拿到这个G，M继续执行之前的上下文。

⚠️ 注意点：M始终在工作，没有空闲。所以对于IO密集型系统，GMP 通过挂起当前在等待数据的G，可以使得M能处理其他的G，利用等待时间，把有限的 CPU 放大成海量的并发处理能力，拆分协程收益巨大，达到四两拨千斤的效果。

大部分时间在执行CPU计算（算法、编码/解码、加密、ML推理），CPU长期接近满载。

当我们代码执行一个死循环计算或复杂哈希时，GMP的工作就会是这样：

GMP in CPU-Bound

在计算密集型场景下，所谓的高并发其实是假象。

对于计算密集型，开一万个G，真正的并行度依然卡死在CPU核数上。反而因为过度的切换(Context Switch)和CPU缓存失效(Cache Miss)，导致整体效率不如只开8个G。

所以系统CPU 算力就那么大，在计算密集型系统中，协程越多，调度损耗越多，拆分协程的目的是为了不让某一个协程独占CPU，所以在做计算密集型任务的时候不要滥用 go func() ，最好是 协程数 ≈ CPU 核数 。