问题背景

在使用 Flask 开发 Web 服务时，有一个接口涉及计算密集型任务（大量数学运算），遇到了以下现象：

使用 gunicorn+gevent 时：心跳线程（或其他后台任务）会被阻塞，直到主任务完成才恢复。

使用 python直接运行时：心跳线程能正常按预期间隔执行。

示例代码（问题重现）：

import time
from threading import Thread
from flask import Flask

app = Flask(__name__)

def heartbeat():
    while True:
        print(f"[{time.time()}] 心跳包")
        time.sleep(1)

@app.route("/compute")
def compute():
    # 启动心跳线程
    Thread(target=heartbeat).start()
    
    # 模拟计算密集型任务
    result = sum(i * i for i in range(10_000_000))
    return {"result": result}
if __name__=='__main__':
    app.run(host='0.0.0.0', port=8080)

启动方式对比：

bash
# 使用 gevent（心跳会被阻塞）
gunicorn app:app -k gevent

# 使用 gthread（心跳正常）
python3 app.pu

原因分析

gevent 的协程模型
gevent 采用协程（Coroutine）实现高并发，依赖协作式调度。
计算密集型任务不会主动让出控制权，导致协程无法切换，心跳线程被“饿死”。

因此可以使用gthread模型,其能使心跳线程能独立运行，不受主任务影响。

Gthread vs Gevent 对比

特性	gthread（线程）	gevent（协程）
调度方式	抢占式（OS 调度）	协作式（需主动让出）
CPU 密集型	✅ 适合（但受 GIL 影响）	❌ 必须手动 gevent.sleep(0)
I/O 密集型	❌ 线程切换成本高	✅ 高并发，低开销
内存占用	较高（每线程 MB 级）	极低（每协程 KB 级）
适用场景	计算任务 + 少量 I/O	高并发 Web API

解决方案

计算密集型任务 → 使用 gthread

gunicorn app:app -k gthread --threads 4  # 4 个工作线程

如果必须用 gevent，需让出控制权

import gevent

def compute():
    result = 0
    for i in range(10_000_000):
        result += i * i
        if i % 1000 == 0:
            gevent.sleep(0)  # 关键：让出控制权
    return {"result": result}

总结

gthread：适合 CPU 密集型或混合型任务，避免协程调度问题。

gevent：适合纯 I/O 密集型（如微服务、高并发 API），但需注意计算任务阻塞问题。

推荐选择：

计算任务多 → gthread / 多进程（-k sync -w N，N=CPU 核心数）。

高并发 I/O → gevent，但避免长时间 CPU 占用。

希望这篇分析能帮助你更好地选择 Gunicorn 工作模式！ 🚀

Flask中使用gunicorn+genvent启动的项目中,time.sleep不生效问题

Flask中使用gunicorn+genvent启动的项目中,time.sleep不生效问题

问题背景

启动方式对比：

原因分析

解决方案

总结

推荐阅读更多精彩内容