Plan: FastAPI + Celery 日志管理器系统
Date: 2026-01-29
Author: AI Assistant
Status: Draft
Overview
构建一个统一、可扩展的日志管理器系统,覆盖 FastAPI 与 Celery worker 的运行时日志,提供结构化 JSON 输出、错误分离、日志轮转与上下文追踪。目标是满足生产环境可观测性需求,便于检索、关联与故障排查,并与当前项目配置体系保持一致。
Requirements
Functional
Non-Functional
Technical Approach
调研摘要
- Python 官方建议使用
logging + dictConfig 管理多 handler、多 formatter 与过滤器,适用于生产环境配置化管理。
- FastAPI 通常通过中间件注入 request_id 和上下文,并使用结构化日志输出以便集中检索。
- Celery 官方文档建议在自定义场景下关闭
worker_hijack_root_logger,通过信号配置自定义 handler。
- 结构化日志库中,structlog 更贴近标准 logging,可与
logging 生态协同;loguru 简化配置但替换性强、与 Celery 深度集成时可控性较弱。
- 生产环境推荐 JSON 结构化日志 + 轮转 + 错误分离,并通过外部系统聚合与告警(如 Sentry)。
方案对比(至少两种)
| 方案 |
描述 |
优点 |
缺点 |
结论 |
| 方案 A:stdlib logging + 自定义 JSON Formatter |
纯标准库实现 JSON formatter + handler/filters |
依赖最少,符合标准库,易与 Celery/FastAPI 集成 |
结构化上下文绑定与 request_id 传递需手写 |
可作为备选最小方案 |
| 方案 B:stdlib logging + structlog |
用 structlog 生成结构化事件,输出到 logging handler |
结构化上下文与 contextvars 支持好,兼容 logging handler |
引入第三方依赖与配置复杂度 |
推荐主方案 |
| 方案 C:loguru |
直接使用 loguru logger |
配置简单、体验好 |
与 Celery/标准 logging 生态整合成本高 |
不推荐作为主方案 |
选型结论
- 采用方案 B:
logging 作为底座,structlog 负责结构化事件与上下文绑定;保留可切换到方案 A 的最小实现路径。
- 通过
dictConfig 做环境配置,使用 Rotating/TimedRotating handler 支持按大小或时间轮转。
Implementation Steps
Phase 1: 基础日志骨架与配置 (3 hours)
- 新增日志配置模型(Settings 扩展),支持环境、轮转方式与路径配置。
- 创建日志模块骨架:formatter、handler、filter、context。
- 集成
dictConfig 初始化入口,支持 dev/test/prod 配置切换。
Phase 2: FastAPI 集成与上下文 (4 hours)
- 实现请求中间件:生成
request_id,绑定用户与请求上下文(IP、路径、方法)。
- 定义异常处理器:捕获未处理异常并记录堆栈与上下文。
- 添加应用启动时日志初始化流程。
Phase 3: Celery 集成 (3 hours)
- 在 Celery 应用配置中设置
worker_hijack_root_logger = False。
- 使用 Celery 信号(
setup_logging、after_setup_task_logger)初始化日志并注入 task 上下文。
- 统一日志格式、error 处理与 request_id 关联(如 task_id)。
Phase 4: 错误分离与轮转策略 (3 hours)
- 添加 error handler:仅接受 ERROR/CRITICAL,输出到
logs/errors/。
- 实现轮转策略配置(按大小、按时间),并提供统一切换配置项。
- 增加字段脱敏与敏感字段黑名单过滤器。
Phase 5: 可选增强功能 (4 hours)
- 日志查询与过滤接口(基础 API + 分页)。
- 日志聚合统计(按级别/模块/时间窗口)。
- Sentry 集成与异常告警。
Files to Modify
| File |
Changes |
| backend/src/core/config/settings.py |
扩展日志相关配置模型 |
Files to Create
| File |
Purpose |
| backend/src/core/logging/__init__.py |
模块导出与初始化入口 |
| backend/src/core/logging/config.py |
dictConfig 构建与环境配置 |
| backend/src/core/logging/formatters.py |
JSON formatter 与字段规范 |
| backend/src/core/logging/handlers.py |
文件、控制台、错误 handler |
| backend/src/core/logging/filters.py |
等级过滤、敏感字段脱敏 |
| backend/src/core/logging/context.py |
contextvars 绑定与获取 |
| backend/src/core/logging/middleware.py |
FastAPI 请求中间件 |
| backend/src/core/logging/celery.py |
Celery 日志信号集成 |
| backend/src/core/logging/examples.py |
使用示例(可选) |
Dependencies
配置示例
使用示例代码
Testing Strategy
- Unit Tests: formatter 输出结构、filter 脱敏规则、context 绑定行为
- Integration Tests: FastAPI 中间件注入的 request_id 与错误分离写入
- E2E Tests: 关键流程触发错误,验证 error 日志输出与轮转
Test Database 约定
Supabase 组件能力范围
- Supabase 的 Auth/Storage/Realtime 等组件是独立服务,默认指向同一个主数据库。
- 单独创建一个“测试数据库”(Postgres database)并不会自动获得这些组件的能力,除非显式为这些服务配置新的数据库连接。
- 因此,“测试数据库”默认只具备纯 Postgres 能力;Supabase 组件能力仍然作用在主数据库上。
对测试的影响
- 只走直连数据库的测试(如通过 SQLAlchemy/psycopg 直连)不会受影响。
- 依赖 Supabase 组件的测试(例如通过 Auth/Storage/Realtime API)会仍然落到主数据库,可能导致:
- 若需要 Supabase 组件也“指向测试数据库”,需要启动一套独立 Supabase 栈或重新配置各服务连接(通常不建议在同一栈内动态切换)。
环境变量与自动创建
- 建议为“测试数据库”提供独立环境变量(仅测试环境读取),例如:
SOCIAL_TEST_DATABASE__HOST
SOCIAL_TEST_DATABASE__PORT
SOCIAL_TEST_DATABASE__NAME
SOCIAL_TEST_DATABASE__USER
SOCIAL_TEST_DATABASE__PASSWORD
- 若使用 Docker 启动 Postgres,建议在容器初始化阶段自动创建测试数据库(避免手动创建):
- 通过
docker-entrypoint-initdb.d 的 init SQL 脚本创建测试数据库与权限
- 保证容器重建后自动恢复测试数据库
- 若使用独立 Supabase 栈做测试,测试环境变量应指向该栈的数据库与服务端口。
Risks & Mitigations
| Risk |
Impact |
Likelihood |
Mitigation |
| Celery 日志被自动劫持导致重复或丢失 |
High |
Medium |
设置 worker_hijack_root_logger=False 并通过信号统一配置 |
| 结构化字段不一致导致下游解析失败 |
Medium |
Medium |
统一 schema,增加单元测试与校验 |
| 误记录敏感信息 |
High |
Medium |
增加脱敏过滤器与字段黑名单 |
| 日志量过大影响性能 |
Medium |
Medium |
轮转 + 级别控制 + 可选异步队列化 |
Estimated Effort
| Phase |
Effort |
| Phase 1 |
3 hours |
| Phase 2 |
4 hours |
| Phase 3 |
3 hours |
| Phase 4 |
3 hours |
| Phase 5 |
4 hours |
| Total |
17 hours |