refactor: 重构 AgentScope ReAct Runner 与事件处理

- 重构 runtime/runner.py 实现 ReAct Agent 核心逻辑 - 更新事件编码器与存储机制 - 优化 prompt 系统与 tool 调用 - 调整 agent service 与 repository 配合
2026-03-16 16:10:39 +08:00
parent ab073c88ed
commit 36b104fa37
22 changed files with 1288 additions and 319 deletions
@@ -0,0 +1,689 @@
+from __future__ import annotations
+
+import json
+from collections.abc import AsyncGenerator
+from dataclasses import dataclass
+from datetime import datetime, timezone
+from decimal import Decimal
+from typing import TYPE_CHECKING, Any
+from uuid import UUID, uuid4
+
+from ag_ui.core.types import RunAgentInput
+from agentscope.formatter import OpenAIChatFormatter
+from agentscope.memory import InMemoryMemory
+from agentscope.message import Msg
+from agentscope.model import OpenAIChatModel
+from core.agentscope.events.persistence import MessageRepository, SessionRepository
+from core.agentscope.runtime.json_react_agent import JsonReActAgent
+from core.agentscope.prompts.system_prompt import build_system_prompt
+from core.agentscope.tools.toolkit import build_stage_toolkit, build_toolkit
+from core.agentscope.runtime.utils import (
+    normalize_tool_name,
+    parse_tool_agent_output,
+)
+from core.db.session import AsyncSessionLocal
+from core.logging import get_logger
+from models.agent_chat_message import AgentChatMessageRole
+from models.agent_chat_session import AgentChatSessionStatus
+from models.llm import Llm
+from models.system_agents import SystemAgents
+from schemas.agent.runtime_models import (
+    RouterAgentOutput,
+    WorkerAgentOutputLite,
+    resolve_worker_output_model,
+)
+from schemas.agent.system_agent import AgentType, SystemAgentLLMConfig
+from schemas.messages.chat_message import AgentChatMessage, AgentChatMessageMetadata
+from schemas.user import UserContext
+from services.litellm.service import LiteLLMService
+from sqlalchemy import select
+from sqlalchemy.ext.asyncio import AsyncSession
+
+if TYPE_CHECKING:
+    from core.agentscope.runtime.orchestrator import PipelineLike
+
+logger = get_logger("core.agentscope.runtime.runner")
+
+
+@dataclass(frozen=True)
+class SystemAgentRuntimeConfig:
+    agent_type: AgentType
+    model_code: str
+    llm_config: SystemAgentLLMConfig
+
+
+@dataclass(frozen=True)
+class StageExecutionResult:
+    message: Msg
+    payload: dict[str, Any]
+    response_metadata: dict[str, Any]
+
+
+class _TrackingChatModel:
+    def __init__(self, inner: OpenAIChatModel) -> None:
+        self._inner = inner
+        self._total_input_tokens = 0
+        self._total_output_tokens = 0
+        self._total_latency_ms = 0
+        self._cached_prompt_tokens = 0
+
+    @property
+    def stream(self) -> bool:
+        return self._inner.stream
+
+    @stream.setter
+    def stream(self, value: bool) -> None:
+        self._inner.stream = value
+
+    def __getattr__(self, name: str) -> Any:
+        return getattr(self._inner, name)
+
+    async def __call__(self, *args: Any, **kwargs: Any) -> Any:
+        tools = kwargs.get("tools")
+        tool_names: list[str] = []
+        generate_response_schema: dict[str, Any] | None = None
+        if isinstance(tools, list):
+            for tool in tools:
+                if not isinstance(tool, dict):
+                    continue
+                function = tool.get("function")
+                if isinstance(function, dict):
+                    name = function.get("name")
+                    if isinstance(name, str):
+                        tool_names.append(name)
+                        if name == "generate_response":
+                            parameters = function.get("parameters")
+                            if isinstance(parameters, dict):
+                                generate_response_schema = {
+                                    "required": parameters.get("required"),
+                                    "properties": list(
+                                        (
+                                            parameters.get("properties", {})
+                                            if isinstance(
+                                                parameters.get("properties", {}), dict
+                                            )
+                                            else {}
+                                        ).keys()
+                                    ),
+                                }
+        logger.info(
+            "model_call_debug",
+            tool_choice=kwargs.get("tool_choice"),
+            tool_count=len(tool_names),
+            tool_names=tool_names,
+            generate_response_schema=generate_response_schema,
+        )
+        response = await self._inner(*args, **kwargs)
+        if isinstance(response, AsyncGenerator):
+            return self._track_stream(response)
+        self._record_usage(getattr(response, "usage", None))
+        return response
+
+    async def _track_stream(
+        self, response: AsyncGenerator[Any, None]
+    ) -> AsyncGenerator[Any, None]:
+        latest_usage = None
+        async for chunk in response:
+            usage = getattr(chunk, "usage", None)
+            if usage is not None:
+                latest_usage = usage
+            yield chunk
+        self._record_usage(latest_usage)
+
+    def _record_usage(self, usage: Any) -> None:
+        if usage is None:
+            return
+        self._total_input_tokens += max(int(getattr(usage, "input_tokens", 0) or 0), 0)
+        self._total_output_tokens += max(
+            int(getattr(usage, "output_tokens", 0) or 0), 0
+        )
+        self._total_latency_ms += max(
+            int(round(float(getattr(usage, "time", 0) or 0) * 1000)), 0
+        )
+        metadata = getattr(usage, "metadata", None)
+        if metadata is not None:
+            cached_tokens = 0
+            if isinstance(metadata, dict):
+                prompt_details = metadata.get("prompt_tokens_details")
+                if isinstance(prompt_details, dict):
+                    cached_tokens = int(prompt_details.get("cached_tokens", 0) or 0)
+            else:
+                prompt_details = getattr(metadata, "prompt_tokens_details", None)
+                cached_tokens = int(getattr(prompt_details, "cached_tokens", 0) or 0)
+            self._cached_prompt_tokens += max(cached_tokens, 0)
+
+    def usage_summary(self) -> dict[str, int]:
+        return {
+            "input_tokens": self._total_input_tokens,
+            "output_tokens": self._total_output_tokens,
+            "latency_ms": self._total_latency_ms,
+            "cached_prompt_tokens": self._cached_prompt_tokens,
+        }
+
+
+class _PipelineStageEmitter:
+    def __init__(
+        self,
+        *,
+        pipeline: PipelineLike,
+        session_id: str,
+        run_id: str,
+        stage: str,
+        emit_text_events: bool,
+        emit_tool_events: bool,
+    ) -> None:
+        self._pipeline = pipeline
+        self._session_id = session_id
+        self._run_id = run_id
+        self._stage = stage
+        self._emit_text_events = emit_text_events
+        self._emit_tool_events = emit_tool_events
+        self._text_by_message_id: dict[str, str] = {}
+        self._emitted_tool_calls: set[str] = set()
+        self._emitted_tool_results: set[str] = set()
+        self.latest_text_message_id: str | None = None
+        self.latest_text: str = ""
+
+    async def handle_print(self, *, msg: Msg, last: bool) -> None:
+        del last
+        if self._emit_tool_events:
+            await self._emit_tool_events_from_msg(msg)
+        if self._emit_text_events:
+            await self._emit_text_events_from_msg(msg)
+
+    async def _emit_text_events_from_msg(self, msg: Msg) -> None:
+        text = msg.get_text_content(separator="") or ""
+        if not text:
+            return
+        message_id = str(msg.id)
+        self._text_by_message_id[message_id] = text
+        self.latest_text_message_id = message_id
+        self.latest_text = text
+
+    async def _emit_tool_events_from_msg(self, msg: Msg) -> None:
+        for block in msg.get_content_blocks("tool_use"):
+            tool_call_id = str(block.get("id", "")).strip()
+            tool_name = str(block.get("name", "")).strip()
+            if (
+                not tool_call_id
+                or not tool_name
+                or tool_call_id in self._emitted_tool_calls
+            ):
+                continue
+            payload = {
+                "messageId": str(msg.id),
+                "toolCallId": tool_call_id,
+                "toolCallName": tool_name,
+                "stage": self._stage,
+            }
+            await self._emit("TOOL_CALL_START", payload)
+            await self._emit(
+                "TOOL_CALL_ARGS",
+                {
+                    **payload,
+                    "args": block.get("input", {}),
+                },
+            )
+            await self._emit("TOOL_CALL_END", payload)
+            self._emitted_tool_calls.add(tool_call_id)
+
+        for block in msg.get_content_blocks("tool_result"):
+            tool_call_id = str(block.get("id", "")).strip()
+            if not tool_call_id or tool_call_id in self._emitted_tool_results:
+                continue
+            tool_output = parse_tool_agent_output(block.get("output"))
+            if tool_output is None:
+                continue
+
+            tool_output_dict = tool_output.model_dump(mode="json", exclude_none=True)
+
+            result_data = {
+                "messageId": str(msg.id),
+                "role": "tool",
+                "stage": self._stage,
+                "tool_name": tool_output.tool_name,
+                "tool_call_id": tool_output.tool_call_id,
+                "tool_call_args": tool_output.tool_call_args,
+                "status": tool_output.status.value,
+                "result_summary": tool_output.result_summary,
+            }
+            ui_hints = tool_output_dict.get("ui_hints")
+            if ui_hints is not None:
+                result_data["ui_hints"] = ui_hints
+            if tool_output.error:
+                result_data["error"] = tool_output.error.model_dump(mode="json")
+
+            await self._emit("TOOL_CALL_RESULT", result_data)
+            self._emitted_tool_results.add(tool_call_id)
+
+    async def emit_final_text_end(
+        self,
+        *,
+        worker_output: dict[str, Any],
+        response_metadata: dict[str, Any],
+    ) -> None:
+        message_id = (
+            self.latest_text_message_id or f"worker-{self._run_id}-{uuid4().hex[:8]}"
+        )
+
+        output_data = {
+            "messageId": message_id,
+            "role": "assistant",
+            "stage": self._stage,
+            "status": worker_output.get("status"),
+            "answer": worker_output.get("answer", ""),
+            "key_points": worker_output.get("key_points", []),
+            "result_type": worker_output.get("result_type"),
+            "suggested_actions": worker_output.get("suggested_actions", []),
+            "error": worker_output.get("error"),
+        }
+        ui_hints = worker_output.get("ui_hints")
+        if ui_hints is not None:
+            output_data["ui_hints"] = ui_hints
+
+        output_data.update(response_metadata)
+
+        await self._emit("TEXT_MESSAGE_END", output_data)
+
+    async def _emit(self, event_type: str, payload: dict[str, Any]) -> None:
+        await self._pipeline.emit(
+            session_id=self._session_id,
+            event={
+                "type": event_type,
+                "threadId": self._session_id,
+                "runId": self._run_id,
+                **payload,
+            },
+        )
+
+
+class AgentScopeRunner:
+    def __init__(self, *, litellm_service: LiteLLMService | None = None) -> None:
+        self._litellm_service = litellm_service or LiteLLMService()
+
+    async def execute(
+        self,
+        *,
+        user_context: UserContext,
+        context_messages: list[Msg],
+        pipeline: PipelineLike,
+        run_input: RunAgentInput,
+    ) -> dict[str, Any]:
+        owner_id = UUID(user_context.id)
+        enabled_tool_names = self._extract_tool_names(run_input)
+
+        async with AsyncSessionLocal() as session:
+            router_toolkit, worker_toolkit = self._build_toolkits(
+                session=session,
+                owner_id=owner_id,
+                enabled_tool_names=enabled_tool_names,
+            )
+
+            router_config = await self._load_system_agent_config(
+                session=session,
+                agent_type=AgentType.ROUTER,
+            )
+            worker_config = await self._load_system_agent_config(
+                session=session,
+                agent_type=AgentType.WORKER,
+            )
+
+            await self._emit_step_event(
+                pipeline=pipeline,
+                run_input=run_input,
+                step_name="router",
+                event_type="STEP_STARTED",
+            )
+            router_result = await self._run_router_stage(
+                user_context=user_context,
+                context_messages=context_messages,
+                toolkit=router_toolkit,
+                run_input=run_input,
+                stage_config=router_config,
+            )
+            router_output = RouterAgentOutput.model_validate(router_result.payload)
+            await self._persist_router_message(
+                session=session,
+                thread_id=run_input.thread_id,
+                run_id=run_input.run_id,
+                model_code=router_config.model_code,
+                router_output=router_output,
+                response_metadata=router_result.response_metadata,
+            )
+            await session.commit()
+            await self._emit_step_event(
+                pipeline=pipeline,
+                run_input=run_input,
+                step_name="router",
+                event_type="STEP_FINISHED",
+            )
+
+            worker_output_model = resolve_worker_output_model(router_output.ui.ui_mode)
+            await self._emit_step_event(
+                pipeline=pipeline,
+                run_input=run_input,
+                step_name="worker",
+                event_type="STEP_STARTED",
+            )
+            worker_result = await self._run_worker_stage(
+                user_context=user_context,
+                router_output=router_output,
+                toolkit=worker_toolkit,
+                run_input=run_input,
+                stage_config=worker_config,
+                worker_output_model=worker_output_model,
+                pipeline=pipeline,
+            )
+            worker_output = worker_output_model.model_validate(worker_result.payload)
+            await self._emit_step_event(
+                pipeline=pipeline,
+                run_input=run_input,
+                step_name="worker",
+                event_type="STEP_FINISHED",
+            )
+
+            return {
+                "router": router_output.model_dump(mode="json", exclude_none=True),
+                "worker": worker_output.model_dump(mode="json", exclude_none=True),
+            }
+
+    def _build_toolkits(
+        self,
+        *,
+        session: AsyncSession,
+        owner_id: UUID,
+        enabled_tool_names: set[str] | None,
+    ) -> tuple[Any, Any]:
+        return (
+            build_toolkit(
+                session=session,
+                owner_id=owner_id,
+                enabled_tool_names=set(),
+            ),
+            build_stage_toolkit(
+                agent_type=AgentType.WORKER,
+                session=session,
+                owner_id=owner_id,
+                enabled_tool_names=enabled_tool_names,
+            ),
+        )
+
+    def _extract_tool_names(self, run_input: RunAgentInput) -> set[str] | None:
+        raw_tools = getattr(run_input, "tools", None)
+        if not isinstance(raw_tools, list):
+            return None
+        selected: set[str] = set()
+        for item in raw_tools:
+            if isinstance(item, dict):
+                name = item.get("name")
+            else:
+                name = getattr(item, "name", None)
+            if isinstance(name, str) and name.strip():
+                selected.add(normalize_tool_name(name))
+        return selected
+
+    async def _load_system_agent_config(
+        self,
+        *,
+        session: AsyncSession,
+        agent_type: AgentType,
+    ) -> SystemAgentRuntimeConfig:
+        stmt = (
+            select(SystemAgents, Llm)
+            .join(Llm, SystemAgents.llm_id == Llm.id)
+            .where(SystemAgents.agent_type == agent_type.value)
+        )
+        row = (await session.execute(stmt)).one_or_none()
+        if row is None:
+            raise RuntimeError(f"system agent config not found: {agent_type.value}")
+        system_agent, llm = row
+        status = str(system_agent.status).strip().lower()
+        if status != "active":
+            raise RuntimeError(f"system agent is not active: {agent_type.value}")
+        return SystemAgentRuntimeConfig(
+            agent_type=agent_type,
+            model_code=llm.model_code,
+            llm_config=SystemAgentLLMConfig.model_validate(system_agent.config or {}),
+        )
+
+    async def _run_router_stage(
+        self,
+        *,
+        user_context: UserContext,
+        context_messages: list[Msg],
+        toolkit: Any,
+        run_input: RunAgentInput,
+        stage_config: SystemAgentRuntimeConfig,
+    ) -> StageExecutionResult:
+        tracking_model = self._build_model(stage_config=stage_config)
+        system_prompt = build_system_prompt(
+            agent_type=AgentType.ROUTER,
+            user_context=user_context,
+            now_utc=datetime.now(timezone.utc),
+            tools=None,
+        )
+        agent = self._build_agent(
+            agent_name="router",
+            system_prompt=system_prompt,
+            toolkit=toolkit,
+            model=tracking_model,
+        )
+        response_msg = await agent.reply_json(
+            context_messages,
+            output_model=RouterAgentOutput,
+        )
+        logger.info(
+            "router_reply_received",
+            run_id=run_input.run_id,
+            thread_id=run_input.thread_id,
+            message_id=str(response_msg.id),
+        )
+        payload = RouterAgentOutput.model_validate(
+            response_msg.metadata or {}
+        ).model_dump(
+            mode="json",
+            exclude_none=True,
+        )
+        return StageExecutionResult(
+            message=response_msg,
+            payload=payload,
+            response_metadata=self._litellm_service.build_usage_metadata(
+                model=stage_config.model_code,
+                usage_summary=tracking_model.usage_summary(),
+            ),
+        )
+
+    async def _run_worker_stage(
+        self,
+        *,
+        user_context: UserContext,
+        router_output: RouterAgentOutput,
+        toolkit: Any,
+        run_input: RunAgentInput,
+        stage_config: SystemAgentRuntimeConfig,
+        worker_output_model: type[WorkerAgentOutputLite],
+        pipeline: PipelineLike,
+    ) -> StageExecutionResult:
+        worker_input = self._build_worker_input_messages(
+            router_output=router_output,
+        )
+        tracking_model = self._build_model(stage_config=stage_config)
+        emitter = _PipelineStageEmitter(
+            pipeline=pipeline,
+            session_id=run_input.thread_id,
+            run_id=run_input.run_id,
+            stage="worker",
+            emit_text_events=True,
+            emit_tool_events=True,
+        )
+        agent = self._build_agent(
+            agent_name="worker",
+            system_prompt=build_system_prompt(
+                agent_type=AgentType.WORKER,
+                user_context=user_context,
+                now_utc=datetime.now(timezone.utc),
+                tools=run_input.tools,
+            ),
+            toolkit=toolkit,
+            model=tracking_model,
+            emitter=emitter,
+        )
+        response_msg = await agent.reply_json(
+            worker_input,
+            output_model=worker_output_model,
+        )
+        worker_payload = worker_output_model.model_validate(response_msg.metadata or {})
+        response_metadata = self._litellm_service.build_usage_metadata(
+            model=stage_config.model_code,
+            usage_summary=tracking_model.usage_summary(),
+        )
+        await emitter.emit_final_text_end(
+            worker_output=worker_payload.model_dump(mode="json", exclude_none=True),
+            response_metadata=response_metadata,
+        )
+        return StageExecutionResult(
+            message=response_msg,
+            payload=worker_payload.model_dump(mode="json", exclude_none=True),
+            response_metadata=response_metadata,
+        )
+
+    def _build_worker_input_messages(
+        self,
+        *,
+        router_output: RouterAgentOutput,
+    ) -> list[Msg]:
+        routing_contract = json.dumps(
+            router_output.model_dump(mode="json", exclude_none=True),
+            ensure_ascii=False,
+            separators=(",", ":"),
+        )
+        routing_msg = Msg(
+            name="router",
+            role="user",
+            content=(
+                "Use the following routing contract as the execution source of truth. "
+                f"Do not change the routed objective:\n{routing_contract}"
+            ),
+        )
+        return [routing_msg]
+
+    def _build_model(
+        self, *, stage_config: SystemAgentRuntimeConfig
+    ) -> _TrackingChatModel:
+        generate_kwargs: dict[str, Any] = {
+            "temperature": stage_config.llm_config.temperature,
+            "max_tokens": stage_config.llm_config.max_tokens,
+            "timeout": stage_config.llm_config.timeout_seconds,
+        }
+        if stage_config.agent_type == AgentType.ROUTER:
+            generate_kwargs["extra_body"] = {"enable_thinking": False}
+
+        model = OpenAIChatModel(
+            model_name=stage_config.model_code,
+            api_key=self._litellm_service.proxy_api_key,
+            stream=False,
+            client_kwargs={"base_url": self._litellm_service.proxy_base_url},
+            generate_kwargs=generate_kwargs,
+        )
+        return _TrackingChatModel(model)
+
+    def _build_agent(
+        self,
+        *,
+        agent_name: str,
+        system_prompt: str,
+        toolkit: Any,
+        model: _TrackingChatModel,
+        emitter: _PipelineStageEmitter | None = None,
+    ) -> JsonReActAgent:
+        return JsonReActAgent(
+            name=agent_name,
+            sys_prompt=system_prompt,
+            model=model,
+            formatter=OpenAIChatFormatter(),
+            toolkit=toolkit,
+            memory=InMemoryMemory(),
+            emitter=emitter,
+        )
+
+    async def _emit_step_event(
+        self,
+        *,
+        pipeline: PipelineLike,
+        run_input: RunAgentInput,
+        step_name: str,
+        event_type: str,
+    ) -> None:
+        await pipeline.emit(
+            session_id=run_input.thread_id,
+            event={
+                "type": event_type,
+                "threadId": run_input.thread_id,
+                "runId": run_input.run_id,
+                "stepName": step_name,
+            },
+        )
+
+    async def _persist_router_message(
+        self,
+        *,
+        session: AsyncSession,
+        thread_id: str,
+        run_id: str,
+        model_code: str,
+        router_output: RouterAgentOutput,
+        response_metadata: dict[str, Any],
+    ) -> None:
+        session_id = UUID(thread_id)
+        message_repo = MessageRepository(session)
+        session_repo = SessionRepository(session)
+        locked_session = await session_repo.lock_session_for_update(
+            session_id=session_id
+        )
+        if locked_session is None:
+            raise RuntimeError("chat session not found for router persistence")
+        seq = int(getattr(locked_session, "message_count", 0) or 0) + 1
+        metadata = AgentChatMessageMetadata(
+            run_id=run_id,
+            agent_type=AgentType.ROUTER,
+            router_agent_output=router_output,
+        )
+        message_payload = AgentChatMessage(
+            id=uuid4(),
+            seq=seq,
+            role=AgentChatMessageRole.ASSISTANT.value,
+            content="",
+            model_code=model_code,
+            tool_name=None,
+            input_tokens=int(response_metadata.get("inputTokens", 0) or 0),
+            output_tokens=int(response_metadata.get("outputTokens", 0) or 0),
+            cost=Decimal(str(response_metadata.get("cost", 0) or 0)),
+            latency_ms=int(response_metadata.get("latencyMs", 0) or 0),
+            metadata=metadata,
+            timestamp=datetime.now(timezone.utc),
+        )
+        await message_repo.append_message(
+            session_id=session_id,
+            seq=message_payload.seq,
+            role=AgentChatMessageRole.ASSISTANT,
+            content=message_payload.content,
+            model_code=message_payload.model_code,
+            tool_name=message_payload.tool_name,
+            metadata=metadata.model_dump(mode="json", exclude_none=True),
+            input_tokens=message_payload.input_tokens,
+            output_tokens=message_payload.output_tokens,
+            cost=message_payload.cost,
+            latency_ms=message_payload.latency_ms,
+        )
+        await session_repo.update_runtime_state(
+            chat_session=locked_session,
+            status=AgentChatSessionStatus.RUNNING,
+            state_snapshot=locked_session.state_snapshot or {},
+            message_delta=1,
+            token_delta=message_payload.input_tokens + message_payload.output_tokens,
+            cost_delta=message_payload.cost,
+        )
+        await session.flush()
+
+
+AgentScopeReActRunner = AgentScopeRunner