👋 你好，我是 HenYan

知识实验室

记录 AI Agent 架构设计、工程实践与技术探索的公开知识库。

🕐 最新文章

📚Agent 架构演化系列 2026年8月3日

Agent 感知与输入层：从多模态 VLM 到 GUI Agent 的"眼睛"进化之路

系统拆解 Agent 五层架构第 4 层——感知与输入层：从多模态 VLM 的发展历程（CLIP→Flamingo/BLIP-2/LLaVA→Gemini/GPT-4o 原生多模态）与视觉 tokenization 底座，到 GUI 感知三条接口（DOM/AXTree/截图），再到 OmniParser 屏幕解析与 UI-TARS 原生 GUI Agent 模型，以及感知评测基准与工程挑战，并以 LogicAI2 为例给出文本型 Agent 的感知扩展路径。

#Agent#Perception#VLM

📚Agent 架构演化系列 2026年8月1日

Agent 架构演化（二）：记忆与知识管理层 (Memory & RAG)

深入拆解 Agent 记忆层的三大支柱：上下文窗口动态压缩与摘要、三路混合检索（Dense + Sparse + Knowledge Graph）、MemoryOS 分层记忆体系（Episodic & Procedural），并给出 LogicAI2 的落地路线图。

#Agent#Memory#RAG

📚Agent 架构演化系列 2026年8月1日

Agent 工具与行动层：从 Function Calling 到 MCP 与 GUI Agent 的进化之路

系统拆解 Agent 架构工具与行动层的进化主线——从 Toolformer 自监督工具学习、Function Calling API 与 /v1/chat/completions 协议解剖，到新一代 Responses API，再到工具学习与检索（Gorilla/ToolLLM/APIGen/Tool RAG）、MCP 协议标准化与 GUI Agent 全能之手，并以 LogicAI2 为例给出工具层落地的真实进展：ToolRegistry 与官方 SDK MCP 接入已完成，统一执行网关与全量审计正在推进。

#Agent#Function Calling#Responses API

📚Agent 架构演化系列 2026年7月30日

Agent 大脑层：从思维链到蒙特卡洛树搜索的推理进化之路

系统性拆解 Agent 架构大脑层的六大推理模式——CoT、ReAct、Plan-and-Execute、ToT、LATS、Reasoning Tokens，深入蒙特卡洛树搜索机制，并以 LogicAI2 为实例展示类比迁移与工程落地路径。

#Agent#LLM#推理

📚Agent 架构演化系列 2026年7月28日

Agent 架构演进与行业共识图谱：从经典三要素到现代五层架构

总结 2023-2026 年 Agent 架构核心演化：从 Lilian Weng 经典三要素到现代五层架构，涵盖 MCP、A2A 协议及 12 个核心概念的解毒与锚点跳转指南。

#Agent#Architecture#MCP

2026年7月12日

踩坑日志：部署与运维中的实战问题记录

记录在 VPS 部署、代理搭建、Web 开发等领域遇到的真实问题。

#运维#代理#VPS