核心概念速查
范式演进
Prompt Engineering → Context Engineering → Harness Engineering
"说什么" "给什么上下文" "在什么条件下运行"
(2023) (2025) (2026)Harness 五大组件
| 组件 | 作用 | 实现示例 |
|---|---|---|
| Prompts & Context | 系统提示、规则文件、memory | CLAUDE.md, .cursorrules |
| Tools | 工具定义、权限、调用方式 | MCP Server, function calling |
| Feedback Loops | 验证回路、自检、HITL | 自动测试、LLM-as-Judge、人工审查 |
| Constraints | 边界、权限、安全护栏 | 文件权限、Hooks、sandbox |
| State Management | 跨窗口状态、检查点、恢复 | 持久化 memory、检查点文件 |
核心公式
Agent 能力 = 模型能力 × Harness 质量
MCP 三大原语
| 原语 | 方向 | 用途 |
|---|---|---|
| Resources | Server → Client | 暴露数据 |
| Tools | Server → Client | 暴露操作 |
| Prompts | Server → Client | 暴露模板 |
A2A 三大概念
| 概念 | 作用 |
|---|---|
| Agent Card | Agent 的名片,描述能力和端点 |
| Task | 协作单元,有状态机 |
| Artifact | Task 的输出产物 |
MCP vs A2A
MCP: Agent ↔ 工具/数据(USB 接口)
A2A: Agent ↔ Agent(HTTP 协议)四层企业架构
L4 A2A — 跨系统 Agent 协作
L3 Agent — 自主决策和执行
L2 MCP — 工具和数据连接
L1 RAG — 知识检索增强评测三层
| 层 | 方法 | 适合 |
|---|---|---|
| L1 | Pass/Fail | 确定性任务 |
| L2 | Transcript Grading | 过程评估 |
| L3 | LLM-as-Judge | 开放式任务 |