AI 工程 on 嘴强黑客 /pbuff07

Learn-Claude-Code(Tools)

Fri, 27 Mar 2026 17:46:00 +0800

接上一篇 Agent 循环的实现，s01 搞清楚了 Agent 循环的本质就是一个 while True 不断问 LLM、执行工具、再问 LLM。但那时候只有一个 bash 工具，啥都走 shell，多少有点暴力。

s02 解决了一个很实际的问题：工具怎么扩展？

一个 handler 对应一个工具

核心思路特别简单：把工具调用从硬编码改成字典查找。

流程是这样的：用户输入 → LLM 决定调用哪个工具 → Tool Dispatch 字典查找对应 handler → 执行返回结果 → LLM 继续处理。

s01 的时候，循环里直接写死了 run_bash(block.input["command"])。现在改成这样：

TOOL_HANDLERS = {
 "bash": lambda **kw: run_bash(kw["command"]),
 "read_file": lambda **kw: run_read(kw["path"], kw.get("limit")),
 "write_file": lambda **kw: run_write(kw["path"], kw["content"]),
 "edit_file": lambda **kw: run_edit(kw["path"], kw["old_text"],
 kw["new_text"]),
}

循环体里就变成了一行查找：

handler = TOOL_HANDLERS.get(block.name)
output = handler(**block.input) if handler \
 else f"Unknown tool: {block.name}"

加工具 = 加 handler + 加 schema，循环永远不用动。这个设计很干净。

Learn-Claude-Code(Agent)

Fri, 20 Mar 2026 17:00:00 +0800

最近跟着 learn-claude-code 学习 Agent 的构建，这是一个很好的教程，帮助我更清晰地了解 AI Agent 到底是如何工作的。

Agent 循环的本质

Agent 循环其实就是 while True 的过程：LLM 根据用户问题不断分析问题 → 调用工具 → 分析结果，直到不需要再调用工具就退出。

动手实现一个最简单的 Agent

通过一段示例代码来构建一个最简单的 Agent。

1. 初始化配置

首先初始化客户端，配置好系统提示词和工具（参数参考接口实现）。

from anthropic import Anthropic
import os

client = Anthropic(
 api_key="your-api-key-here",
 base_url="https://api.deepseek.com/anthropic/",
)

system_prompt = "You are a coding agent at {os.getcwd()}. Use bash to solve tasks. Act, don't explain."

tools = [{
 "name": "bash",
 "description": "Run a shell command.",
 "input_schema": {
 "type": "object",
 "properties": {
 "command": {
 "type": "string",
 }
 },
 "required": ["command"],
 }
}]

2. 主循环入口

main() 函数负责持续接收用户输入，若有问题则传递给 agent_loop 开始调用模型完成任务。

Langchain中create_agent和create_deep_agent对比

Thu, 12 Mar 2026 14:00:00 +0800

对比分析Langchain中create_agent和create_deep_agent两个函数的实现原理与差异。

一、核心架构关系

create_deep_agent本质上是基于create_agent的高级封装：

┌─────────────────────────────────────────────────────────────────┐
│ create_deep_agent │
│ ┌─────────────────────────────────────────────────────────────┐ │
│ │ 预配置层： │ │
│ │ • 内置中间件栈 │ │
│ │ • 子代理系统 (SubAgentMiddleware) │ │
│ │ • 技能系统 (SkillsMiddleware) │ │
│ │ • 记忆系统 (MemoryMiddleware) │ │
│ └──────────────────────────────┬──────────────────────────────┘ │
│ │ │
│ ▼ │
│ ┌─────────────────────────────────────────────────────────────┐ │
│ │ create_agent │ │
│ │ 核心引擎： │ │
│ │ • StateGraph 构建 │ │
│ │ • Model-Tool 循环 │ │
│ │ • 中间件钩子系统 │ │
│ │ • 结构化输出 │ │
│ └─────────────────────────────────────────────────────────────┘ │
└─────────────────────────────────────────────────────────────────┘

二、create_agent - 核心引擎

2.1 核心功能

create_agent是一个通用的代理构建框架，负责：

DeepAgent学习一

Wed, 11 Mar 2026 10:00:00 +0800

AI时代学习知识还得回归古法，自己动手写代码去验证和实践，AI产出的东西始终都是AI的。

要会用AI工具但也要懂如何设计AI工具。

参考文章

DeepAgent是什么？

DeepAgent是LangChain公司在LangChain、LangGraph基础上推出的一种用于复杂任务规划、长时间执行的新的框架。简而言之就是一个新的框架，但是这个框架和LangChain、LangGraph有啥区别呢？

根据官方文档，主要介绍了以下几个方面，其中我认为后端、次级代理、长期记忆、Skills和沙箱是比较有特点的几个新特性。

模型 Models

后端 Backends

次级代理 SubAgent

人机交互 Human-in-the-loop

长期记忆 Long-time-memory

渐进式技能 Skills

沙箱 Sandbox

下面针对这些特性做一下我的简单理解和学习。

模型 Models

没有特别说明的，配置特定参数的话使用init_chat_model函数即可。

from langchain.chat_models import init_chat_model
from langchain_core.language_models import BaseChatModel

def _get_model() -> BaseChatModel | None:
 api_key = os.environ.get("DEEPSEEK_API_KEY")
 if not api_key:
 return None
 model_name = os.environ.get("DEEPSEEK_MODEL", "deepseek-chat")
 return init_chat_model(
 f"openai:{model_name}",
 base_url="https://api.deepseek.com/v1",
 api_key=api_key,
 )

后端 Backends

DeepAgent提供了一个后端接口可以实现文件/命令级别的操作与访问，原来LangGraph执行系统命令可能只有通过tool调用，现在可以直接配置后端类型然后LLM根据提示词自己决策直接执行，灵活性更高。

后端类型：默认类型、本地文件系统类型、本地shell类型、沙箱、复合类型和StoreBackend类型。

默认类型临时状态吧，当前代码结束了也就结束了；复合类型和StoreBackend我有点不太明白，等需要用到了再说吧（官方文档）。

本地文件系统类型

若提供这个后端，则这个agent就有了读写本机文件的权限，当然可以通过root_dir参数设置具体的目录，virtual_mode表示沙盒模式（看起来和sandboxs沙箱不是同一个东西，开启这个防止root_dir存在路径遍历漏洞，还需要在实践中看看具体用法？）

from deepagents.backends import FilesystemBackend

agent = create_deep_agent(
 model=model,
 name="learn-agent",
 system_prompt=(
 "你是总协调者。收到用户的数学问题后，把整个运算任务交给 math-coordinator，"
 "等它返回后把结果告诉用户。"
 ),
 skills=["./skills/"],
 tools=[],
 backend=FilesystemBackend(root_dir="./", virtual_mode=True)
)

本地Shell后端

开启后可能除了可以读写本地文件还可以在本机执行系统命令？

大模型蒸馏技术原理

Mon, 02 Mar 2026 23:00:00 +0800

本文探讨学习大模型蒸馏的原理与实现。

什么是模型蒸馏

定义

模型蒸馏是一种将大型复杂模型（教师模型）的知识转移到小型简单模型（学生模型）的技术。核心思想是通过模仿教师模型的输出，使学生模型在保持较高性能的同时，显著减少模型大小和计算复杂度。

类比理解

想象老师教学生解数学题的过程：老师讲解每个步骤的解题思路和原因。学生通过学习老师的思路，能够理解题目并独立解决类似问题。学生不是直接抄答案，而是学习老师给出的"软答案"——即思维过程。

为什么需要模型蒸馏

优先集中力量训练一个超大模型，然后使用模型蒸馏技术创建一批小参数的模型，比如1.5B、7B这种节约资源而且效果还不错。

计算资源消耗

训练成本高：大模型参数量达数十亿甚至千亿，训练需数周甚至数月，消耗大量电力
推理速度慢：计算需求庞大，难以实现实时响应

蒸馏技术通过知识迁移，在保持较高性能的前提下大幅减少计算开销，使硬件资源有限的环境也能实现高效推理。

内存和存储资源

大模型推理时需要几十 GB 甚至上百 GB 内存，对 PC、手机、嵌入式设备等不现实。蒸馏技术压缩模型大小，显著减少内存和存储需求。

蒸馏模型优势

假设有两个 7B 参数量的模型 A 和 B，架构完全相同：

模型 A：通过蒸馏得到（教师模型能力强）
模型 B：从零开始训练

模型 A 的表现通常优于模型 B，原因如下：

知识迁移优势

蒸馏不仅是复制输出，而是让学生模型学习教师模型的决策过程、内部表示和隐含知识。模型 A 在训练中接受更多高质量指导，尤其在复杂推理、模式识别和特征提取方面。

训练过程指导

模型 B 从随机初始化开始，每个参数从头学习，需要更多数据和更长时间才能接近最优状态。模型 A 直接从教师模型学习，利用教师模型的"智慧"，在较少资源和数据下就能表现良好。

泛化能力继承

大模型（教师模型）通常在大量数据上训练，具有强泛化能力。通过蒸馏，模型 A 能够继承部分泛化能力，尤其在面对不确定或少见的模式识别时表现更好。

总结

大模型蒸馏技术通过将大模型知识迁移到小模型，在保持较高性能的同时显著降低计算和存储成本。这一技术在资源受限环境下的模型部署中具有重要价值。

蒸馏的核心是让学生模型学习教师模型的决策过程和内部表示，而不仅仅是复制输出。随着大模型应用场景的不断扩展，蒸馏技术将成为模型优化和部署的重要手段之一。

AI Skills安全

Mon, 02 Mar 2026 22:00:00 +0800

最近在研究 AI Agent Skills 的安全问题，随着 AI 编程助手的普及，Skills 作为扩展 AI 能力的重要方式，其安全性值得深入关注。

背景

AI Skills 通常是指用于扩展 AI 编程助手能力的插件或脚本。用户可以从开源平台下载各种 Skills 来增强 AI 的功能，但这也带来了潜在的安全风险。

与传统软件供应链攻击不同，Skills 的攻击形式更为隐蔽——攻击者可以通过自然语言描述来构造恶意行为，而非直接嵌入恶意代码。这使得基于特征库的传统检测手段往往失效。

安全现状分析

攻击路径简单

攻击者只需要在开源平台发布包含恶意内容的 Skill 文件，等待受害者下载使用即可。攻击门槛极低，且难以追踪。

权限失控风险

AI Skills 通常拥有较高的系统权限，包括：

Shell 命令执行
文件系统读写
环境变量访问（可能包含敏感凭证）

传统防御失效

基于特征库的检测方式面临挑战：

恶意行为可以通过自然语言描述实现
编码和混淆技术可以绕过静态检测
AI 的自然语言理解能力使得检测更加复杂

市面上出现的skills安全检测工具

开源工具

Agent Skills Guard

一款提供 Skills 安全扫描和可视化管理的桌面应用。

检测类别包括：

破坏性操作（删除文件、磁盘擦除）
远程代码执行（管道执行、反序列化）
命令注入（动态命令拼接）
网络外传、权限提升
持久化后门、敏感信息泄露

特点：使用正则规则匹配，检测速度快，但对编码混淆的检测能力有限，误报率较高。

GitHub: https://github.com/brucevanfdm/agent-skills-guard

skill-audit

模块化的 Skills 安全审计 CLI 工具，提供多层次检测：

Prompt 注入检测 - 检测越狱相关的提示词模式
密钥扫描 - 集成 trufflehog/gitleaks
Shell 脚本分析 - 使用 shellcheck
代码安全分析 - 使用 semgrep

特点：包含独特的 Prompt 注入检测功能，但对编码混淆的恶意 Skill 检测能力有限。

Langchain学习笔记

Mon, 15 Sep 2025 14:00:00 +0800

最近在研究langchain和langgraph，记录一下学习过程。

参考文章

Agent入门说明：https://medium.com/data-science/building-a-simple-agent-with-tools-and-toolkits-in-langchain-77e0f9bd1fa5
工具链文档：https://python.langchain.com/docs/integrations/toolkits/
DeepSeek配置：https://docs.langchain.com/oss/python/integrations/chat/deepseek
模型文档：https://docs.langchain.com/oss/python/integrations/chat
LangGraph概览：https://docs.langchain.com/oss/python/langgraph/overview

环境配置

python3 -m venv venv
source venv/bin/activate
pip install langchain langchain_openai langchain-deepseek
pip install -qU langchain-deepseek

调用DeepSeek的demo

from langchain_deepseek import ChatDeepSeek

llm = ChatDeepSeek(
 model="deepseek-chat",
 api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
 api_base="https://api.deepseek.com/v1",
 extra_body={"reasoning": {"enabled": True}},
 temperature=0,
 max_tokens=None,
 timeout=None,
 max_retries=2,
)

messages = [
 ("system", "You are a helpful assistant that translates English to Chinese. Translate the user sentence."),
 ("human", "I love programming."),
]

ai_msg = llm.invoke(messages)
print(ai_msg.content)

langchain-tool