游刃实验室

游刃实验室

一个外贸人的技术折腾记录。AI · 自动化 · 实用工具。

Paseo:统一 Claude Code、Codex、OpenCode 的 AI 编程代理编排工具
agent

Paseo:统一 Claude Code、Codex、OpenCode 的 AI 编程代理编排工具

什么是 Paseo? Paseo(西班牙语意为"散步")是一个开源的 AI 编程代理编排平台。它的核心理念很简单:让你能从手机、桌面或 CLI 统一管理所有 AI 编程助手,实现真正的"随时随地写代码"。 核心定位:多代理编排 Paseo 不是又一个 AI 编程工具,而是现有工具的编排层。它支持: * Claude Code(Anthropic 的终端 AI 助手) * Codex(OpenAI 的 GPT-4 编程代理) * OpenCode(开源替代方案) 通过统一界面,你可以根据任务类型选择最合适的模型——Claude 做架构设计,Codex 做快速实现,OpenCode 处理本地隐私代码。
3 min read
agent

拒绝“瞎忙”:借鉴 GitHub 14万星项目 Superpowers,打造你的 AI 架构师

### 1. 为什么你的 AI 助手总是“越帮越忙”? 很多人抱怨:我用了最牛的 Claude 或 GPT-4,为什么处理复杂任务时还是觉得词不达意?甚至它偶尔表现得像个“冒失鬼”,还没搞清楚状况就急着去执行。 其实,AI 的上限不在于它多“聪明”,而在于你给它设计的**工作流(Workflow)**。最近 GitHub 上暴涨 14 万星的项目 **Superpowers** 给了我很大的启发:它不是让 AI 直接去做事,而是给 AI 披上了一套“架构师”的思考逻辑。 ### 2. 什么是 Superpowers 模式? Superpowers 把任务分成了三个极度克制的阶段,这套逻辑可以降维打击任何复杂办公场景: * **第一阶段:拒绝盲目执行 (Step Back)** 当你下达指令时,Superpowers 会先停下来问:
2 min read
opencli-rs:Rust 重写的 AI Agent 信息抓取神器,速度快 12x
AI

opencli-rs:Rust 重写的 AI Agent 信息抓取神器,速度快 12x

什么是 opencli-rs? opencli-rs 是原 TypeScript 版 OpenCLI 的 Rust 完整重写,专为 AI Agent 设计的命令行网页信息抓取工具。一条命令,覆盖 55+ 网站、333 个指令,单文件 4.7MB,零运行时依赖。 核心亮点 * 🚀 速度快 12x:bilibili hot 仅需 1.66s(原版 20.1s) * 💾 内存省 10x:仅占 9-15MB(原版 95-99MB) * 📦 4.7MB 单文件:零运行时依赖,无需 Node.js / Python * 🌐 55+
2 min read
我看了这个爆火的 AI 闲鱼监控项目,发现它已经不只是个爬虫
agent

我看了这个爆火的 AI 闲鱼监控项目,发现它已经不只是个爬虫

为什么这个项目值得关注 最近看到 Usagi-org/ai-goofish-monitor,第一反应不是“又一个爬虫”,而是:这已经很接近一个真正可落地的 AI 选品监控工作台 了。 它的目标很明确:不是单纯抓闲鱼页面,而是把“搜索商品 → 抓详情 → 看图 → AI 判断 → 发通知 → 留存记录”这条链路做成一个可持续运行的系统。对于长期蹲低价、淘设备、找二手货源、盯特定关键词的人来说,这类工具的价值非常直接——它不只是帮你省时间,而是在帮你把“刷闲鱼”这件事自动化。 它到底做了什么 从仓库说明来看,这个项目基于 Playwright + AI + Web UI,提供的是一整套多任务监控与分析能力,而不是一个零散脚本。核心能力包括: * 多任务并发监控:每个任务可配置独立关键词、价格区间、筛选条件与 AI Prompt。 * AI 驱动分析:不仅能搜商品,
6 min read
一个把微信多账号接入 OpenClaw 的实战项目:WeClawBot-ex 值不值得看?
agent

一个把微信多账号接入 OpenClaw 的实战项目:WeClawBot-ex 值不值得看?

先说结论 WeClawBot-ex 不是在发明一个新的微信机器人协议层,而是在腾讯官方 @tencent-weixin/openclaw-weixin 插件的基础上,补了一层更适合真实运营的“多账号管理壳”。 如果你本来就在折腾 OpenClaw、微信 ClawBot、或者想把多个微信号接到同一个 AI 网关里,这个项目是值得看的。它解决的不是“能不能连上微信”这种底层问题,而是更现实的事:多个微信号怎么一起登录、怎么管理、怎么隔离、怎么少踩坑。 这个项目是干什么的? 仓库地址:https://github.com/ImGoodBai/WeClawBot-ex 根据 README,这个项目可以理解为: * 一个面向 OpenClaw 的微信多账号管理扩展 * 基于官方 openclaw-weixin 做的产品化 fork * 重点补齐本地 Web 控制台、二维码登录体验、账号可视化管理、诊断信息展示 它最核心的一句话是: 多个微信账号连接到同一个
4 min read
用历史治国智慧编排AI:CivAgent把57种人类政体变成了Multi-Agent框架
agent

用历史治国智慧编排AI:CivAgent把57种人类政体变成了Multi-Agent框架

如果秦始皇活在2026年,他会怎么设计AI团队? 这个听起来像脑洞的问题,有人真的做出来了。 什么是 CivAgent? CivAgent 是一个开源项目,把人类历史上57种经典政体——从夏朝的家族制到美国的三权分立,从雅典直接民主到欧盟超国家治理——全部映射成了 AI 多 Agent 协作的组织架构。 核心理念只有一句话:古代治国的智慧 = 现代管理 AI 团队的最佳实践。 这不是换皮,这是真的类比 举几个例子: * 秦朝三公九卿(丞相统管百官)→ 单 main agent 中央集权调度,快速决策、执行统一 * 唐朝三省六部(中书起草→门下审核→尚书执行)→ 三个 top-level agent 交叉审核链,防止单点错误 * 明朝内阁+司礼监(票拟→批红)→ 双 main agent 交叉审批,权力制衡与效率平衡
3 min read
受够了浏览器的 AI 弹窗和广告?一键还原纯净版 Chrome/Edge
agent

受够了浏览器的 AI 弹窗和广告?一键还原纯净版 Chrome/Edge

天下苦臃肿浏览器久矣 现在的浏览器(Chrome、Edge、Firefox)越来越臃肿,塞满了各种 AI 功能(Copilot 弹窗)、侧边栏、购物推荐、遥测数据收集和广告。原本只是想安安静静搜个东西,结果被各种花里胡哨的功能打扰。 Just the Browser:一键去油解腻神器 Just the Browser 是一个开源项目,它的目的只有一个:干掉所有这些烦人的东西,只给你一个“纯粹的浏览器”。 它的原理是什么?安全吗? 它非常安全,因为它并不是开发了一个套壳浏览器,也不是用黑客手段破解。它利用的是浏览器官方为“企业管理员”准备的隐藏策略配置(Enterprise Policies)。 通过一键执行脚本,强制关闭浏览器里那些乌七八糟的消费者功能。唯一的“副作用”是:你的浏览器设置最上方会显示“由你的组织管理”——这只是因为脚本调用了企业级权限锁死了广告功能,完全正常。 如何使用(一键清理) 使用非常简单,
2 min read
告别失忆 Agent:lossless-claw 让 OpenClaw 永远记住每一句话
agent

告别失忆 Agent:lossless-claw 让 OpenClaw 永远记住每一句话

你有没有遇到过这样的情况:和 AI 聊了很久,突然它忘了之前的对话?这不是 AI 变笨,而是上下文窗口满了,旧消息被强制丢弃。 问题根源 所有 AI Agent 都面临同一个天花板:模型上下文窗口有限。OpenClaw 默认用滑动窗口——超出就截断旧消息,历史永久丢失。 lossless-claw 的解法 lossless-claw 是一个 OpenClaw 插件,用 DAG(有向无环图)替代滑动窗口: * 所有消息永久存入 SQLite,一条都不丢 * 旧消息被 LLM 压缩成摘要节点,层层累积 * 每次对话拼接:高层摘要 + 近期原始消息 还提供三个检索工具:lcm_grep、lcm_describe、lcm_expand,让 Agent 能主动从历史挖出任何细节。
1 min read
不启新浏览器,直接接管当前 Chrome:chrome-cdp-skill 实战笔记
agent

不启新浏览器,直接接管当前 Chrome:chrome-cdp-skill 实战笔记

一句话结论:chrome-cdp-skill 的核心价值是“让 AI 直接操作你当前正在使用的 Chrome 会话”,包括已登录状态、当前标签页上下文,不需要重新登录,也不需要另起一个自动化浏览器。 为什么值得关注: 传统自动化常常启动“干净浏览器”,会遇到登录态丢失、页面状态不连续、多标签切换成本高的问题。chrome-cdp-skill 直接连接你本机 Chrome 的 CDP 调试接口,复用当前工作现场,更适合真实业务流。 核心能力: - list:列出打开的标签页 - shot:截图 - snap:语义快照(可读结构) - html:提取页面 HTML - eval:在页面上下文执行 JS - nav/click/type/loadall:
2 min read
ByteDance 开源了一个 AI Agent 的大脑:OpenViking
agent

ByteDance 开源了一个 AI Agent 的大脑:OpenViking

AI Agent 最大的硬伤一直是记忆问题——每次对话结束,它就忘了一切。ByteDance 刚开源的 OpenViking 想解决这个问题。 它是什么 OpenViking 给 AI Agent 提供一个结构化的文件系统来存记忆: * viking://user/memories/ — 用户记忆 * viking://agent/skills/ — Agent 技能 * viking://resources/ — 知识资源 最聪明的设计:三级压缩 每条记忆有三个层级:L0 一句话摘要(约 100 token)、L1 重要内容(约 2K token)、L2 完整内容(按需加载)。Agent 先看 L0,需要时才深挖。省 token,也省钱。
1 min read
网页里住了个 AI,你说话它就动
GitHub

网页里住了个 AI,你说话它就动

今天刷 GitHub Trending 看到个阿里开源的项目,叫 page-agent。 标题是“用自然语言控制网页”。 我第一反应是,又来。这类项目见过不少,说得天花乱坠,实际跑起来跟玩具差不多。 但这个有点不一样。 它不截图,不需要装 Python,不需要无头浏览器,就一段 JavaScript 扔进网页里。然后你跟它说话,它帮你操作页面。 原理其实不复杂。它把页面上所有能点、能填的东西,转成一段文字描述,发给 AI。AI 看完说“点这个、填那个”,然后它照做。 不需要眼睛,只需要认字。 我想到的第一个用法是我自己的 CRM。现在每次更新客户状态,得点进去,找到那个下拉框,选,保存。一个客户还好,十个就烦了。 如果能直接说“把 Ashleigh 的状态改成跟进中”,它自己去弄—
1 min read
别再点按钮了——我怎么把 5 小时的手工操作压到 2 分钟
AI工具

别再点按钮了——我怎么把 5 小时的手工操作压到 2 分钟

起因很简单:我需要在一个没有 API 的平台上重复操作 30 次。 每次手动点进去、填表、提交,10 分钟一个。30 个就是 5 小时。 我不想干这件事。 ## 第一反应:写个脚本模拟点击 Selenium、Playwright,让脚本代替人去点按钮。 听起来合理,实际上是个坑。 现在的网站大多用 React 或 Vue 之类的框架搭建,它们有自己的一套事件系统。你的脚本发出去的点击,它不认。上传文件的按钮点不动,页面跳转之后元素找不到了,网站一更新 UI 脚本就废了。 我在这条路上浪费了一些时间,然后换了个思路。 ## 真正有用的思路:不管前端,只管请求 不管界面多复杂,用户点了什么按钮,最终都会变成一个 HTTP 请求发给服务器。 那个请求才是真正做事的地方。 所以我改变策略:不模拟人的操作,而是录下操作背后的请求。
3 min read
【零成本】OpenClaw-Zero-Token:白嫖全网大模型的终极神器
AI工具

【零成本】OpenClaw-Zero-Token:白嫖全网大模型的终极神器

## 项目简介 OpenClaw-Zero-Token 是 OpenClaw 的一个增强分支,其核心使命是:**通过浏览器自动化技术捕获会话凭证,彻底消除 API Token 成本,实现主流 AI 平台的免费接入。** ### 核心优势 1. **真正零成本**:免去按量计费的 API 开支,无需绑定信用卡。 2. **全模型覆盖**:支持 ChatGPT、Claude 3.5、Gemini、DeepSeek (R1/Reasoner)、豆包、通义千问、Kimi、智谱 GLM、Grok 甚至 Manus。 3. **原生工具调用 (Tool Calling)**:支持 exec、read_file、browser 等本地工具调用,
1 min read
告别复制粘贴:xiaohongshu-cli 让小红书数据流自动化成为可能
GitHub

告别复制粘贴:xiaohongshu-cli 让小红书数据流自动化成为可能

工具简介 对于做外贸和跨境电商的我们来说,小红书是一个巨大的流量池,但手动抓取数据和监控评论简直是噩梦。最近发现的 xiaohongshu-cli 彻底改变了这种局面。ps作者的其他几个项目也非常优秀。 核心优势 * AI Agent 友好:原生支持 YAML/JSON 输出,方便 AI 直接读取并分析市场趋势。 * 硬核防封控:内置高斯随机延迟和 macOS Chrome 指纹模拟,极大降低了被封号的风险。 * 功能全覆盖:支持关键词搜索、笔记阅读、评论抓取,甚至可以发布图文笔记。 * 无缝认证:自动提取浏览器 Cookie,省去了复杂的抓包过程。 实战场景 你可以利用它每天自动抓取产品关键词下的热门评论,分析客户痛点,甚至自动化发现爆款款式,直接喂给你的 CRM 询盘池。 项目地址 https://github.com/jackwener/xiaohongshu-cli
1 min read
不再手工录入:我的外贸 AI 三段式自动化流程
思考

不再手工录入:我的外贸 AI 三段式自动化流程

最近我把外贸日常流程做成了一个“AI 三段式自动化”系统。核心目标很简单:不再手工录入,不再漏消息,让人只做关键决策。 ① 线索接入(WhatsApp / Alibaba) 客户发来的询盘、样品需求、付款沟通,先统一进入同一个入口: * WhatsApp 消息 * Alibaba 站内消息 系统自动抓取会话,不需要再手动复制粘贴到表格里。 ② AI 结构化处理(去“录入”化) 消息进入后,AI 自动提取并标准化关键信息: * 客户名 * 国家 * 日期 * 意向产品 * 渠道 * 跟进状态 并自动做优先级判断: * VIP * 待付款 * 样品中 * 潜在 同时给出跟进建议,减少“靠记忆管理客户”的风险。 ③ CRM 全量沉淀(可追踪) 最终数据统一沉淀到 CRM 全量库,
2 min read
AI 时代的数据库万能钥匙:Universal DB MCP 深度解析
GitHub

AI 时代的数据库万能钥匙:Universal DB MCP 深度解析

最近我在优化我的“6 Hands”外贸自动化系统时,发现了一个极其强大的开源项目:Universal DB MCP。 它能作为一座桥梁,让 AI 助手直接“读懂”你的数据库结构并执行查询。 为什么强烈推荐? * 全能适配:支持多达 17 种数据库,包括国产达梦、GaussDB 等。 * 极速检索:500 张表的结构检索仅需 500ms,提升 100 倍。 * 多平台通吃:支持 Claude Desktop、Dify、Coze 等 50+ 平台。 * 安全可靠:默认只读模式,支持敏感数据脱敏。 我已经把 alibaba_leads.db 和 wa_chat.db 接入了。
1 min read