2026年06月的内容

微软开源了一个帮 Agent 打磨技能的工具，思路很野

这个工具叫 SkillOpt，它把写 skill.md 这件事变成了一种训练过程。前向传播、反向传播、学习率、验证集，深度学习里那套东西它全用上了。目的只有一个，让 Agent 真的能把你写的技能文档用起来，而不是每次都靠运气。事情是这样的。前阵子我在写一个 skill，教 Agent 怎么帮我整理每天的技术笔记。写了大概两千字，把自己能想到的场景全塞进去了。然后扔给 Agent 跑，结果一言难尽。有……继续阅读 »

迷途小书童 1个月前 (06-29) 330浏览 0评论 0个赞

IT技巧

X上如何下载视频？

三个方案，覆盖所有场景。偶尔下一个视频，用在线工具。常下大量视频，用桌面工具。不想花钱且愿意折腾，用命令行。在线工具，推荐 SaveTWT。桌面工具，推荐 SurFast Video Downloader。命令行，推荐 yt-dlp。不想看过程的话，这三行就够了。想知道具体怎么用，往下看。先说在线工具。不用装任何东西，手机电脑都能用。第一个是 SaveTWT，savetwt.com。贴推文链接进去，解析几秒钟……继续阅读 »

迷途小书童 1个月前 (06-28) 676浏览 0评论 0个赞

人工智能

装完Hermes之后，我被这5个东西救了

装好Hermes的那天晚上，我挺兴奋的。终端里敲 hermes，响应出来，感觉跟第一次装好Claude Code一样，有种「行了行了，我进化了」的满足感。然后就开始用。用了一周之后，我打开账单一看。。。我直接愣住了。 Token消耗对不上，记不清楚在哪几个项目里烧了多少，Claude Code那边一块，Cursor那边一块，Hermes自己又一块，全是碎的，脑子里完全没有整体感。更难受的是，Hermes明明上次……继续阅读 »

迷途小书童 2个月前 (06-16) 427浏览 0评论 0个赞

人工智能

从此写代码，只需要在旁边看着

写了一个脚本，核心逻辑就一句话：让AI读一段需求，自动写代码，自己跑测试，如果挂了就自己改，改完再跑，直到通过为止。然后我就去睡觉了。对，就是网上最近疯传的那个写法。 “`bash while :; do cat PROMPT.md | claude-code; done “` 一个死循环，一行bash。就这么简单。早上八点醒来，我一打开电脑就傻了。API账单多了九百多块。但它写出来的东西……继续阅读 »

迷途小书童 2个月前 (06-14) 397浏览 0评论 0个赞

人工智能

小模型大野心

事情是这样的。我在一台很普通的笔记本上，跑了一个120亿参数的开源模型，Gem)ma 4 12B，Google前不久刚发的。注意，是在我自己的电脑上，完全离线，网线拔了都能跑的那种。然后我让这个模型写一个C++游戏。结果你猜怎么着。它真写出来了。不只是写出来了，是能编译、能运行、能玩的那种。它在agentic框架里自己规划方案、自己装依赖库、头文件路径不对就自己找、编译器太老就自己调，卡住了干脆重写整个文件……继续阅读 »

迷途小书童 2个月前 (06-10) 452浏览 0评论 0个赞

人工智能

跑大模型，最贵的不是 GPU，是这个东西

用 Llama-70B 跑一个 128K token 的长上下文请求，光是 KV Cache 就要占 429 GB 显存。 KV Cache 大小 = 2 × num_layers × num_heads × head_dim × seq_len × dtype_bytes 那么Llama-3.1-70B，FP16，seq_len = 128K token = 2 × 80 × 8 × 128 × 131072 ×……继续阅读 »

迷途小书童 2个月前 (06-01) 489浏览 0评论 1个赞