装好Hermes的那天晚上,我挺兴奋的。
终端里敲 hermes,响应出来,感觉跟第一次装好Claude Code一样,有种「行了行了,我进化了」的满足感。然后就开始用。
用了一周之后,我打开账单一看。。。
我直接愣住了。
Token消耗对不上,记不清楚在哪几个项目里烧了多少,Claude Code那边一块,Cursor那边一块,Hermes自己又一块,全是碎的,脑子里完全没有整体感。更难受的是,Hermes明明上次……继续阅读 »
迷途小书童
5天前 96浏览 0评论
0个赞
写了一个脚本,核心逻辑就一句话:让AI读一段需求,自动写代码,自己跑测试,如果挂了就自己改,改完再跑,直到通过为止。然后我就去睡觉了。
对,就是网上最近疯传的那个写法。
“`bash
while :; do cat PROMPT.md | claude-code; done
“`
一个死循环,一行bash。就这么简单。
早上八点醒来,我一打开电脑就傻了。API账单多了九百多块。但它写出来的东西……继续阅读 »
迷途小书童
1周前 (06-14) 111浏览 0评论
0个赞
事情是这样的。我在一台很普通的笔记本上,跑了一个120亿参数的开源模型,Gem)ma 4 12B,Google前不久刚发的。
注意,是在我自己的电脑上,完全离线,网线拔了都能跑的那种。然后我让这个模型写一个C++游戏。
结果你猜怎么着。
它真写出来了。
不只是写出来了,是能编译、能运行、能玩的那种。
它在agentic框架里自己规划方案、自己装依赖库、头文件路径不对就自己找、编译器太老就自己调,卡住了干脆重写整个文件……继续阅读 »
迷途小书童
2周前 (06-10) 135浏览 0评论
0个赞
用 Llama-70B 跑一个 128K token 的长上下文请求,光是 KV Cache 就要占 429 GB 显存。
KV Cache 大小 = 2 × num_layers × num_heads × head_dim × seq_len × dtype_bytes
那么Llama-3.1-70B,FP16,seq_len = 128K token
= 2 × 80 × 8 × 128 × 131072 ×……继续阅读 »
迷途小书童
3周前 (06-01) 246浏览 0评论
1个赞