来自 @inferact 的 @BugenZhao 在 PyTorch 新加坡会议上介绍了这项工作。
LLM 推理这块,GPU 算力一直在高速迭代,但有意思的事来了——硬件越强,Python 前端反而越不够用了。
原因很简单:当 KV 缓存基本全命中的时候,GPU 跑完一次推理快得出奇,但 Python 那头处理请求、解析参数、做 Token 预处理,反而成了整条链路最慢的地方。CPU 先跑满了,GPU 在等。
v……继续阅读 »
迷途小书童
2天前 84浏览 0评论
0个赞
“端侧 AI 是未来。”
这句话你可能听了不下一百遍了。发布会上,每家芯片厂商都在讲”端侧大模型”、”离线推理”、”隐私计算”,PPT 做得比电影海报还好看。
但你知道真正把大模型塞进一颗手机芯片/边缘AI芯片里跑起来,是什么体验吗?
就两个字:渡劫。
近两年,我一直在端侧 AI 这条路上摸爬滚打,模型格式转换、模型量化……继续阅读 »
迷途小书童
6天前 161浏览 0评论
0个赞
用 AI 写前端,你有没有遇到过这种情况——
代码跑起来没问题,功能都有,但打开一看,总感觉哪里不对劲。间距挤、排版乱、视觉层次平、配色说不上哪里丑但就是丑……
和真正有设计感的界面放在一起,差距一眼就出来了。
问题出在哪?
不是 AI 的代码写得烂,是它根本不懂设计。
设计师靠的是多年积累的「直觉」——哪里该留白,间距给多少,字号怎么拉开层次,这些东西他们不用想,看一眼就知道怎么处理。
但 AI 没有这套直觉。……继续阅读 »
迷途小书童
4周前 (05-07) 315浏览 0评论
0个赞
传统AI知识库只能查文字,VimRAG让AI学会了”图文视频一起看”。
先讲一个真实场景
假设你是一家制造企业的工程师,公司知识库里有:
10万份含图表的PDF技术文档
5万张CAD设计图纸和产线照片
上千条时长30到60分钟的操作培训视频
现在你问AI一个问题:
“去年Q3产品的设计变化了哪些方面?会议录像里是怎么讨论这个设计的?”
要回答这个问题,……继续阅读 »
迷途小书童
1个月前 (05-03) 280浏览 0评论
0个赞