1. 小米大模型提效新框架
小米大模型团队提出 SUBLLM
(Subsampling-Upsampling-Bypass Large Language Model
),国际AI语音大牛、开源语音识别工具 Kaldi
之父 Daniel Povey
也参与指导。与 Llama
等模型相比,SUBLLM
在训练和推理速度以及降低内存方面都有了显著提升。
在大模型训练中,SUBLLM
的速度提高了26%,每个 GPU
的内存减少了10GB。在推理中,它的速度提高了37%,每个 GPU
的内存减少了1GB。训练和推理速度分别最高可以提高至34%和52%。
2. 微软视觉基础模型开源
微软视觉基础模型 Florence-2
终于开源了,在 HuggingFace
上放出了权重和代码。它能够根据提示,完成字幕、对象检测、分割等各种计算机视觉和语言的任务。
地址:https://huggingface.co/collections/microsoft/florence-6669f44df0d87d9c3bfb76de
在大多数基准中,Florence-2
甚至打败了多数数十亿美元的模型。
高密度环境下的识别能力
OCR
的能力
3. 文生图图生视频工具
提供 AI
视频风格转换、文生图、图生视频、图片动起来等主要功能。
4. AI翻译助手
基于 AI
技术的在线翻译和写作助手,可以帮忙用户快速准确的翻译文本和优化写作,还提供了浏览器插件,使用非常方便。
对 AI
感兴趣的同学,欢迎首页加V进交流群,领取免费 AI
学习资料。