智普AI推出全新开源大模型GLM-4-9B
智谱AI日前推出全新开源模型GLM-4-9B,该尺寸模型首次具备多模态能力。据了解,GLM-4-9B,最高支持1M/约两百万字上下文输入,相当于2本《红楼梦》或125篇论文的长度。性能上,GLM-4-9B函数调用能力提升40%,性能比肩GPT-4;同时,该模型使用超过 10T 高质量多语言数据,一共支持26种语言,通用能力相比上一代模型提升40%,已经赶超Llama 3 8b。
Pika完成B轮融资
Pika即将完成B轮融资,此轮融资后,公司估值可能达到7亿美元。
天大、南大发布LPSNet
天津大学与南京大学联合团队在CVPR 2024上发表了LPSNet项目,提出了一种端到端的无透镜成像下的3D人体姿态和形状估计框架,通过多尺度无透镜特征解码器和双头辅助监督机制,直接从编码后的无透镜成像数据中提取特征并提高姿态估计的准确度。
CLIP当RNN使用
循环调用CLIP,无需额外训练就有效分割无数概念,包括电影动漫人物,地标,品牌,和普通类别在内的任意短语。由牛津大学与谷歌研究院联合团队提出,已入选CVPR 2024。