1. 华科等提出人类跳舞视频生成新框架UniAnimate
来自华中科技大学、阿里巴巴、中国科学技术大学的研究团队提出了 UniAnimate 框架,以实现高效且长时间的人类视频生成,支持合成1分钟高清视频。
2. 5秒完成3D生成,合成数据集已开源
来自上海交大、香港中文大学等团队使用大模型合成的数据,显著提升了3D的生成能力。
他们推出Bootstrap3D框架,结合微调的具备3D感知能力的多模态大模型。这个……继续阅读 »
迷途小书童
6个月前 (06-10) 183浏览 0评论
0个赞
1. 腾讯混元推出AI动图神器Follow-Your-Pose-v2
腾讯混元团队与中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”,只需要输入一张人物图片和一段动作视频,就可以让图片上的人跟随视频上的动作动起来,生成视频长度可达10秒。 与此前推出的模型相比,Follow-Your-Pose-v2可在推理耗时更少的情况下,支持单张图片上多人视频动作生成。模型特有的“深度图指导……继续阅读 »
迷途小书童
6个月前 (06-08) 208浏览 0评论
0个赞
1. 阿里通义千问Qwen2大模型发布并同步开源
阿里通义千问Qwen2大模型今日发布,并在 Hugging Face和 ModelScope上同步开源。Qwen2系列涵盖5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,据称性能超过美国最强的开源模型Llama3-70B;在中英文之外,模型训练数据中增加了27种语言……继续阅读 »
迷途小书童
6个月前 (06-07) 196浏览 0评论
0个赞
智普AI推出全新开源大模型GLM-4-9B
智谱AI日前推出全新开源模型GLM-4-9B,该尺寸模型首次具备多模态能力。据了解,GLM-4-9B,最高支持1M/约两百万字上下文输入,相当于2本《红楼梦》或125篇论文的长度。性能上,GLM-4-9B函数调用能力提升40%,性能比肩GPT-4;同时,该模型使用超过 10T 高质量多语言数据,一共支持26种语言,通用能力相比上一代模型提升40%,已经赶超Llama 3 8……继续阅读 »
迷途小书童
6个月前 (06-06) 160浏览 0评论
0个赞
前言
IC-Light 是 Imposing Consistent Light 的缩写,这个开源项目能够在不改变图片内容的情况下,控制生成图片的光照效果,也就是给图片上色。因此,这个项目可以用在给老照片上色。
IC-Light 发布了两个模型:文本条件(Text-Conditioned)模型和背景条件(Background-Conditioned)模型,这两种模型都将前景图像作为模型输入。
线上体验
我们可以登录站点……继续阅读 »
迷途小书童
6个月前 (06-04) 496浏览 0评论
0个赞
AI 的进化速度实在是太快了,前几天刚体验完 Suno 3.0 版本,效果已经非常惊艳了,可以看这里
AI写歌,太惊艳了
今天登录到网站,发现创作界面又改版了,模型已经出了 3.5版本
从官方的版本发布记录里可以看到,3.5版本主要更新了
可以生成4分钟的歌曲
2分钟的歌曲扩展
创作体验方面的改进
默认使用3.5版本
总体使用上没有多大的区别,可以参考3.0版本的使用方法。
同样的,使用随机歌词和 roman……继续阅读 »
迷途小书童
6个月前 (06-04) 361浏览 0评论
0个赞
什么是提示词
提示词(prompt)是一种与生成性人工智能模型(如 Kimi)进行交互的方式,它通过简单的语言指令来引导模型产生期望的输出。提示词可以是问题、指令或者任何形式的文本输入,旨在激发模型生成特定类型的响应或完成特定的任务。
提示词工程(prompt engineering)则是一门发挥想象力的艺术,它涉及创造性地设计和优化这些提示词,以便从语言模型中获得最佳的输出结果。在提示词工程中,不需要具备编程经验,……继续阅读 »
迷途小书童
6个月前 (06-03) 366浏览 0评论
0个赞
腾讯正式发布了基于混元大模型的面向消费者端的 AI 助手腾讯元宝,目前已经上架各大应用商店。
腾讯元宝提供了 AI 搜索、AI 总结、AI 写作、AI 语音等核心能力,能够一次性解析多个微信公众号链接,支持 pdf、word、txt 等多种格式的文档,以及图片的解析,并支持超长的上下文窗口。
可以随时向它发起对话,模型会给你提供精准的答案
文字输出的同时,也可以进行语音播报,目前系统已经支持了近30个音色,难得……继续阅读 »
迷途小书童
6个月前 (05-30) 300浏览 0评论
0个赞
了解过 Midjourney 等绘画平台的小伙伴应该都知道,我们可以通过向模型输入提示词,来获得想要的图片。本篇,我们反过来,介绍一款免费的由图片来获取对应的提示词工具,这样可以帮助我们更深刻地去理解大模型的绘图原理以及如何来撰写更准确的提示词。
输入网站地址: https://mj.designtt.cc/
找一张测试图片
点击添加图片按钮,上传图片后,点击开始解析,稍等一会,系统给出了4个解析后的提示词,有英……继续阅读 »
迷途小书童
6个月前 (05-29) 518浏览 0评论
0个赞
有没有哪一瞬间,特别希望手机能成为你的私人助手,帮你搜索资料、查找信息?现在,就为你揭秘6款超高效、免费的 AI 应用,让你的手机化身为你的智能小管家!
通达AI助手:通义千问
首发独特 AI 创作功能,火遍全网的猫猫跳舞、科目三视频都出自这里。还支持 AI 聊天、AI 绘画,虽然生成速度有所欠缺,但依然值得期待更新。释放你的创造力,和 AI 一起聊天、画画,动动手指轻松玩转艺术!
资料迷的福音:天工
这是资料和数……继续阅读 »
迷途小书童
6个月前 (05-29) 379浏览 0评论
0个赞
视频看这里
本篇介绍 Gmail 的注册流程
登录谷歌邮箱注册页面
进入注册页面 https://accounts.google.com/signup,并完成相关信息的填写,这里需要注意,用户名就是邮箱地址,姓氏和名字随便填写即可
获取sms虚拟手机号
在填写完基本信息后,接下来就需要进行手机号验证了,而Gmail 的手机号验证只支持境外手机号,因此我们需要在此页面停留,并登录 sms-active 服务页面获取……继续阅读 »
迷途小书童
6个月前 (05-27) 649浏览 0评论
0个赞
前言
深度学习和机器学习应该如何入门呢?这是很多初学者经常提的问题,针对这个问题,相信很多过来人都会推荐吴恩达的在线课程。不过,由于是英文版本,就将很多人挡在了门外。
于是,在国内,以黄海广博士为首的一群机器学习爱好者发起了一个公益性的项目,项目地址是:http://www.ai-start.com/,专门整理吴恩达教授的机器学习课程,包括了字幕的翻译和中文笔记的整理。
目前笔记中已经包括了吴恩达教授的如下几门课程:……继续阅读 »
迷途小书童
6个月前 (05-26) 402浏览 0评论
0个赞
视频看这里
Youtube
Bilibili
简介
Suno 是一个基于 AI 技术的音乐创作平台,对音乐新手来说几乎毫无门槛,它能够处理从前奏到主歌、副歌、桥段直至尾奏的完整结构,旋律层次和乐器搭配均展现出极佳的感觉,将歌曲的氛围和情感表现得淋漓尽致。
实操
访问官方网站 https://suno.com,点击左下方的 Sign Up 进行登录或者注册
目前支持三种方式,分别为 Discord、Google……继续阅读 »
迷途小书童
6个月前 (05-24) 376浏览 0评论
0个赞
OpenAI 近期推出的 ChatGPT 桌面版已经登陆 MacOS 平台,对于 Mac 用户来说,是个大大的好消息。
打开网页版,就会出现推送信息,或者点击头像位置,在下拉菜单中可以看到 Download the macOS APP
安装过程非常简单,用户只需下载安装包并进行双击,即可在 MacOS 14+系统上,且搭载 M 系列芯片的设备上运行。
对于仍在使用 Intel 处理器的用户来说,需要再等待一段时……继续阅读 »
迷途小书童
6个月前 (05-24) 510浏览 0评论
0个赞
视频看这里
Youtube
Bilibili
实操
本篇给大家介绍一款可以快速生成精美 PPT 的 AI 工具,就是这个 Gamma。
我们打开官方网站,https://gamma.app/,使用 gmail 邮箱登录后,点击工作区中的新建按钮
进入这个页面以后,点击生成。如果你已经有了 prompt 指令并且已经复制,可以直接粘贴文本;如果 prompt 指令保存在了文件当中可以直接导入文件。完成后,点击继……继续阅读 »
迷途小书童
6个月前 (05-23) 633浏览 0评论
0个赞
简介
CompreFace 是一个免费开源的人脸识别项目,您不需要具备机器学习技能就能安装设置和使用 CompreFace,官方提供了基于 docker 的部署方法,可以方便地部署在本地或者云端服务器上。
CompreFace 提供了 RESTful API,用于人脸识别、人脸验证、人脸检测、人脸关键点 landmark 检测、mask 检测、头部姿势检测、年龄和性别识别。除此之外,还具有一个角色管理系统,可让您轻松……继续阅读 »
迷途小书童
6个月前 (05-20) 475浏览 0评论
0个赞
视频看这里
Youtube
Bilibili
方法一
第一款,是官方的 ChatGPT,网址 https://openai.com/index/hello-gpt-4o,进入页面后,点击 Try on ChatGPT,进行用户登录,这里推荐使用 google 账号,页面弹出 GPT-4o 简介,我们点击立即试用。你可以问它是否使用 GPT-4o 模型,它的回答既没有肯定也没有否认,不过从更改模型选项中可以看到,……继续阅读 »
迷途小书童
6个月前 (05-19) 1509浏览 0评论
0个赞
视频看这里
Youtube
Bilibili
简介
本篇给大家介绍三种可以免费使用 GPT4 的方法,不需要花一分钱,沒有任何次数限制,就可以享受到 GPT4 专业版的各种强大功能,不仅可以生成图片,总结文档,自动生成配音,快速找到无版权素材等等。
方法一
COZE 是字节跳动开发的 AI 工具开发平台,提供了全功能的 GPT4 模型,而且不限量使用,绝对是免费使用 GPT4 的首选方案,用起来也非常简单,登录……继续阅读 »
迷途小书童
6个月前 (05-17) 702浏览 0评论
0个赞