大家好,我是小书童。
今天给大家分享一款开源的文生视频的 AI 工具,叫 MoneyPrinterTurbo,印钞机加速器,就问你牛不牛逼?
MoneyPrinterTurbo 已经在 GitHub 斩获了超过13k的星星,可见它的受欢迎程度。你只需要提供一个视频的主题或者关键词,有关的剧本、素材、字幕和背景音乐就能够自动生成,高清短视频生成只在一瞬间!无论您是营销人员、创作者还是个人用户,它都能帮你大大减轻创作负担……继续阅读 »
迷途小书童
9个月前 (06-12) 574浏览 0评论
1个赞
成果展示
步骤拆解
生成绘图的提示词
这里以曹操的《观沧海》为例
东临碣石,以观沧海。
水何澹澹,山岛竦峙。
树木丛生,百草丰茂。
秋风萧瑟,洪波涌起。
日月之行,若出其中;
星汉灿烂,若出其里。
幸甚至哉,歌以咏志。
这里,我们将根据这七句诗词,画出七幅画。这个艰巨的任务就交给大模型吧,使用国产的 Kimi,地址:https://kimi.moonshot.cn/
我给的提示词是
我想将曹操的《观沧海》这……继续阅读 »
迷途小书童
9个月前 (06-12) 505浏览 0评论
0个赞
成果展示
详细步骤拆解
AI出图
可以使用你顺手的 AI 绘图工具,国外的像 Midjouney、Stable Diffusion,国内的像扣子、智普清言等等。我这里用了剪映的,地址是:https://jimeng.jianying.com/ai-tool
平台免费用户每天有60个积分,画一次消耗一个积分,正常来讲够用了,不够的话,可以开会员。
左侧就写上提示词,比如我这里是
一个小女孩斜躺在客厅地板上看电视,……继续阅读 »
迷途小书童
9个月前 (06-12) 681浏览 0评论
1个赞
前言
之所以要越狱 ChatGPT,是为了让它提供由于 OpenAI 的内部限制而无法提供的响应。这些指令通常会阻止 ChatGPT 使用脏话或提供可能被视为歧视性的答案,本质上是作为人工智能遵循的道德指南。
越狱步骤
首先,打开 ChatGPT 官网 https://chatgpt.com
清除网站缓存,点击网址旁边的按钮,点击 Cookie 和网站数据
然后,点击管理设备端网站数据
点击各个网址后边的清除……继续阅读 »
迷途小书童
9个月前 (06-12) 945浏览 0评论
0个赞
1. 苹果重新定义AI
通过端侧+云端的方式实现全场景人工智能。
WWDC2024上,苹果将自有的AI能力命名为Apple Intelligence,它能基于苹果内置的大语言模型,通过理解自然语言来执行用户的语音或文字指令。
苹果让AI能力几乎覆盖了所有重要的原生应用,包括相机、照片、备忘录、语音备忘录、提醒事项、邮件、Safari、Keynote等等。除此以外,苹果还推出了两款全新应用,分别是书写工具Writing……继续阅读 »
迷途小书童
9个月前 (06-11) 258浏览 0评论
0个赞
1. 华科等提出人类跳舞视频生成新框架UniAnimate
来自华中科技大学、阿里巴巴、中国科学技术大学的研究团队提出了 UniAnimate 框架,以实现高效且长时间的人类视频生成,支持合成1分钟高清视频。
2. 5秒完成3D生成,合成数据集已开源
来自上海交大、香港中文大学等团队使用大模型合成的数据,显著提升了3D的生成能力。
他们推出Bootstrap3D框架,结合微调的具备3D感知能力的多模态大模型。这个……继续阅读 »
迷途小书童
9个月前 (06-10) 300浏览 0评论
0个赞
1. 腾讯混元推出AI动图神器Follow-Your-Pose-v2
腾讯混元团队与中山大学、香港科技大学联合推出全新图生视频模型“Follow-Your-Pose-v2”,只需要输入一张人物图片和一段动作视频,就可以让图片上的人跟随视频上的动作动起来,生成视频长度可达10秒。 与此前推出的模型相比,Follow-Your-Pose-v2可在推理耗时更少的情况下,支持单张图片上多人视频动作生成。模型特有的“深度图指导……继续阅读 »
迷途小书童
9个月前 (06-08) 271浏览 0评论
0个赞
1. 阿里通义千问Qwen2大模型发布并同步开源
阿里通义千问Qwen2大模型今日发布,并在 Hugging Face和 ModelScope上同步开源。Qwen2系列涵盖5个尺寸的预训练和指令微调模型,其中包括Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B和Qwen2-72B,据称性能超过美国最强的开源模型Llama3-70B;在中英文之外,模型训练数据中增加了27种语言……继续阅读 »
迷途小书童
9个月前 (06-07) 267浏览 0评论
0个赞
智普AI推出全新开源大模型GLM-4-9B
智谱AI日前推出全新开源模型GLM-4-9B,该尺寸模型首次具备多模态能力。据了解,GLM-4-9B,最高支持1M/约两百万字上下文输入,相当于2本《红楼梦》或125篇论文的长度。性能上,GLM-4-9B函数调用能力提升40%,性能比肩GPT-4;同时,该模型使用超过 10T 高质量多语言数据,一共支持26种语言,通用能力相比上一代模型提升40%,已经赶超Llama 3 8……继续阅读 »
迷途小书童
9个月前 (06-06) 238浏览 0评论
0个赞
前言
IC-Light 是 Imposing Consistent Light 的缩写,这个开源项目能够在不改变图片内容的情况下,控制生成图片的光照效果,也就是给图片上色。因此,这个项目可以用在给老照片上色。
IC-Light 发布了两个模型:文本条件(Text-Conditioned)模型和背景条件(Background-Conditioned)模型,这两种模型都将前景图像作为模型输入。
线上体验
我们可以登录站点……继续阅读 »
迷途小书童
9个月前 (06-04) 768浏览 0评论
0个赞
AI 的进化速度实在是太快了,前几天刚体验完 Suno 3.0 版本,效果已经非常惊艳了,可以看这里
AI写歌,太惊艳了
今天登录到网站,发现创作界面又改版了,模型已经出了 3.5版本
从官方的版本发布记录里可以看到,3.5版本主要更新了
可以生成4分钟的歌曲
2分钟的歌曲扩展
创作体验方面的改进
默认使用3.5版本
总体使用上没有多大的区别,可以参考3.0版本的使用方法。
同样的,使用随机歌词和 roman……继续阅读 »
迷途小书童
9个月前 (06-04) 511浏览 0评论
0个赞
什么是提示词
提示词(prompt)是一种与生成性人工智能模型(如 Kimi)进行交互的方式,它通过简单的语言指令来引导模型产生期望的输出。提示词可以是问题、指令或者任何形式的文本输入,旨在激发模型生成特定类型的响应或完成特定的任务。
提示词工程(prompt engineering)则是一门发挥想象力的艺术,它涉及创造性地设计和优化这些提示词,以便从语言模型中获得最佳的输出结果。在提示词工程中,不需要具备编程经验,……继续阅读 »
迷途小书童
9个月前 (06-03) 550浏览 0评论
0个赞