人工智能归档 - 迷途小书童的Note迷途小书童的Note

颠覆视频创作！一键替换3D角色，你还不来试试？

随着AI技术的飞速发展，视频创作创作方式正发生着翻天覆地的变化。今天要介绍的是阿里巴巴推出的黑科技工具——**MotionShop**，它能够一键将视频中的真人替换为3D虚拟角色，为创作者提供了前所未……

09-21 立刻查看

AI证件照，一键搞定！

每到秋季，总是少不了各类考试和报名的繁琐手续，几乎每一个环节都需要你上传一张标准的证件照。今天，我们要介绍一个强大的AI工具——**HivisionIDPhotos**。这个开源的工具不仅能自动生成各……

09-20 立刻查看

Star马上破万，这款AI知识库你一定要看看!

Star马上破万，这款AI知识库你一定要看看还记得《钢铁侠》电影中，托尼•斯塔克的智能助手贾维斯吗？他能回答各种问题，协助处理复杂任务，简直是每个人都梦寐以求的得力助手。如今，这个梦想正在成为现实。……

09-19 立刻查看

超级Prompt!

超级Prompt! 最近，一个名为SuperPrompt的GitHub项目在AI圈引起了轰动。这个项目仅仅只有5个Markdown文件，却一下子收获了4000多个星星。那么，这个神奇的提示词究竟有……

09-19 立刻查看

不懂编程也没关系，Cursor AI帮你轻松写代码！

近年来，编程圈子里涌现了不少新的工具和技术，但Cursor AI绝对是其中的佼佼者。朋友们频频提起，说它大大提升了编程效率，有些人甚至笑称已经离不开它了。今天，我就带大家深入了解这款编程神器，帮助你快……

09-19 立刻查看

推理能力超博士，OpenAI发布最强模型o1

昨天凌晨，OpenAI又给我们带来了一个激动人心的消息，他们发布了一款全新的AI模型o1，该模型在性能上远超以往的GPT系列。告别GPT，开启新纪元 OpenAI选择将新模型命名为”o1……

09-14 立刻查看

U2-Net：图像分割中的背景移除技术

在数字图像处理的世界里，背景移除技术一直是热门话题。无论是在电影制作、广告设计还是医疗影像分析中，这项技术都扮演着至关重要的角色。今天，我们要一起探索一种革命性的技术 — U2-Net，它……

09-14 立刻查看

PyTorch宣布去CUDA，Triton时代来临?

在人工智能快速发展的今天，芯片技术的革新常常能引发整个行业的地震。就在9月4日，AI领域又传来一个重磅消息：PyTorch官方宣布实现了100%基于OpenAI的Triton语言推理的大语言模型。这一……

09-12 立刻查看

打破视频分析瓶颈，InterTrack让人类行为追踪更简单！

随着社交媒体、监控视频和各种流媒体平台的发展，视频内容正在以惊人的速度增长。每个人几乎每天都会接触大量视频，而如何从这些海量视频中提取有用的信息，尤其是精准分析视频中的人类行为，成了科技界的一个难题。……

09-12 立刻查看

手把手AI实战(八)一站式制作AI长视频

一、成果展示二、步骤拆解现在大部分的AI文生视频平台都只提供5秒、10秒等时长，如果要创作一个几分钟的视频，就需要进行多次的分割，然后再进行拼接。考虑到大部分AI平台对角色一致性问题都处理的不够……

09-06 立刻查看

Google免费AI课

大家好，我是小书童。谷歌刚刚发布了免费的人工智能课程，无需任何先决条件和费用。以下是为您整理的课程简介和学习链接，一共9门免费课，一定不能错过。 1、生成式人工智能简介通过简单、短期的课程了解生……

08-29 立刻查看

X发布Grok-2

大家好，我是小书童。本篇跟大家分享几个 AI 资讯。 X发布Grok-2 X 刚刚发布了 Grok-2 的早期预览版，相较于之前的 Grok-1.5 版本，这是一个重要的进步。新模型在对话、编程和……

08-15 立刻查看

地表最强AI软件工程师–Genie

大家好，我是小书童。继 Devin 之后，又一个 AI 软件工程师出圈了。它就是 Genie，号称目前地表最强，用官方的描述就是它能够像人类工程师一样解决现实生活中的软件问题。 Genie ……

08-14 立刻查看

开源大模型套壳方案GeekAI

大家好，我是小书童。本篇给大家介绍一个开源的全套 AI 助手解决方案，GeekAI，它基于 AI 大语言模型 API 实现，自带运营管理后台，开箱即用。集成了 OpenAI，Azure， ChatG……

08-13 立刻查看

一款高质量TTS开源库

大家好，我是小书童。本篇给大家介绍一款开源的高质量 TTS (Text To Speech) 模型的推理和训练库，parler-tts。 parler-tts 是一种轻量级文本转语音 (TTS) 模……

08-13 立刻查看

适用于验证码的开源OCR

环境 windows 11 python 3.9 前言 Muggle OCR 是一个高效本地 OCR 模块，旨在通过简单的几步设置提供强大的文本识别功能，无论是在处理印刷文本还是解析验证码，都能让……

08-07 立刻查看

Midjourney发布V6.1版本

今天，Midjourney发布了V6.1版本，标志着图像创造领域的一次重大飞跃！本次更新显著增强了图像质量，重新定义了创意视觉的标准。目前V6.1已经成为了默认模型，部分V6.1未能实现的功能，如修补……

07-31 立刻查看

手把手AI实战(七)制作搞笑动画视频

成果展示步骤拆解本篇实战使用的 AI 工具是 Adobe express，网站地址是：https://new.express.adobe.com，登录之后，点击 Video，然后点击 An……

07-15 立刻查看