最新发布第2页

迷途小书童的Note-- 编程、技术、分享

PyTorch宣布去CUDA，Triton时代来临?

在人工智能快速发展的今天，芯片技术的革新常常能引发整个行业的地震。就在9月4日，AI领域又传来一个重磅消息：PyTorch官方宣布实现了100%基于OpenAI的Triton语言推理的大语言模型。这一消息犹如一颗重磅炸弹，在AI圈内掀起了巨大波澜。那么，这到底意味着什么？是否预示着AI芯片领域即将迎来一场革命？ Triton是什么？首先，我们需要了解什么是Triton。简单来说，Triton是一种由OpenAI开发……继续阅读 »

迷途小书童 2年前 (2024-09-12) 2571浏览 0评论 0个赞

算法

打破视频分析瓶颈，InterTrack让人类行为追踪更简单！

随着社交媒体、监控视频和各种流媒体平台的发展，视频内容正在以惊人的速度增长。每个人几乎每天都会接触大量视频，而如何从这些海量视频中提取有用的信息，尤其是精准分析视频中的人类行为，成了科技界的一个难题。过去，分析人类行为的技术常常依赖复杂的模板和单张图片进行逐帧分析，既麻烦又不太可靠。那么，有没有一种更简单、更智能的解决方案呢？德国图宾根大学的研究团队给出了答案——InterTrack。传统方法的局限早期的视频分……继续阅读 »

迷途小书童 2年前 (2024-09-12) 2497浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(八)一站式制作AI长视频

一、成果展示二、步骤拆解现在大部分的AI文生视频平台都只提供5秒、10秒等时长，如果要创作一个几分钟的视频，就需要进行多次的分割，然后再进行拼接。考虑到大部分AI平台对角色一致性问题都处理的不够理想，制作成本还是非常高的。今天要介绍的是白日梦AI，它是一款国产AI工具，整合了文生图、图生视频、剪辑配音等AI视频制作步骤，形成了自己的一套工作流，支持手机版和网页版，支持长达3000字的故事文案，可以一次生成几分……继续阅读 »

迷途小书童 2年前 (2024-09-06) 5647浏览 0评论 0个赞

IT技巧

几款Twitter(X)在线免费视频下载工具

大家好，我是小书童！在我们使用 Twitter(X) 的时候，有时看到一些觉得非常不错的视频，就希望下载保存。不过，这个时候 Twitter(X) 网页版是不提供这样的服务的。我们可以借助以下几款在线免费下载工具来下载 Twitter 视频。大家如果有需要可以使用。以下工具使用方法是一样的。把 Twitter 的视频链接通过右击复制出来，然后放在视频下载的输入框中，点击下载按钮，然后选择你需要的尺寸，打开视频后，……继续阅读 »

迷途小书童 2年前 (2024-08-30) 4507浏览 0评论 0个赞

AI资讯

Google免费AI课

大家好，我是小书童。谷歌刚刚发布了免费的人工智能课程，无需任何先决条件和费用。以下是为您整理的课程简介和学习链接，一共9门免费课，一定不能错过。 1、生成式人工智能简介通过简单、短期的课程了解生成式人工智能，了解如何使用 Google Tools 制作您自己的 AI 应用。只需45分钟即可完成这一切！课程链接: https://www.cloudskillsboost.google/course_templ……继续阅读 »

迷途小书童 2年前 (2024-08-29) 2142浏览 0评论 0个赞

付费专栏

PyAutoGUI实战专栏

什么是PyAutoGUI？在这个信息爆炸的时代，效率成为了每个开发者追求的核心目标。而 Python 作为一种高效且灵活的编程语言，已经被广泛应用于各个领域。而在 Python 众多的库中，PyAutoGUI 无疑是提升工作效率的得力助手。它是一款功能强大的自动化工具库，专为那些希望通过自动化来减少重复性工作、提高生产力的人设计。无论是鼠标控制，键盘模拟还是图像识别，PyAutoGUI 都能帮你轻松实现这些操作。 ……继续阅读 »

迷途小书童 2年前 (2024-08-27) 2199浏览 0评论 0个赞

AI资讯

X发布Grok-2

大家好，我是小书童。本篇跟大家分享几个 AI 资讯。 X发布Grok-2 X 刚刚发布了 Grok-2 的早期预览版，相较于之前的 Grok-1.5 版本，这是一个重要的进步。新模型在对话、编程和推理等关键领域都有所改进。与此同时，他们还推出了 Grok-2 mini，这是 Grok-2 的一个小型但功能强大的兄弟版本，现在已经在 X 上线。您现在可以使用新的 Grok 模型生成图像。 https://x.co……继续阅读 »

迷途小书童 2年前 (2024-08-15) 1821浏览 0评论 1个赞

AIGC

地表最强AI软件工程师–Genie

大家好，我是小书童。继 Devin 之后，又一个 AI 软件工程师出圈了。它就是 Genie，号称目前地表最强，用官方的描述就是它能够像人类工程师一样解决现实生活中的软件问题。 Genie 是迄今为止世界上最好的人工智能软件工程师。在行业标准基准 SWE-Bench 上得分为 30%，比之前亚马逊 Q 和 Factory 的 Code Droid（两者在 SWE-Bench 上得分均为 19%）的 SOTA……继续阅读 »

迷途小书童 2年前 (2024-08-14) 1669浏览 0评论 1个赞

AIGC

开源大模型套壳方案GeekAI

大家好，我是小书童。本篇给大家介绍一个开源的全套 AI 助手解决方案，GeekAI，它基于 AI 大语言模型 API 实现，自带运营管理后台，开箱即用。集成了 OpenAI，Azure， ChatGLM，讯飞星火，文心一言等多个平台的大语言模型，同时还集成了 MidJourney 和 Stable Diffusion 绘画功能，SUNO音乐创作，功能非常强大。主要特性完整的开源系统，前端应用和后台管理系统皆……继续阅读 »

迷途小书童 2年前 (2024-08-13) 2363浏览 0评论 0个赞

算法

一款高质量TTS开源库

大家好，我是小书童。本篇给大家介绍一款开源的高质量 TTS (Text To Speech) 模型的推理和训练库，parler-tts。 parler-tts 是一种轻量级文本转语音 (TTS) 模型，它可以按照给定说话者的风格（性别、音调、说话风格等）生成高质量、听起来自然的语音。它是 Stability AI 和爱丁堡大学的 Dan Lyth 和 Simon King 论文 Natural language g……继续阅读 »

迷途小书童 2年前 (2024-08-13) 2098浏览 0评论 0个赞

OCR

适用于验证码的开源OCR

环境 windows 11 python 3.9 前言 Muggle OCR 是一个高效本地 OCR 模块，旨在通过简单的几步设置提供强大的文本识别功能，无论是在处理印刷文本还是解析验证码，都能让用户在工作中畅通无阻。Muggle OCR 易于安装和使用，支持双模型，识别快速准确。实操首先下载源码 # 克隆代买 git clone https://github.com/litongjava/muggle_oc……继续阅读 »

迷途小书童 2年前 (2024-08-07) 1762浏览 0评论 0个赞

IT技巧

免费Amazon亚马逊云服务器申请与使用教程

Amazon亚马逊云科技提供的免费VPS主机已经有好多年了，今天来为大家详细讲解一下新的亚马逊云科技云服务器申请与使用教程。Amazon亚马逊云科技目前提供的服务非常地多。主要有云服务器（ec2）、云存储（S3）、CDN相关产品、lightsail VPS、SES (群发邮件)等，其中Amazon lightsail是类似于VPS主机的产品，云服务器（ec2）则是云服务器，可以对内存、流量、CPU、带宽等自由定制……继续阅读 »

迷途小书童 2年前 (2024-08-07) 1369浏览 0评论 0个赞

AI资讯

Midjourney发布V6.1版本

今天，Midjourney发布了V6.1版本，标志着图像创造领域的一次重大飞跃！本次更新显著增强了图像质量，重新定义了创意视觉的标准。目前V6.1已经成为了默认模型，部分V6.1未能实现的功能，如修补/扩展，需要用户手动切换回V6.0版本，使用参数 -v 6即可。 V6.1版本的亮点如下：无缝连接的图像构造：无论是人体的细微部分、自然界的动植物，新版都能确保图像间的平滑过渡，告别突兀的断层感，每一寸都宛如精心雕……继续阅读 »

迷途小书童 2年前 (2024-07-31) 1237浏览 0评论 0个赞

IT技巧

5款抠图工具

视频看这里工具对应链接 https://www.remove.bg/ https://cleanupphotos.com/ https://www.photoroom.com/ BG Remover：https://pan.quark.cn/s/037b542e0f2d 鲜艺AI抠图：https://pan.quark.cn/s/98fe35a7f056 ……继续阅读 »

迷途小书童 2年前 (2024-07-30) 3003浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(七)制作搞笑动画视频

成果展示步骤拆解本篇实战使用的 AI 工具是 Adobe express，网站地址是：https://new.express.adobe.com，登录之后，点击 Video，然后点击 Animate from audio，进入编辑界面 Character 选择自己想要的形象，可以是人物、动物、动画等，这里就选个 Sticky Background 选项卡提供了很多的背景，我们选个窗户的背景 Size ……继续阅读 »

迷途小书童 2年前 (2024-07-15) 1479浏览 0评论 0个赞

IT技巧

Android手机投屏

视频看这里软件下载项目地址：https://github.com/Genymobile/scrcpy 压缩包下载链接：https://pan.quark.cn/s/4bfe1d47b6ad ……继续阅读 »

迷途小书童 2年前 (2024-07-15) 2924浏览 0评论 0个赞

AI+自媒体实战

手把手AI实战(六)老照片动起来

成果展示步骤拆解老照片动起来其实就是利用 AI 大模型的图生视频功能，这个项目用到的工具是快手的可灵大模型，它有 web 版本和手机 App，这里使用手机 App 来操作。到应用商店下载快影 App。打开快影后，点开 AI 创作然后点开 AI 生视频接着选择第2项的图生视频我们选择一张手机图片进行上传，这里从网络上找了一张老照片下方的提示栏，是我们需要输入的提示词，这个你可以不输。如果说有特殊……继续阅读 »

迷途小书童 2年前 (2024-07-11) 1367浏览 0评论 0个赞

迷途小书童的Note — 编程、技术、分享

最新发布第2页

PyTorch宣布去CUDA，Triton时代来临?

打破视频分析瓶颈，InterTrack让人类行为追踪更简单！

手把手AI实战(八)一站式制作AI长视频

推荐10门MIT线上课程

几款Twitter(X)在线免费视频下载工具

Google免费AI课

PyAutoGUI实战专栏

X发布Grok-2

地表最强AI软件工程师–Genie

开源大模型套壳方案GeekAI

一款高质量TTS开源库

适用于验证码的开源OCR

免费Amazon亚马逊云服务器申请与使用教程

Midjourney发布V6.1版本

5款抠图工具

手把手AI实战(七)制作搞笑动画视频

Android手机投屏

手把手AI实战(六)老照片动起来