全部 AI 模型,开箱即用

浏览我们支持的全部视频、图片、音频与文本模型,快速找到适合你工作流的选择并更快开始创作。

AI 视频模型

HappyHorse logo

HappyHorse

HappyHorse 是 HappyHorse-1.0 的研发团队,该模型在 Artificial Analysis Video Arena 视频生成排行榜上荣登第一。基于 150 亿参数的统一 Transformer 架构,HappyHorse-1.0 能够在单次推理中同步生成音频与视频,无需后期配音。支持文本生视频与图像生视频两种工作流,7 种语言的口型同步,以及 50 多种视觉风格,输出分辨率最高可达 1080p。

OpenAI

OpenAI Sora

OpenAI Sora 是以故事感和高质量动态细节为核心的视频生成模型系列,擅长从文本或图像构建更具叙事性的长镜头与电影化视频内容。

Google

Google Veo

Google Veo 是 Google DeepMind 推出的先进 AI 视频生成模型系列,支持根据文本提示词和图片生成高质量视频,并在电影感控制、提示词理解和场景可定制性方面表现更强。

Kling

Kling AI Video

Kling AI 是一款领先的 AI 视频生成器,支持 text-to-video、image-to-video、视频延展以及电影级多镜头叙事。它以强提示词还原能力和更真实的画面输出著称,并为全球用户提供免费与付费方案。

Grok

Grok Imagine Video

xAI Grok Imagine 是 xAI 的视觉生成产品线,覆盖图像与视频创作流程,强调快速概念迭代、风格探索,以及基于自然语言的持续细化。

ByteDance

ByteDance Seedance

Seedance 2.0 是字节系最新一代电影级视听生成模型。它把更强的语义理解、导演级运镜、真实物理反馈、原生音轨以及多镜头连续性融合在一次生成里,让每条视频都像成片一样完整。

Hailuo

MiniMax Hailuo

MiniMax Hailuo 是以表现力运动、角色动作和电影化构图见长的 AI 视频生成系列,适合创意短片、广告和更具风格化的动态内容。

Luma

Luma AI

Luma AI 是来自 Luma 的视频生成模型系列,擅长平滑运镜、自然光影和更具电影感的画面表现,适合快速制作高质量视觉内容。

Lightricks

Lightricks

LTX-2.3 是 Lightricks 的开源视频模型系列,强调细节清晰度、生成效率、原生音频与从创意到成片的实用工作流。 模型支持图生视频、多关键帧条件控制、关键帧动画、视频前后向扩展、视频到视频转换,以及这些能力的组合使用。

Runway

Runway AI

Runway AI 是 Runway Research 的创意视频平台,整合了 text-to-video、image-to-video、视频改造、角色表演、lip sync 和补帧等能力,适合完整的视频生成与编辑工作流。

Vidu

Vidu AI

Vidu 是一套强调角色一致性、强对比画面和更自然运动表现的 AI 视频生成模型,适合叙事短片、广告和角色驱动内容。

PixVerse

PixVerse AI

PixVerse 是一套偏风格化的视频生成模型,强调夸张视觉效果、快速转场和更强的娱乐化表现,适合短视频和吸睛内容创作。

Qwen

Wan Video

Wan Video 是兼顾质量与速度的视频生成模型系列,强调更好的音画同步、长叙事稳定性和更均衡的整体输出效果。

AI 图片模型

OpenAI

OpenAI GPT-Image

OpenAI GPT-Image 是 OpenAI 的图像生成与编辑产品线,强调更强的指令遵循、高质量图像输出、自然语言图像编辑能力,以及更稳定的图中文字渲染。

Google

Google nano banana

Google Nano Banana AI(也被称为 Gemini 2.5 Flash Image)是来自 Google DeepMind 的先进 AI 图像生成与编辑模型。它擅长细节丰富的图像创作、高一致性的迭代编辑,以及基于自然语言的快速细化,适合原始生成和图像编辑工作流。

Grok

Grok Imagine Image

xAI Grok Imagine 是 xAI 的视觉生成产品线,覆盖图像与视频创作流程,强调快速概念迭代、风格探索,以及基于自然语言的持续细化。

Kling

Kling AI Image

Kling AI 是一款领先的 AI 视频生成器,支持 text-to-video、image-to-video、视频延展以及电影级多镜头叙事。它以强提示词还原能力和更真实的画面输出著称,并为全球用户提供免费与付费方案。

ByteDance

ByteDance Seedream

Seedream 是字节系的图像生成模型系列,强调画面细节、提示词遵循和更好的文字渲染,适合设计、营销和视觉创意场景。

Vidu

Vidu AI Image

Vidu 是一套强调角色一致性、强对比画面和更自然运动表现的 AI 视频生成模型,适合叙事短片、广告和角色驱动内容。

Qwen

Wan Image

Wan Video 是兼顾质量与速度的视频生成模型系列,强调更好的音画同步、长叙事稳定性和更均衡的整体输出效果。

Flux

Flux AI

Flux AI 是 Black Forest Labs 的高质量 AI 图像生成产品线,强调清晰细节、稳定光影和更自然的写实表现,适合从概念图到商业视觉的多种图像工作流。

Ideogram

Ideogram

Ideogram 是面向文本提示词快速出图的 AI 图像生成平台,强调提示词保真度,并在图中文字渲染方面表现突出。

Qwen

Qwen Image

Qwen Image 是通义系的 AI 图像生成模型,强调构图清晰、色彩自然和更稳定的文本到图像理解能力,适合通用图像创作场景。

Z.ai

Z-Image

Z-Image 是 Tongyi-MAI 的图像模型系列,包含生成与编辑等变体,强调高质量输出、良好审美表现,以及可控的提示词驱动创作能力。

AI 音频模型

All AI Models | skills.video