新用户福利

调用即送300万全模型免费额度资源包！！

支持全系列大语言模型调用按比例抵扣，免费额度有限，先到先得！

AI 大模型广场

AI 大模型广场汇聚了全球主流 AI 模型，致力于为开发者提供高效、便捷的 AI 能力接入服务。

获取 API Key 查看调用文档

DeepSeek-V4-Flash

热门上新

工具调用

高 TPS

DeepSeek V4 Flash 是 DeepSeek 推出的一款经过效率优化的混合专家（Mixture-of-Experts）模型，总参数量达 2840 亿，每次前向传播激活 130 亿参数，支持长达 100 万 token 的上下文窗口。该模型专为快速推理和高吞吐量工作负载设计，同时保持了强大的推理和编程能力。模型采用混合注意力机制以实现高效的长上下文处理，并支持可配置的推理模式。它非常适用于对响应速度和成本效益要求较高的应用场景，如编程助手、聊天系统和智能体工作流。

输入0.001 元 / K

输出0.002 元 / K

DeepSeek-V4-Pro

热门上新

工具调用

深度思考

DeepSeek V4 Pro 是 DeepSeek 推出的大规模混合专家（Mixture-of-Experts）模型，总参数量达 1.6 万亿，每次前向传播激活 490 亿参数，支持长达 100 万 token 的上下文窗口。该模型专为高级推理、编程和长程智能体工作流设计，在知识、数学和软件工程基准测试中均表现出色。它基于与 DeepSeek V4 Flash 相同的架构，引入了混合注意力系统以实现高效的长上下文处理，并支持多种推理模式，可根据任务需求在速度和深度之间取得平衡。它非常适用于全代码库分析、多步骤自动化和大规模信息综合等复杂工作负载，这些场景对能力和效率都有极高要求。

输入0.012 元 / K

输出0.024 元 / K

Moonshotai/Kimi-K2.5

上新

工具调用

图像理解

Kimi K2.5 是 Kimi 迄今最智能的模型，在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是 Kimi 迄今最全能的模型，原生的多模态架构设计，同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。

输入0.004 元 / K

输出0.021 元 / K

Minimax/Minimax-M2.5

上新

工具调用

深度思考

Minimax M2.5专为Agent场景原生设计，编程与智能体性能（Coding & Agentic）直接对标Claude Opus 4.6，尤其在Excel高阶处理、PPT生成和深度调研等Office生产力场景达到行业领先水平（SOTA）。

输入0.0021 元 / K

输出0.0084 元 / K

Z-AI/GLM 5

上新

工具调用

深度思考

GLM-5 是智谱新一代的旗舰基座模型，面向 Agentic Engineering 打造，能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。在 Coding 与 Agent 能力上，GLM-5 取得开源 SOTA 表现，在真实编程场景的使用体感逼近 Claude Opus 4.5，擅长复杂系统工程与长程 Agent 任务，是通用 Agent 助手的理想基座。

输入0.004 元 / K

输出0.018 元 / K

Minimax/Minimax-M2.1

热门

AI 编程

工具调用

MiniMax-M2.1是一款轻量级、前沿的大语言模型，针对编码、代理工作流程和现代应用开发进行了优化。仅激活了100亿个参数，它实现了在现实世界能力上的重大飞跃，同时保持了卓越的延迟、可扩展性和成本效率。与前辈相比，M2.1提供了更干净、更简洁的输出和更快的感知响应时间。它在主要系统和应用语言中表现出领先的跨语言编码性能，在Multi-SWE-Bench上达到49.4%，在SWE-Bench Multilingual上达到72.5%，并作为IDE、编码工具和通用辅助的通用“大脑”使用。为了避免降低该模型的表现，MiniMax强烈建议在回合之间保留推理。在我们的文档中了解更多关于使用reasoning_details传递推理的信息。

输入0.0021 元 / K

输出0.0084 元 / K

Kimi K2 Thinking

热门

工具调用

AI 编程

Kimi K2 Thinking 是 Moonshot AI 迄今为止最先进的开源推理模型，它将 K2 系列扩展到了智能体层面，实现了长时域推理。该模型基于 Kimi K2 中引入的万亿参数混合专家 (MoE) 架构构建，每次前向传播激活 320 亿个参数，并支持 256 个 k-token 上下文窗口。该模型针对持续的逐步思考、动态工具调用以及跨越数百轮的复杂推理工作流进行了优化。它将逐步推理与工具使用交错进行，从而能够实现自主研究、编码和写作，并能持续数百次连续操作而不会出现偏差。它在 HLE、BrowseComp、SWE-Multilingual 和 LiveCodeBench 等开源基准测试中创造了新的纪录，同时在 200-300 次工具调用中保持了稳定的多智能体行为。基于采用 MuonClip 优化的大规模 MoE 架构，它兼具强大的推理深度和高推理效率，能够胜任高要求的智能体和分析任务。

输入0.004 元 / K

输出0.016 元 / K

Meituan/Longcat-Flash-Lite

上新限时免费

工具调用

LongCat-Flash-Lite 模型采用高效 MoE 架构（总参数 685亿，激活参数约 30亿），通过 N-gram 嵌入表实现参数的高效利用，并针对推理效率与特定场景深度优化。

免费

Baidu Search API

支持多种搜索类型和过滤条件，返回结构化的搜索结果，适用于智能问答、内容聚合、信息检索等多种应用场景

次数0.036 元 / 次

Qwen3 Max

工具调用

通义千问3系列Max模型，相较preview版本在智能体编程与工具调用方向进行了专项升级。本次发布的正式版模型达到领域SOTA水平，适配场景更加复杂的智能体需求。

输入0.006 元 / K

输出0.024 元 / K

Z-Ai/GLM 4.7

热门上新

工具调用

AI 编程

GLM-4.7 是智谱最新旗舰模型，GLM-4.7 面向 Agentic Coding 场景强化了编码能力、长程任务规划与工具协同，并在多个公开基准的当期榜单中取得开源模型中的领先表现。通用能力提升，回复更简洁自然，写作更具沉浸感。在执行复杂智能体任务，在工具调用时指令遵循更强，Artifacts 与 Agentic Coding 的前端美感和长程任务完成效率进一步提升。

输入0.003168 元 / K

输出0.012528 元 / K

Z-AI/GLM 4.6

工具调用

AI 编程

与GLM-4.5相比，这一代模型实现了多项关键提升：更长的上下文窗口：上下文长度从128K令牌扩展至200K令牌，使模型能够处理更复杂的智能体任务。卓越的编程性能：在代码基准测试中得分更高，并在Claude Code、Cline、Roo Code及Kilo Code等应用中展现出更优的实际表现，包括生成视觉效果精致的前端页面能力提升。进阶推理能力：GLM-4.6在推理性能上取得显著进步，支持推理过程中的工具调用，综合能力进一步增强。更强大的智能体：在工具调用和基于搜索的智能体任务中表现更出色，并能更高效地集成至智能体框架。精细化写作：更贴合人类对文风与可读性的偏好，在角色扮演场景中的表现也更为自然流畅。

输入0.0072 元 / K

输出0.0126 元 / K

Minimax/Minimax-M2

已退役

AI 编程

工具调用

MiniMax-M2是一款紧凑型高效大语言模型，专为端到端编程与智能体工作流优化设计。该模型激活参数量达100亿（总参数量2300亿），在通用推理、工具使用和多步骤任务执行方面展现出接近前沿水平的智能表现，同时保持低延迟与高部署效率。

输入0.0021 元 / K

输出0.0084 元 / K

Deepseek/DeepSeek-V3.2

上新

工具调用

深度思考

DeepSeek 发布 V3.2 正式版，显著强化了 Agent 和推理能力，在主流测试中达到 GPT-5 水平并支持思考模式下的工具调用；同时推出的 Speciale 探索版在多项国际竞赛中取得金牌级表现。模型已全面开放使用。

输入0.002 元 / K

输出0.003 元 / K

DeepSeek/DeepSeek-V3.1-Terminus

工具调用

AI 编程

此次更新在保持模型原有能力的基础上，针对用户反馈的问题进行了改进，包括：语言一致性：缓解了中英文混杂、偶发异常字符等情况； Agent 能力：进一步优化了 Code Agent 与 Search Agent 的表现。

输入0.004 元 / K

输出0.012 元 / K

DeepSeek/DeepSeek-V3.2-Exp-Thinking

深度思考

DeepSeek-V3.2-Exp 模型，是一个实验性（Experimental）的版本。作为迈向新一代架构的中间步骤，V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行了探索性的优化和验证。

输入0.002 元 / K

输出0.003 元 / K

DeepSeek-V3.1

AI 编程

工具调用

DeepSeek V3.1 通过显式推理（Think）、动态搜索（Search）、高效工具调用（Tool）这三驾马车，清晰地瞄准了下一代 AI 智能体的核心能力，清晰地勾勒出一条技术演进路线：一个更自主、更可靠、更能与外部世界交互的智能体（Agent）正在成型。

输入0.004 元 / K

输出0.012 元 / K

|更多 2 个价格

DeepSeek/DeepSeek-V3.1-Terminus-Thinking

深度思考

输入0.004 元 / K

输出0.012 元 / K

DeepSeek-R1-0528

热门

工具调用

深度思考

DeepSeek R1 的重大升级版本，针对复杂推理、多步骤计算更准确；长文理解与生成更连贯、逻辑更清晰；数学、编程等专业性输出更可靠。

输入0.004 元 / K

输出0.016 元 / K

|更多 2 个价格

DeepSeek-V3-0324

热门

工具调用

推理速度大幅提升，位居开源模型之首，媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练，性能显著增强。

输入0.002 元 / K

输出0.008 元 / K

|更多 2 个价格

DeepSeek-R1

热门

工具调用

深度思考

DeepSeek R1 是 DeepSeek 团队发布的最新开源模型，具备非常强悍的推理性能，尤其在数学、编程和推理任务上达到了与OpenAI的o1模型相当的水平

输入0.004 元 / K

输出0.016 元 / K

|更多 2 个价格

Doubao-Seed 1.6 Thinking

已退役

图像理解

工具调用

Doubao-Seed-1.6-thinking 模型思考能力大幅强化，对比 Doubao-1.5-thinking-pro，在 Coding、Math、逻辑推理等基础能力上进一步提升，支持视觉理解。支持 256k 上下文窗口，

输入0.0008 元 / K

输出0.008 元 / K

Doubao-Seed 1.6

图像理解

工具调用

Doubao Seed 1.6全新多模态深度思考模型，同时支持auto/thinking/non-thinking三种思考模式。 non-thinking模式下，模型效果对比Doubao-1.5-pro/250115大幅提升。支持 256k 上下文窗口，输出长度支持最大 16k tokens。

输入0.0008 元 / K

输出0.002 元 / K

Doubao Seed 2.0 Lite

上新

工具调用

深度思考

Doubao Seed 2.0 Lite 面向高频企业场景兼顾性能与成本的均衡型模型，综合能力超越上一代Doubao-Seed-1.8。胜任非结构化信息处理、内容创作、搜索推荐、数据分析等生产型工作，支持长上下文、多源信息融合、多步指令执行与高保真结构化输出。在保障稳定效果的同时显著优化成本。

输入0.0006 元 / K

输出0.0036 元 / K

Doubao Seed 2.0 Mini

上新

工具调用

深度思考

Doubao Seed 2.0 Mini 面向低时延、高并发与成本敏感场景，强调快速响应与灵活推理部署。模型效果与Doubao-Seed-1.6相当。支持256k上下文、4档思考长度和多模态理解，适合成本和速度优先的轻量级任务。

输入0.0002 元 / K

输出0.002 元 / K

Doubao Seed 2.0 Pro

上新

工具调用

深度思考

Doubao Seed 2.0 Pro 旗舰级全能通用模型，面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出，可稳定应对多步复杂规划、复杂图文推理、视频内容理解与高难度分析等场景。

输入0.0032 元 / K

输出0.016 元 / K

Doubao-Seed 1.6 Flash

图像理解

工具调用

Doubao-Seed-1.6-flash 推理速度极致的多模态深度思考模型，TPOT低至10ms；同时支持文本和视觉理解，文本理解能力超过上一代lite，视觉理解比肩友商pro系列模型。支持 256k 上下文窗口，输出长度支持最大 16k tokens。

输入0.00015 元 / K

输出0.0015 元 / K

Doubao Seed 2.0 Code

上新

工具调用

深度思考

Doubao Seed 2.0 Code 面向真实编程环境优化的 Coding 模型，能稳定调用 Claude Code 等常见 IDE 中的工具。模型特别优化了前端能力，在使用常见的前端框架时能有良好表现。模型支持使用 Skills，可以配合多种自定义技能使用。

输入0.0032 元 / K

输出0.016 元 / K

Qwen3 Next 80B A3B Thinking

工具调用

深度思考

通义千问3 Next 80B A3B Thinking是Qwen3 Next系列中优先进行推理的对话模型，默认输出结构化的"思考"轨迹。该模型专为复杂多步骤问题设计，涵盖数学证明、代码合成/调试、逻辑推理和智能体规划等领域，在知识处理、推理能力、编程辅助、对齐性及多语言评估方面表现卓越。相较于先前Qwen3版本，该模型着重提升了长链思维下的稳定性与推理时的高效扩展性，并通过调优实现了对复杂指令的精准遵循，同时减少重复或偏离任务的行为。

输入0.001 元 / K

输出0.01 元 / K

Qwen3 235b A22B Instruct 2507

热门

工具调用

基于Qwen3的非思考模式开源模型，相较上一版本（通义千问3-235B-A22B）主观创作能力与模型安全性均有小幅度提升。

输入0.002 元 / K

输出0.008 元 / K

Qwen3-Max 2026 01 23

通义千问3系列Max模型，相较2025年9月23日快照，此版本实现思考模式和非思考模式的有效融合，模型整体效果得到全方位的大幅度提升。在思考模式下，同时发布Web搜索、Web信息提取和代码解释器工具能力，使得模型在慢思考的同时，能够通过引入外部工具，以更高的准确性解决更有难度的问题。此版本为2026年1月23日快照

输入0.0025 元 / K

输出0.01 元 / K

Qwen3 Next 80B A3B Instruct

工具调用

通义千问3 Next 80B A3B Instruct是Qwen3 Next系列中经过指令微调的对话模型，专为快速稳定的响应而优化，不输出"思考"轨迹。该模型面向推理、代码生成、知识问答和多语言应用等复杂任务，同时在对齐性和格式遵循方面保持稳健性能。相较于先前Qwen3指令微调版本，该模型显著提升了超长输入和多轮对话场景下的吞吐量与稳定性，特别适合需要最终答案而非显式思维链的RAG检索增强、工具调用和智能体工作流。

输入0.001 元 / K

输出0.004 元 / K

Qwen3 Max Preview

上新

工具调用

通义千问 3 系列 Max 模型 Preview 版本，相较 2.5 系列整体通用能力有大幅度提升。参数量达 1T，大幅减少知识幻觉，模型更智能。

输入0.006 元 / K

输出0.024 元 / K

Qwen3 Coder 480B A35B Instruct

AI 编程

工具调用

Qwen3-Coder-480B-A35B-Instruct是由Qwen团队开发的混合专家（MoE）代码生成模型。该模型专为智能编码任务优化，涵盖函数调用、工具使用及代码库长上下文推理等场景。其总参数量达4800亿，每次前向传播激活350亿参数（动态激活160个专家中的8个）。

输入0.006 元 / K

输出0.024 元 / K

Qwen3 235B A22B Thinking 2507

热门

工具调用

深度思考

基于Qwen3的思考模式开源模型，相较上一版本（通义千问3-235B-A22B）逻辑能力、通用能力、知识增强及创作能力均有大幅提升，适用于高难度强推理场景。

输入0.002 元 / K

输出0.02 元 / K

Qwen-Turbo

工具调用

深度思考

Qwen3系列Turbo模型，实现思考模式和非思考模式的有效融合，可在对话中切换模式。推理能力以更小参数规模比肩QwQ-32B、通用能力显著超过Qwen2.5-Turbo，达到同规模业界SOTA水平。

思考输入0.0003 元 / K

|更多 3 个价格

Qwen3 32B

工具调用

深度思考

Qwen3 系列，性能介于 Qwen3-235B-A22B 与 Qwen3-30B-A3B 之间，全系列针对 MCP 调用进行了针对性的优化和增强。

思考输入0.002 元 / K

|更多 3 个价格

Qwen 2.5 VL 72B Instruct

图像理解

工具调用

拥有约70亿参数的多模态指令遵循大语言模型，擅长处理图像与文本信息，支持跨模态应用场景。

输入0.016 元 / K

输出0.048 元 / K

Qwen3 30B A3B

工具调用

深度思考

Qwen3 系列，总参数量达 300 亿，激活参数量达 30 亿，全系列针对 MCP 调用进行了针对性的优化和增强。

思考输入0.00075 元 / K

|更多 3 个价格

Qwen 3 235B A22B

工具调用

Qwen3 系列的旗舰模型，在编码、数学、通用能力等基准测试中，与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等其他顶级模型相比，取得了极具竞争力的成绩。

思考输入0.002 元 / K

|更多 3 个价格

Qwen 2.5 VL 7B Instruct

图像理解

工具调用

拥有约 70 亿参数的多模态指令遵循大语言模型，擅长处理图像与文本信息，支持跨模态应用场景。

输入0.002 元 / K

输出0.005 元 / K

Qwen VL-MAX-2025-01-25

图像理解

工具调用

在图像解析、内容识别以及视觉逻辑推导等任务中，表现出更强的准确性和细粒度分析能力。

输入0.003 元 / K

输出0.009 元 / K

Qwen2.5-Max-2025-01-25

工具调用

一个大规模 MoE 模型，已在超过 20 万亿个 token 上进行了预训练，并使用精选的监督微调 (SFT) 和从人类反馈中强化学习 (RLHF) 方法进行了进一步的后训练。

输入0.0024 元 / K

输出0.0096 元 / K

MiniMax M1

工具调用

深度思考

MiniMax-M1，世界上第一个开源的大规模混合架构的推理模型。M1在面向生产力的复杂场景中能力是开源模型中的最好一档，超过国内的闭源模型，接近海外的最领先模型，同时又有业内最高的性价比。M1有一个显著的优势是支持目前业内最高的100万上下文的输入，跟闭源模型里面的 Google Gemini 2.5 Pro 一样，是 DeepSeek R1 的 8 倍，以及业内最长的8万Token的推理输出。

输入0.004 元 / K

输出0.016 元 / K

GLM 4.5

AI 编程

工具调用

GLM-4.5 是 GLM 系列的旗舰模型，拥有 3550 亿个总参数和 320 亿个活动参数。作为混合推理模型，它整合了推理、编码和代理功能，提供用于复杂推理和工具运用的思维模式，以及用于即时响应的非思维模式，可满足快速发展的代理应用日益复杂的需求。

输入0.004 元 / K

输出0.016 元 / K

DeepSeek-V3

推理速度大幅提升，位居开源模型之首，媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练，性能显著增强。

输入0.002 元 / K

输出0.008 元 / K

|更多 2 个价格

Kling-V3 Omni

上新热门

视频生成

Kling-V3-Omni 是全能多模态版本，将文/图生视频、视频编辑以及基于多参考图的角色和风格一致性控制，完美统一在了单一模型中。

std x 无参考视频 x 无声0.6 元 / 秒

|更多 7 个价格

Kling-V1

生图

由快手大模型团队自研打造的一款图片生成大模型，支持文生图、图生图-通用垫图等类型的图片生成任务。

文生图0.025 元 / 张

图生图0.025 元 / 张

Viduq1

上新

视频生成

Vidu Q1 是一款成本效益高的视频生成模型，专为加快生成速度并保持良好质量而优化。它非常适合快速原型制作和大量视频创作。支持以下场景使用：参考图生视频、文生视频。

文生视频（1080p）0.5 元 / 秒

Viduq3-Pro

上新

视频生成

Vidu Q3 Pro 能够根据文字提示生成高品质的视听视频，具备先进的音效和语音同步功能，支持 1 到 16 秒的时长，最高可达 1080p 分辨率。

图/首尾帧生视频（540p）0.4375 元 / 秒

|更多 5 个价格

Qwen3.5 397B A17B

工具调用

深度思考

Qwen3.5系列397B-A17B原生视觉语言模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面（GUI）等多种任务中，均展现出与当前顶尖前沿模型相媲美的卓越性能。具备强大的代码生成与智能体能力，对于各类智能体场景具有良好的泛化性。

输入0.0012 元 / K

输出0.0072 元 / K

Viduq2

上新

视频生成

Vidu Q2在速度与质量之间实现了良好的平衡，支持从 360p 到 1080p 的多种分辨率。其还具有更稳定的运动表现和更强的场景理解能力。支持以下场景使用：参考图生视频、文生视频。

文生视频（540p）0.3125 元 / 秒

|更多 5 个价格

Qwen3-Vl 30b A3b Thinking

工具调用

图像理解

Qwen3-VL系列第二大MoE模型的Thinking版本，响应速度快，具备更强多模态理解与推理、视觉智能体、长视频长文档等超长上下文支持能力；全面升级图像/视频理解、空间感知与万物识别能力，胜任复杂现实任务。

输入0.00075 元 / K

输出0.0075 元 / K

Viduq2-Pro

上新

视频生成

Vidu Q2 Pro 能够生成专业级别的视频，具有出色的动态效果、1080p 分辨率以及增强的时序稳定性。支持以下使用场景：图生视频、首尾帧。

图/首尾帧生视频（540p）0.25 元 / 秒

|更多 2 个价格

Kling-V1-5

生图

由快手大模型团队自研打造的一款图片生成大模型，支持文生图、图生图-角色特征、图生图-人物长相等类型的图片生成任务。

文生图0.025 元 / 张

图生图0.025 元 / 张

Kling-V2-New

生图

由快手大模型团队自研打造的图生图风格转绘大模型，生成图片分辨率与入参图相同，不支持单独设置分辨率。

文生图0.1 元 / 张

图生图0.1 元 / 张

Minimax/Minimax-M2.7

上新

工具调用

深度思考

MiniMax-M2.7 是一款面向自主化、真实生产力与持续进化的下一代大语言模型。该模型深度参与自身演化进程，通过多智能体协同整合先进的智能体能力，能够在动态环境中完成复杂任务的规划、执行与优化。

输入0.0021 元 / K

输出0.0084 元 / K

Qwen/Qwen3.5-Plus

热门上新

工具调用

图像理解

Qwen3.5原生视觉语言系列Plus模型，基于混合架构设计，融合了线性注意力机制与稀疏混合专家模型，实现了更高的推理效率。在多项任务评测中，3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能，模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。

输出0.0048 元 / K

缓存输入0.00008 元 / K

|更多 2 个价格

Viduq2-Turbo

上新

视频生成

Vidu Q2 Turbo 在优化处理的同时实现了快速的视频生成，同时还能保持高视觉质量及动作连贯性。支持以下使用场景：图生视频、首尾帧。

图/首尾帧生视频（540p）0.1875 元 / 秒

|更多 2 个价格

Qwen/Qwen3.6-Plus

上新

工具调用

深度思考

Qwen 3.6 Plus 是 Qwen Plus 系列的下一代演进版本，采用了先进的混合架构，在效率与可扩展性上均有提升。与 3.5 系列相比，它具有更强的推理能力和更可靠的智能体行为表现。在基准测试中，其性能达到或超越当前领先的业界顶尖模型。作为旗舰级预览版本，它在智能体编程、前端开发及复杂问题求解方面表现尤为出色。注：该模型会收集提示词与生成结果数据，用于模型的改进。

输出0.012 元 / K

缓存输入0.0002 元 / K

|更多 2 个价格

Qwen3-Vl 30b A3b Instruct

图像理解

工具调用

Qwen3-VL系列第二大MoE模型的Instruct版本，响应速度快，支持长视频长文档等超长上下文；全面升级图像/视频理解、空间感知与万物识别能力；具备视觉2D/3D定位能力，胜任复杂现实任务。

输入0.00075 元 / K

输出0.003 元 / K

Kling-V3

上新热门

视频生成

Kling-V3 是快手最新的视频生成模型，支持生成长达15秒的高清视频，具备创新的多镜头连贯生成与原生音频能力。

std x 无参考视频 x 无声0.6 元 / 秒

|更多 10 个价格

Kling-V2

生图

由快手大模型团队自研打造的一款图片生成大模型，支持文生图、图生图-多图参考、图生图-风格转绘等类型的图片生成任务。

文生图0.1 元 / 张

图生图0.1 元 / 张

|更多 1 个价格

DeepSeek/DeepSeek-V3.2-Exp

工具调用

输入0.002 元 / K

输出0.003 元 / K

Viduq3-Turbo

上新

视频生成

Vidu Q3 Turbo 能够以优化的处理速度从文本生成快速的音频视频内容，支持 1 到 16 秒的时长，最高可达 1080p 分辨率。

图/首尾帧生视频（540p）0.25 元 / 秒

|更多 8 个价格

Qwen/Qwen3.7-Max

上新

工具调用

深度思考

Qwen3.7系列中规模最大、综合能力最强的Max模型，当前开放纯文本模型能力供体验。Qwen3.7是面向智能体时代的新一代旗舰模型，核心优势在于智能体能力的广度与深度：在编程、办公与生产力、长周期自主执行方面均能出色胜任各项任务。

输出0.036 元 / K

缓存输入0.0012 元 / K

|更多 2 个价格

Qwen/Qwen3.6-27B

工具调用

深度思考

Qwen3.6 27B 是阿里巴巴 Qwen 团队于 2026 年 4 月发布的一款拥有 270 亿参数的混合多模态语言模型，具有 262144 大小的上下文窗口。

输入0.002304 元 / K

输出0.02304 元 / K

kling-v2-1

生图

视频生成

由快手大模型团队自研打造的文生图大模型，支持 1:1，16:9，4:3，3:2，2:3，3:4，9:16，21:9 比例的图片生成。

std x 无参考视频 x 无声0.4 元 / 秒

|更多 3 个价格

Tencent/Hy3 Preview

热门上新

工具调用

深度思考

Hy3预览版是腾讯推出的一款高效混合专家模型，专为智能体工作流和生产环境设计。它支持禁用、低、高三种可配置的推理级别，能够根据任务需求灵活平衡推理速度与深度，同时在多步骤的实际工作流中提供强大的代码生成能力与可靠的性能表现。

输出0.004 元 / K

缓存输入0.0004 元 / K

|更多 1 个价格

Moonshotai/Kimi-K2.6

上新

工具调用

深度思考

Kimi K2.6 是 Kimi 最新最智能的模型，Kimi K2.6 的通用 Agent、代码、视觉理解等综合能力得到全面提升，其中在博士级难度的完整版人类最后的考试（Humanity’s Last Exam）、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩，同时支持文本、图片与视频输入，思考与非思考模式，对话与 Agent 任务。

输入0.0065 元 / K

输出0.027 元 / K

Kling-Video O1

上新

视频生成

可灵O1（可灵视频 O1 模型）是可灵AI推出的全球首个统一多模态视频生成模型。模型通过创新的多模态视觉语言（MVL）架构，实现视频生成、编辑与理解的无缝融合。模型支持多模态输入，如图片、视频和文字，能进行全能创作编辑，解决视频一致性难题，提供多种创意组合。用户可通过简单对话生成精准视频内容，探索无限创作可能。

std x 无参考视频 x 无声0.6 元 / 秒

|更多 3 个价格

Kling-V2 5 Turbo

上新

视频生成

可灵2.5 Turbo是可灵团队推出的AI视频生成模型，在多个方面实现了显著的升级和优化。性能提升是其核心亮点之一。模型能更好地理解复杂的因果关系和时间序列指令，生成的视频动作更加流畅自然，运镜更加稳定。在风格保持上也表现出色，无论是色彩、光影还是笔触质感，能在视频生成过程中保持高度一致性。成本降低也是2.5 Turbo的一大优势，使更多用户能以更低的成本体验到高质量的AI视频生成服务。在与顶级CG作品的对比中，可灵2.5 Turbo在某些场景下已经能达到接近甚至超越CG的水平，尤其是在动态预览方面，为CG制作提供了更高效、更快速的解决方案。

std x 无参考视频 x 无声0.3 元 / 秒

|更多 1 个价格

Qwen3.5 35B A3B

限时免费

工具调用

深度思考

Qwen3.5 系列 35B-A3B 是一款原生视觉语言模型，采用混合架构设计，集成了线性注意力机制和稀疏的专家混合模型，实现了更高的推理效率。其整体性能与 Qwen3.5-27B 相当。

免费

Z-AI/GLM 5.1

上新

工具调用

深度思考

GLM-5.1 在编程能力上实现了重大飞跃，尤其在处理长周期任务方面提升显著。与以往基于分钟级交互构建的模型不同，GLM-5.1 能够独立持续处理单个任务超过 8 小时，全程自主规划、执行并自我优化，最终交付完整、工程级的结果。

输入0.006 元 / K

输出0.024 元 / K

Kling-V2 6

上新

视频生成

可灵视频 2.6支持「动作控制」与「音画同出」。这是可灵首个支持音画同步生成的视频模型，不仅能一键产出匹配语音、音效（对话/唱歌/Rap）的沉浸式视频，更支持强大的动作捕捉能力，可通过参考视频精准复刻人物肢体动作与微表情，实现对视频“视、听、动”的精准掌控。

std x 无参考视频 x 无声0.5 元 / 秒

|更多 7 个价格

Minimax/Minimax-M2.5 Highspeed

上新

工具调用

深度思考

Minimax M2.5 高 TPS 版本。

输入0.0042 元 / K

输出0.0168 元 / K

GLM 4.5 Air (free)

免费

GLM-4.5-Air 是 ZhiPu 最新旗舰模型系列的轻量级版本，同样专为以智能体为中心的应用而设计。与 GLM-4.5 一样，它采用了混合专家 (MoE) 架构，但参数规模更小。GLM-4.5-Air 还支持混合推理模式，提供用于高级推理和工具使用的“思考模式”以及用于实时交互的“非思考模式”。

免费

Qwen3 30b A3b Instruct 2507

工具调用

基于Qwen3的非思考模式开源模型，相较上一版本（通义千问3-30B-A3B）中英文和多语言整体通用能力有大幅提升。主观开放类任务专项优化，显著更加符合用户偏好，能够提供更有帮助性的回复。

输入0.00075 元 / K

输出0.003 元 / K

Qwen3 30b A3b Thinking 2507

工具调用

深度思考

基于Qwen3的思考模式开源模型，相较上一版本（通义千问3-30B-A3B）复杂推理类任务性能优秀，包括逻辑推理、数学、科学、代码类等具有一定难度的任务场景，指令遵循、文本理解、多语言翻译等能力显著提高。

输入0.00075 元 / K

输出0.0075 元 / K