AI 大模型推理服务

AI 大模型推理服务为企业提供高效、稳定、安全的模型推理服务,支持DeepSeek-R1、Qwen2.5等主流开源大模型,并整合了图文识别(OCR)、语音文字识别(ASR)、文字转语音(TTS)、多媒体介质存储(对象存储)和输入输出(RTC快直播)等丰富的音视图文能力,帮助客户、开发者轻松实现服务智能化集成及智能应用开发。
模型列表
DeepSeek-R1-0528
全新上线
输入 0.004 元/K输出 0.016 元/K
DeepSeek R1 的重大升级版本,针对复杂推理、多步骤计算更准确;长文理解与生成更连贯、逻辑更清晰;数学、编程等专业性输出更可靠。
深度思考
上下文 128K
结构化输出
Function Calling
ID: deepseek-r1-0528
DeepSeek-R1
输入 0.004 元/K输出 0.016 元/K
DeepSeek R1 是 DeepSeek 团队发布的最新开源模型,具备非常强悍的推理性能,尤其在数学、编程和推理任务上达到了与OpenAI的o1模型相当的水平
深度思考
满血版
上下文 64K
ID: deepseek-r1
DeepSeek-V3-0324
输入 0.002 元/K输出 0.008 元/K
推理速度大幅提升,位居开源模型之首,媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练,性能显著增强。
对话
工具调用
上下文 128K
ID: deepseek-v3-0324
DeepSeek-V3
输入 0.002 元/K输出 0.008 元/K
推理速度大幅提升,位居开源模型之首,媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练,性能显著增强。
对话
上下文 128K
ID: deepseek-v3
DeepSeek-V3-tool
输入 0.002 元/K输出 0.008 元/K
推理速度大幅提升,位居开源模型之首,媲美顶尖闭源模型。采用负载均衡辅助策略和多标记预测训练,性能显著增强。
对话
工具调用
上下文 128K
ID: deepseek-v3-tool
DeepSeek-R1-Distill-Qwen-32B
输入 0.0015 元/K输出 0.006 元/K
是从 DeepSeek-R1 提炼的稠密模型,表现优于 OpenAI-o1-mini,在多个基准测试中取得新最先进成果。该模型支持推理任务,推动了研究社区的发展。
推理
深度思考
上下文 32K
ID: deepseek-r1-32b
MiniMax-M1
全新上线
限时体验
MiniMax-M1,世界上第一个开源的大规模混合架构的推理模型。M1在面向生产力的复杂场景中能力是开源模型中的最好一档,超过国内的闭源模型,接近海外的最领先模型,同时又有业内最高的性价比。M1有一个显著的优势是支持目前业内最高的100万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一样,是 DeepSeek R1 的 8 倍,以及业内最长的8万Token的推理输出。
80K思维链 x 1M输入
ID: MiniMax-M1
Llama-3.1-Nemotron-Ultra-253B-v1
限时体验
源自 Meta Llama-3.1 的推理模型,支持 128K 令牌上下文,适合在单个 8xH100 节点上推理,专注于推理能力和人类聊天偏好。
推理
上下文 128K
ID: nvidia/llama-3.1-nemotron-ultra-253b-v1
Llama-3.3-Nemotron-Super-49B-v1
限时体验
基于 Meta Llama-3.3 的推理模型,支持 128K 令牌上下文,专注于推理能力和人类聊天偏好,适用于 RAG 和工具调用等任务。
推理
工具调用
上下文 128K
ID: nvidia/llama-3.3-nemotron-super-49b-v1
通义千问2.5-vl-72b-instruct
输入 0.016 元/K输出 0.048 元/K
拥有约70亿参数的多模态指令遵循大语言模型,擅长处理图像与文本信息,支持跨模态应用场景。
图片推理
ID: qwen2.5-vl-72b-instruct
通义千问2.5-VL-7B-Instruct
输入 0.002 元/K输出 0.005 元/K
拥有约70亿参数的多模态指令遵循大语言模型,擅长处理图像与文本信息,支持跨模态应用场景。
图片推理
ID: qwen2.5-vl-7b-instruct
通义千问 VL-MAX-2025-01-25
输入 0.003 元/K输出 0.009 元/K
在图像解析、内容识别以及视觉逻辑推导等任务中,表现出更强的准确性和细粒度分析能力。
图片推理
视频理解
上下文 128K
ID: qwen-vl-max-2025-01-25
通义千问3-235B-A22B
输入 0.002 元/K输出 0.008(think:0.02)元/K
Qwen3 系列的旗舰模型,在编码、数学、通用能力等基准测试中,与 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等其他顶级模型相比,取得了极具竞争力的成绩。
深度思考
上下文 128K
ID: qwen3-235b-a22b
通义千问3-32B
输入 0.002 元/K输出 0.008(think:0.02)元/K
Qwen3 系列,性能介于 Qwen3-235B-A22B 与 Qwen3-30B-A3B 之间,全系列针对 MCP 调用进行了针对性的优化和增强。
深度思考
上下文 128K
ID: qwen3-32b
通义千问3-235B-A3B
输入 0.00075 元/K输出 0.003(think:0.0075)元/K
Qwen3 系列,总参数量达 300 亿,激活参数量达 30 亿,全系列针对 MCP 调用进行了针对性的优化和增强。
深度思考
上下文 128K
ID: qwen3-235b-a3b
通义千问2.5-Max-2025-01-25
输入 0.0024 元/K输出 0.0096 元/K
一个大规模 MoE 模型,已在超过 20 万亿个 token 上进行了预训练,并使用精选的监督微调 (SFT) 和从人类反馈中强化学习 (RLHF) 方法进行了进一步的后训练。
对话
工具调用
ID: qwen-max-2025-01-25
通义千问2.5-72B-Instruct
输入 0.004 元/K输出 0.012 元/K
在 Qwen2 基础上实现了全面升级。该系列包含参数量从0.5B到72B的基座模型和指令微调模型,主要带来四大突破性提升:1)通过领域专家模型显著增强代码和数学能力,大幅扩充知识储备;2)在指令遵循、长文本生成(超8K)、结构化数据(如表格)理解和JSON格式输出等方面表现突出,对系统提示词多样性更具适应性,显著提升角色扮演和对话条件设置能力;3)支持128K超长上下文处理,并能生成长达8K的内容;4)语言能力覆盖中、英、法、西、德、日、韩、阿拉伯等29种语言,展现出强大的多语言处理能力。这一系列改进使Qwen2.5在专业领域应用和全球化服务方面更具竞争力。
对话
工具调用
上下文 128K
ID: qwen2.5-72b-instruct
QwQ-Plus
输入 0.002 元/K输出 0.006 元/K
通义千问 QwQ 推理模型增强版,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。
推理
工具调用
上下文 128K
ID: qwq-plus
QwQ-32B
输入 0.002 元/K输出 0.006 元/K
通义千问 QwQ Plus 开源版本,基于 Qwen2.5 模型训练的 QwQ 推理模型,通过强化学习大幅度提升了模型推理能力。
推理
工具调用
上下文 128K
ID: qwq-32b
通义千问2.5-Omni-7B
限时体验
通义千问全新多模态理解生成大模型,支持文本、图像、语音与视频输入,并输出文本与音频,提供了2种自然对话音色。
视觉理解
ID: qwen2.5-omni-7b
通义千问-VL-MAX-Latest
限时体验
视觉理解模型。在解决复杂数学问题方面,准确性显著提高,回复风格面向人类偏好进行大幅调整,尤其是数学、逻辑推理、知识问答等客观类问题,模型回复详实程度和格式清晰度明显改善。
视觉理解
ID: qwen-vl-max-latest
Doubao 1.5 Pro 32k
输入 0.0008 元/K输出 0.002 元/K
全新升级的多模态大模型,视觉理解、分类、信息抽取等能力显著提升,并重点增强了解题、视频理解等场景的任务效果。支持 128k 上下文窗口,输出长度支持最大 16K。
视觉理解
上下文 128K
ID: doubao-1.5-pro-32k
Doubao-1.5-Vision-Pro
输入 0.003 元/K输出 0.009 元/K
全新升级的多模态大模型,视觉理解、分类、信息抽取等能力显著提升,并重点增强了解题、视频理解等场景的任务效果。支持 128k 上下文窗口,输出长度支持最大 16K。
视觉理解
上下文 128K
ID: doubao-1.5-vision-pro
Doubao-1.5-thinking-pro
输入 0.004 元/K输出 0.016 元/K
仅支持文本输入。在数学、编程、科学推理等专业领域及创意写作等通用任务中表现突出,在AIME 2024、Codeforces、GPQA等多项权威基准上达到或接近业界第一梯队水平。
上下文 128K
ID: doubao-1.5-thinking-pro
ASR
0.08元 / 百字符
将人类语音转换为文本的系统,具备高准确率和对多种口音、背景噪音的适应能力。
语音识别
ID: asr
TTS
0.06元 / 分钟
将文本转化为自然流畅的语音,能够生成多种音调和风格的语音输出。
文字合成语言
ID: tts
OCR
0.06元 / 次
将图像中的文本信息提取并转换为可编辑的数字文本,广泛应用于文档扫描和自动化数据输入。
文本识别
ID: ocr
这些客户信赖我们
相关产品

内容审核

提供图片、视频等内容的审核服务,精准识别过滤色情、暴恐、敏感人物等违规内容

查看更多 >

画质增强

基于七牛领先的深度学习技术,提供视频画质增强服

查看更多 >

云服务器

提供云服务器、负载均衡、云数据库、高防等服

查看更多 >

智能数字人

更形象、更智能的数字人

查看更多 >