MiniMax M3

MiniMax M3
MiniMax · Text Generation
POST /v1/chat/completions

MiniMax M3 是一种多模态推理模型,用于编码、代理和长上下文分析,包含文本、图像和视频输入。

一眼看

场地价值
型号IDminimax-m3
车型发布日期2026-06-01
输入模态文本、图像、视频
输出模态正文
上下文窗口524K
重量精度-
最大输出令牌524,288
地区新加坡
特色推理、视觉、视频、web_search、function_calling、缓存、long_context
本土推断
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记<=512K $0.225(曾是$0.30);>512K $1.20
输出每100万个生成代币<=512K $0.90(曾是$1.20);>512K $4.80
隐式缓存读取每 1M 缓存输入标记<=512K $0.045(曾是$0.06);>512K $0.24
Linkup网络搜索启用时,每成功搜索一次$0.013

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m3", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数1控制随机性。较低的数值则更具确定性;更高的数值则更具探索性。·射程:0 – 2
top_p人数0.95通过限制生成到最可能的标记质量来控制核采样。·射程:0 – 1
max_completion_tokens整数4096最大生成的代币,包括在思考时的推理代币。·射程:1 – 524288
stop数组-可选的停止序列或停止序列列表。
enable_thinking布尔值确实如此在回答之前,先启用自适应模型思维。设为false,要求直接回答,无需推理阶段。
web_search_linkup布尔值错误在 MiniMax M3 回答之前,先用 Linkup 在网上搜索最新信息。启用后会为成功请求添加$0.013。
tools数组-兼容 OpenAI 的函数调用工具定义。
tool_choice对象-可选兼容OpenAI的tool_choice值。

注释

文本、图像和视频输入,输出文本。思维默认为适应性,可以被禁用。定价基于输入代币,包括缓存命中:<=512K使用折扣标准层,而>512K使用高上下文层。当前标准路由支持最多524K代币。1M 上下文正在推出。Linkup网络搜索可通过web_search_linkup进行,每成功一次搜索会增加$0.013。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/minimax-m3