华为云MaaS模型即服务对接使用完全指南:从开通到生产级调用
1. MaaS是什么:重新定义大模型的使用方式
在AI技术快速发展的背景下,企业和研究机构面临着构建和优化大模型的高成本和技术门槛。华为云MaaS(模型即服务,全称ModelArts Studio)应运而生,它是一站式大模型开发托管服务,提供灵活、低成本的模型调用方案,覆盖文本生成、智能交互、数据分析等多元场景。
MaaS基于昇腾适配的主流大模型服务,作为企业与开发者的大模型敏捷应用枢纽,无需用户投入高昂成本进行模型训练、部署与运维。用户可按需调用,精准匹配业务用量,大幅降低技术投入与时间成本,快速将大模型能力集成至自有产品与业务流程。
从产品架构来看,MaaS位于场景化应用层,聚焦大模型加行业的落地,覆盖政务、工业、金融、医疗等行业场景,提供垂直领域的AI解决方案。其核心模块覆盖大模型全生命周期管理,包括模型管理、模型部署与企业应用三大模块。
需要先登录华为云控制台,点击:华为云控制台,还没有账号,点击:注册并关联,已有账号点击:登录后关联
2. MaaS的核心能力与模型生态
2.1 丰富的模型矩阵
MaaS模型广场提供了丰富的基础模型,用户可以直接使用这些模型进行部署模型服务等操作。平台预置了当前主流的第三方开源大模型,包括但不限于:
- DeepSeek系列:DeepSeek-R1、DeepSeek-V3、DeepSeek-V4-Flash等,以高效计算架构和强大推理能力著称
- 通义千问系列:Qwen、Qwen2、Qwen2.5等,支持多语言处理、数学推理、对话问答
- Llama系列:Llama2、Llama3、Llama3.1等
- 百川、ChatGLM等主流开源模型
- 多模态模型:如生数Vidu Q3视频生成大模型
截至2026年6月,MaaS已提供15余款SOTA模型服务。
2.2 模型路由:智能调度最优模型
MaaS模型路由支持三种策略,根据请求特征动态智能择优调度最佳模型:
- 成本优先模式:在保证基本效果的前提下,优先选择调用成本最低的模型
- 效果优先模式:优先选择效果最佳的模型,适用于对回答质量要求极高的场景
- 均衡模式:在成本和效果之间取得平衡
模型调度精准率超过95%,调用成本平均降低20%。
2.3 ModelArts Next四大能力
2026年6月,华为云发布新一代ModelArts Next模型训推平台,MaaS进入全新范式。四大核心能力包括:
- RLaaS(强化学习即服务):一分钟创建强化学习任务,全程可视化观测,训推一致性保障
- 机密推理:依托硬件级可信执行环境,在AI编码、金融风控等高敏感场景中确保数据只进不出
- 模型路由:三种策略动态智能调度
- 模型矩阵:主流SOTA模型Day0上线
3. 准备工作:账号注册与权限配置
3.1 注册华为云账号
使用MaaS服务的第一步是注册华为云账号。具体操作包括:访问华为云官网,完成账号注册流程,并确保账号状态正常,不能处于欠费或冻结状态。
3.2 配置MaaS访问授权
对于所有用户(包括个人用户),需要完成ModelArts委托授权才能使用MaaS服务,否则会造成操作出现不可预期的错误。只有华为云账号可以使用委托授权,可以为当前账号授权,也可以为当前账号下的所有IAM用户授权。
授权流程如下:
- 登录华为云控制台
- 进入ModelArts服务
- 在权限管理页面完成委托授权配置
- 多个IAM用户或账号可使用同一个委托
3.3 IAM用户权限管理
默认情况下,管理员创建的IAM用户没有任何权限,需要将其加入用户组,并给用户组授予策略,才能使得用户组中的用户获得对应的权限。管理员可以通过IAM为用户组配置细粒度授权策略,使用户获得策略定义的权限,操作对应云服务的资源。
如果华为云账号已经能满足要求,则不需要创建独立的IAM用户。
4. 开通预置模型服务
MaaS预置服务为企业用户提供高性能、高可用的推理API服务,支持按Token用量计费的模式。
4.1 开通步骤
- 登录MaaS控制台,在顶部导航栏中选择目标区域
- 在左侧导航栏选择预置服务
- 在预置服务页签,在目标服务右侧的操作列单击开通服务
- 在开通预置模型服务对话框,按需勾选预置服务
- 勾选我已阅读并同意上述说明及《MaaS服务声明》,单击一键开通
勾选目标预置服务后,会自动开通该服务下的所有模型版本。当模型服务的状态为开通,表示模型服务已开通。
4.2 约束与限制
- 该功能仅支持中国-香港区域
- 开通预置服务时,将自动开通该服务下所有版本,不支持单独开通某版本
- 暂不支持关闭预置服务
- 预置服务当前处于受限使用阶段,如需使用请提交工单
5. 创建API Key:身份认证的关键
在调用MaaS的模型服务时,需要填写API Key用于接口的鉴权认证。
5.1 创建API Key
- 访问API Key管理页面
- 单击创建API Key,配置相关参数
- 复制密钥并保存至安全位置
5.2 API Key管理要点
- 最多可创建30个密钥
- API Key的标签在创建完成后不支持修改
- 每个密钥仅在创建时显示一次,请确保妥善保存
- 如果密钥丢失无法找回,需要重新创建API Key以获取新的访问密钥
- 单击我已保存确认关闭后将无法再次查看密钥
6. 调用MaaS模型服务:Python与cURL实战
MaaS支持通过API调用大模型,涵盖Python、cURL、OpenAI接入方式。
6.1 获取调用信息
在MaaS控制台左侧导航栏选择在线推理,在我的服务页签,在目标服务右侧单击操作列更多调用说明。在调用说明页面可以查看API地址和模型名称。
6.2 Python调用示例
以下代码演示如何通过Python调用MaaS部署的DeepSeek模型服务:
import requests
import json
if __name__ == '__main__':
# API地址,从MaaS控制台的调用说明页面获取
url = "https://api-ap-southeast-1.modelarts-maas.com/v2/chat/completions"
# 替换成已获取的API Key
api_key = "MAAS_API_KEY"
headers = {
'Content-Type': 'application/json',
'Authorization': f'Bearer {api_key}'
}
data = {
"model": "deepseek-v4-flash", # model参数,按需更换
"max_tokens": 1024, # 最大输出token数
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "介绍一下你自己"}
],
"stream": False # 是否开启流式推理
}
response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)
print(response.status_code)
print(response.text)MaaS还提供了cURL方式调用:
curl -X POST \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $MAAS_API_KEY" \
-d '{
"model": "deepseek-v4-flash",
"messages": [
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "介绍一下自己"}
]
}'6.3 检查Python环境
在终端输入如下命令查看当前计算机环境是否安装了Python和pip:
python -V
pip --versionPython版本需要在3.8或以上版本。如果未安装,请前往Python官网下载安装。安装requests库:
pip3 install requests7. 创建自定义模型:专属模型定制
7.1 为什么需要自定义模型
MaaS模型广场提供了丰富的基础模型,但当基础模型无法满足个性化需求时,用户可以基于模型广场的模型创建专属的个性化模型。MaaS推出预置模型加自定义权重的全流程方案,用户可以使用基础模型结合自定义的模型权重文件创建个人专属的模型。
自定义模型的核心价值在于:
- 满足个性化需求:预置模型是通用的,难以契合所有用户的特定需求
- 实现更好的效果:在专业领域的对话问答、代码生成等场景,自定义模型更具优势
- 便于版本管理和优化:一个模型最多可支持创建10个版本
7.2 创建步骤
- 登录ModelArts Studio控制台,在顶部导航栏选择目标区域
- 在左侧导航栏单击我的模型
- 在我的模型页面右上角单击创建模型
- 在创建模型页面配置相关参数
关键参数包括:
- 来源模型:单击选择基础模型,在弹窗中选择模型
- 模型名称:自定义,支持1到64位,以中文或大小写字母开头
- 自定义权重存储路径:选择存放模型权重文件的OBS路径
7.3 权重文件要求
- 权重文件需要满足Hugging Face上的对应模型文件格式要求
- 模型权重文件夹下包括权重类文件、词表类文件和配置类文件
- 可以使用transformers的from_pretrained方法对模型权重文件夹进行加载
- 单次上传本地文件到OBS的总大小不能超过5GB
8. 部署模型服务:从模型到生产API
8.1 部署流程
在MaaS可以将模型广场的预置模型或自定义模型部署为我的服务,便于在其他业务环境中调用。
- 登录MaaS控制台,在顶部导航栏中选择目标区域
- 在左侧导航栏选择在线推理
- 在在线推理页面单击我的服务页签
- 在右上角单击部署模型服务进入部署页面
8.2 部署配置参数
部署模型服务时需要配置以下参数:
- 服务名称:自定义,支持1到64位
- 部署模型:选择模型广场或我的模型下面的模型
- 资源池类型:仅支持专属资源池,需单独创建
- 实例规格:选择服务器类型和型号,仅显示模型支持的资源规格
- 实例数:设置服务器个数
- 流量限制(QPS):设置待部署模型的流量限制
8.3 模型默认输入输出长度
MaaS预置了推理的最大输入输出长度:
- DeepSeek-R1-8K、DeepSeek-V3-8K等:8192 tokens
- DeepSeek-R1-16K、DeepSeek-V3-16K等:16384 tokens
- DeepSeek-R1-32K、DeepSeek-V3-32K等:32768 tokens
- DeepSeek-V3-64K等:65536 tokens
- 其他模型:4096 tokens
9. 弹性扩缩容:应对业务波动
在使用大型模型进行推理时,业务需求会呈现明显的峰谷波动。模型服务必须具备灵活的扩缩容能力,以适应不同时间段内的用户负载变化。ModelArts Studio支持手动扩缩容模型服务的实例数,该操作不会影响部署服务的正常运行。
9.1 扩缩容步骤
- 登录ModelArts Studio控制台
- 在左侧导航栏选择在线推理
- 在在线推理页面单击我的服务页签
- 在目标模型服务右侧单击操作列更多扩缩容
- 按需选择扩容或缩容
9.2 约束与计费
- 仅当模型服务处于运行中或告警状态时才能扩缩容
- 扩容后会产生计算资源和存储资源的累计值计费
10. 与第三方工具集成:扩展MaaS的边界
10.1 MaaS + Dify构建智能知识库问答系统
通过开源Dify平台集成MaaS服务的DeepSeek模型,可构建智能问答助手。Dify支持集成多个AI模型和工具,实现复杂的工作流自动化。系统支持用户自由选择直接调用DeepSeek大模型进行开放式问答,或结合企业私有知识库实现精准信息检索与推理应答。
集成步骤概览:
- 打开ModelArts Studio控制台
- 部署模型服务并获取API地址和模型名称
- 在Dify平台接入MaaS模型服务
- 配置知识库(可选)
- 构建问答应用
10.2 MaaS + Cursor构建AI代码编辑器
Cursor是一款基于AI技术的现代化代码编辑器,MaaS服务将DeepSeek系列模型部署到平台,支持开发者进行API调用。使用Cursor调用部署在MaaS上的DeepSeek模型,可以构建智能代码编辑器。
集成步骤:
- 通过Cursor官网下载并安装Cursor
- 在MaaS控制台开通预置服务
- 创建API Key并保存
- 在Cursor中配置MaaS API地址和API Key
11. 计费模式与成本优化
11.1 按Token计费
在调用模型推理服务的过程中,输入内容首先会被分词(tokenize),转换为模型可识别的Token。在调用MaaS预置服务时,将根据实际使用的Tokens数量进行计费。文本生成模型基于tokens计费。
支持以下两种计费方式:
- 包年/包月:预付费模式,先付费再使用
- 按需计费:后付费模式,先使用再付费
计费时将优先使用套餐包的额度,超出部分将自动根据使用模型的Token量按正常价格收费。不使用服务则不会产生费用。
11.2 计费项构成
在MaaS进行模型推理时,会产生计算资源和存储资源等费用:
- 计算资源:运行模型服务的费用
- 存储资源:数据存储到OBS的费用
12. 最佳实践与常见场景
MaaS最佳实践总览涵盖了多个常见应用场景:
- 对话问答:使用GLM-5.1或DeepSeek-V4-Pro模型服务快速实现对话问答
- 对接第三方工具:Cursor、Cline、Cherry Studio、OpenCode等
- 智能知识库问答:结合Dify和向量数据库构建
当有优惠折扣时,预置服务页签会出现相关提示。开通预置服务时会默认领取可用的优惠券,扣费时会优先抵扣优惠券。
13. 常见问题解答
问1:MaaS服务支持哪些区域?
答:预置服务开通和部署功能目前仅支持中国-香港区域。不同区域支持的模型可能不同,请以控制台实际界面为准。
问2:API Key丢失了怎么办?
答:API Key仅在创建时显示一次,如果丢失无法找回,需要重新创建API Key以获取新的访问密钥。
问3:MaaS支持哪些调用方式?
答:MaaS支持通过管理控制台和API两种方式访问。API调用涵盖Python、cURL、OpenAI接入方式。
问4:如何控制MaaS的费用?
答:MaaS按Token用量计费,不使用服务不会产生费用。可以通过模型路由策略选择成本优先模式降低成本。同时可购买套餐包享受优惠。
问5:自定义模型需要准备什么?
答:需要准备符合Hugging Face格式的模型权重文件(包括权重类、词表类和配置类文件),上传至OBS桶,然后在MaaS控制台创建模型时指定该路径。
问6:部署的模型服务如何扩缩容?
答:在MaaS控制台的在线推理我的服务页签,在目标服务右侧单击更多扩缩容,按需调整实例数即可,操作不影响服务正常运行。



