腾讯云高性能应用服务HAI对接使用完全指南：从零部署到API集成

apphuang2026年06月30日 18:17:5910

1. 认识腾讯云高性能应用服务HAI

在AI应用从概念验证走向生产部署的过程中，算力获取与环境配置始终是两道绕不开的门槛。传统的GPU服务器采购流程涉及硬件选型、驱动安装、CUDA版本适配、深度学习框架编译等一系列繁琐操作，往往需要数天甚至数周才能搭建出一个可用的开发环境。腾讯云高性能应用服务HAI的推出，正是为了从根本上解决这一痛点。

HAI全称为Hyper Application Inventor，是一款面向AI与科学计算的GPU/NPU应用服务产品。它的核心定位是提供即插即用的强大算力和预置环境，帮助中小企业和开发者快速部署大语言模型、AI绘图、数据科学等高性能应用。与传统的GPU云服务器不同，HAI并非简单地提供一台裸金属或虚拟机的计算资源，而是将算力、开发环境、模型应用三层能力进行了深度融合，实现了从底层硬件到上层应用的全链路封装。

HAI的产品设计理念可以用四个关键词来概括。第一个是开箱即用，系统内置了多种操作系统、GPU驱动、CUDA、cuDNN等基础组件，并预装了PyTorch、TensorFlow等主流AI框架，用户无需关心底层环境的任何细节。第二个是分钟级部署，依托云原生快照技术，将动辄几十GB的AIGC环境压缩至1到2分钟内完成部署，对比传统镜像拉取方式效率提升了十倍。第三个是智能算力匹配，系统屏蔽了可用区、VPC等复杂云计算概念，根据用户选择的应用类型自动匹配最佳性价比的算力资源。第四个是多种访问方式，除传统的SSH登录外，还提供了JupyterLab、Gradio WebUI、Cloud Studio等图形化交互界面，让不同技术背景的用户都能找到适合自己的操作路径。

从产品架构来看，HAI构建于弹性GPU算力资源池之上，平台提供多样化的GPU配置，内置极简部署模块与教学友好型工具，并配备完善的云端安全稳定协作环境。在算力层面，HAI提供GPU基础型、GPU进阶型、GPU高阶型等多个档位的套餐选择，显存从16GB到768GB不等，算力从8+TFlops到352+TFlops，覆盖从1.5B小参数模型到671B超大模型的推理需求。在应用层面，HAI预置了DeepSeek全系列、ChatGLM、Llama2、Stable Diffusion等热门模型，用户只需点击几下鼠标即可完成部署。

需要先登录腾讯云控制台，点击：腾讯云控制台，还没有账号，点击：注册后再关联，已有账号点击：登录后再关联

2. 创建你的第一个HAI实例

使用HAI服务的第一步是创建实例。整个过程在控制台中完成，无需编写任何代码，即使是初次接触云服务的开发者也能在几分钟内完成。

2.1 前提准备

在创建HAI实例之前，需要确保已经完成了以下准备工作。首先是注册腾讯云账号并完成实名认证，这是使用任何腾讯云服务的基础。其次是确认账户余额充足，因为HAI实例采用按量计费或包年包月的计费模式，创建实例时会预先冻结部分费用。如果使用的是传统账户类型，还需要先完成账户升级才能购买HAI服务。

2.2 控制台创建流程

登录腾讯云控制台后，在页面顶部的搜索框中输入HAI，在搜索结果中点击高性能应用服务HAI，进入HAI服务页面。在服务页面中点击新建按钮，进入实例创建配置页面。

配置页面主要包含以下几个关键选项。首先是应用选择，HAI提供了丰富的预置应用模板，包括DeepSeek-R1、ChatGLM3-6B、Stable Diffusion WebUI、ComfyUI等。用户可以根据自己的业务需求选择对应的应用，系统会自动匹配该应用所需的运行环境。其次是地域选择，建议选择靠近目标客户的地域，以降低网络延迟。第三是算力套餐选择，HAI提供GPU基础型、GPU进阶型、GPU高阶型等多种套餐。GPU基础型配备16GB+显存和8+TFlops算力，适合运行8B及以下参数的模型。GPU进阶型提供24GB+或32GB+显存，算力达到15-30+TFlops，适合运行32B及以下参数的模型。GPU高阶型则提供48GB到768GB的显存配置，能够支撑70B到671B的超大规模模型推理。最后是实例名称和数量等基本信息配置。

完成配置后点击立即购买，系统会自动开始部署所选的模型应用。部署过程通常在1到3分钟内完成，届时实例状态会变为运行中，用户便可以通过多种方式访问该实例了。

2.3 通过API创建实例

除了通过控制台创建实例外，HAI也提供了完整的API接口，支持程序化地创建和管理实例。这对于需要批量创建实例或实现自动化运维的场景尤为重要。

创建实例的API接口是RunInstances，接口请求域名为hai.tencentcloudapi.com。该接口支持一次创建最多10个实例。以下是调用该接口的关键参数说明：

{
  'Action': 'RunInstances',
  'Version': '2023-08-12',
  'Region': 'ap-guangzhou',
  'ApplicationId': 'app-jknfna',
  'BundleType': 'XL',
  'SystemDisk': {
    'DiskType': 'CLOUD_PREMIUM',
    'DiskSize': 250
  },
  'InstanceCount': 1,
  'InstanceName': 'my-hai-instance'
}

其中ApplicationId参数需要通过DescribeApplications接口获取，BundleType参数用于指定算力套餐类型，可选值包括XL、XL_2X、3XL、3XL_2X、4XL等。

腾讯云提供了API Explorer工具，用户可以在线调用API接口并自动生成各语言版本的SDK调用示例。API Explorer支持签名验证、在线调试和快速检索接口等能力，是开发者调试API的得力助手。

3. 访问HAI实例的三种方式

HAI实例创建成功后，用户可以通过多种方式访问实例进行开发和调试。根据不同的使用场景和技术背景，HAI提供了三种主要的访问方式：JupyterLab、WebUI和SSH。

3.1 通过JupyterLab访问

JupyterLab是最受数据科学家和AI开发者欢迎的访问方式之一。在HAI控制台的算力管理页面中，选择算力连接下的JupyterLab选项，即可打开JupyterLab界面。

HAI实例预置的JupyterLab环境包含了完整的AI开发工具链。以典型的HAI实例为例，系统自带Ubuntu 20.04操作系统、Python 3.10、PyTorch 2.5.1、CUDA 12.4、cuDNN 9等组件。用户可以直接在Jupyter Notebook中编写和运行Python代码，调用预置的AI模型进行推理或微调。这种访问方式特别适合需要进行交互式数据探索、模型实验和代码原型开发的场景。

在JupyterLab中，用户还可以打开终端（Terminal），执行命令行操作，安装额外的Python包或系统工具。这使得JupyterLab不仅是一个交互式编程环境，更是一个功能完整的云端开发工作站。

3.2 通过WebUI访问

对于不熟悉编程或者希望快速体验模型功能的用户，HAI提供了基于Gradio或ChatbotUI的WebUI访问方式。在HAI控制台中选择算力连接下的Gradio WebUI或ChatbotUI，即可打开一个图形化的交互界面。

以大语言模型为例，WebUI界面通常包含一个对话输入框和模型参数调节选项。用户可以在界面中直接输入问题，模型会实时生成回复。界面右下角通常还提供了Maximum length、Top P、Temperature等参数调节选项。Maximum length控制生成文本的长度，增加该值会允许模型生成更长的文本。Top P影响生成文本的多样性和集中度，调高该值会使生成的文本更加多样化。Temperature控制生成文本的创造性和稳定性，调高该值适合需要创意输出的场景，调低该值则适合需要精确和一致性结果的场景。

对于Stable Diffusion等AI绘画模型，WebUI界面则提供了文生图、图生图、模型切换、参数调节等丰富功能，用户可以通过图形界面完成从提示词输入到图片生成的全流程。

3.3 通过SSH访问

对于需要深度定制环境或进行系统级操作的高级用户，HAI也支持传统的SSH访问方式。在实例创建成功后，系统会通过站内信的方式推送登录所需的配置信息，包括默认用户名、登录密码和公网IP地址。用户可以使用这些信息通过SSH客户端登录到实例，获得完整的Linux shell访问权限。

SSH访问方式提供了最大的灵活性，用户可以在实例上安装任何所需的软件、修改系统配置、部署自定义的服务等。但这种方式也要求用户具备一定的Linux系统运维能力，适合有经验的技术人员使用。

4. 通过API和SDK对接HAI服务

将HAI的AI能力集成到自有业务系统中，是大多数企业用户的最终目标。HAI提供了完整的API接口和多语言SDK，支持程序化地调用部署在HAI实例上的模型服务。

4.1 获取服务调用信息

在HAI中部署模型服务后，系统会生成相应的调用地址和认证凭证。用户可以通过HAI控制台或API接口获取这些信息。对于通过HAI可信集群部署的模型服务，系统会提供一个标准的API调用地址以及访问所需的token。

以Stable Diffusion为例，模型部署成功后，系统会开放一个HTTP接口，通常位于实例IP的特定端口上（如7862）。外部应用可以通过向该接口发送HTTP请求来调用模型服务。

4.2 Python SDK调用示例

Python是AI开发中最常用的编程语言，腾讯云提供了完整的Python SDK支持HAI服务的调用。以下是一个调用HAI上部署的Stable Diffusion模型进行文生图的代码示例：

import requests
import base64
from PIL import Image
from io import BytesIO

# HAI实例上部署的Stable Diffusion API地址
api_url = 'http://your_hai_ip:7862/sdapi/v1/txt2img'

# 构造请求参数
payload = {
    'prompt': 'a beautiful sunset over the ocean, digital art',
    'negative_prompt': 'blurry, bad quality',
    'steps': 20,
    'width': 512,
    'height': 512,
    'cfg_scale': 7
}

# 发送POST请求
response = requests.post(api_url, json=payload)

if response.status_code == 200:
    result = response.json()
    # 获取返回的base64编码图片
    image_data = result['images'][0]
    # 解码base64得到二进制图片数据
    image_bytes = base64.b64decode(image_data)
    # 转换为PIL Image对象
    image = Image.open(BytesIO(image_bytes))
    # 保存图片
    image.save('generated_image.png')
    print('图片生成成功，已保存为generated_image.png')
else:
    print(f'请求失败，状态码：{response.status_code}')

这段代码展示了如何向HAI上部署的Stable Diffusion服务发送文生图请求。请求参数中的prompt是描述想要生成图片内容的文本提示词，negative_prompt则用于指定不希望出现在图片中的元素。steps控制扩散步数，步数越多生成的图片质量通常越高但耗时也更长。width和height指定输出图片的尺寸。cfg_scale控制文本提示对生成结果的引导强度。

对于大语言模型，调用方式类似。以DeepSeek为例，HAI实例上通常会部署兼容OpenAI API格式的接口。用户可以使用OpenAI的Python SDK或者直接通过HTTP请求调用：

import requests

# HAI实例上部署的DeepSeek API地址
api_url = 'http://your_hai_ip:8000/v1/chat/completions'

payload = {
    'model': 'deepseek-chat',
    'messages': [
        {'role': 'system', 'content': 'You are a helpful assistant.'},
        {'role': 'user', 'content': '请介绍一下腾讯云HAI服务'}
    ],
    'temperature': 0.7,
    'max_tokens': 1024
}

response = requests.post(api_url, json=payload)
if response.status_code == 200:
    result = response.json()
    print(result['choices'][0]['message']['content'])
else:
    print(f'请求失败：{response.status_code}')

4.3 多语言SDK支持

除了Python之外，腾讯云HAI还提供了多种编程语言的SDK支持。目前已经覆盖的编程语言包括Node.js、PHP、.NET等。从4.0.714版本开始，腾讯云Node.js SDK支持使用泛用性的API调用方式，开发者只需安装tencentcloud-sdk-nodejs-common包，即可向任何产品发起调用。PHP SDK要求PHP 5.6.0及以上版本，使用时需要从腾讯云控制台获取SecretID、SecretKey以及调用地址endpoint（hai.tencentcloudapi.com）。.NET开发者则可以通过NuGet包管理器安装TencentCloudSDK.Hai包来集成HAI服务。

所有语言的SDK都采用了统一化的设计理念，具有相同的接口调用方式、统一的错误码和返回包格式，大大降低了多语言开发场景下的学习成本。

5. 热门模型部署实战

HAI预置了多款热门AI模型的一键部署模板，让用户无需任何配置即可在几分钟内获得生产可用的模型服务。

5.1 部署DeepSeek大模型

DeepSeek是目前备受关注的开源大语言模型系列。腾讯云HAI自2026年2月起支持DeepSeek全系列模型的快速部署，从1.5B到671B参数规模均可一键启动。

在HAI控制台新建实例时，选择DeepSeek-R1或DeepSeek-V3等应用模板，系统自动完成模型下载、环境配置和服务启动。整个过程在3分钟内完成。部署完成后，用户可以通过WebUI界面直接与模型对话，也可以通过API接口将模型能力集成到自有应用中。

HAI还支持企业基于DeepSeek构建专属知识库与智能客服系统。通过结合Dify等AI Agent开发框架，用户可以快速搭建面向特定业务场景的智能问答系统。

5.2 部署Stable Diffusion文生图服务

Stable Diffusion是目前最流行的开源文生图模型之一。HAI提供了Stable Diffusion WebUI和ComfyUI两种部署选项。

在HAI控制台中选择Stable Diffusion WebUI应用模板，配置地域和算力套餐后即可完成部署。部署完成后，用户可以通过WebUI界面进行文生图、图生图、模型切换等操作。对于需要将AI绘画能力集成到业务系统的场景，HAI的Stable Diffusion服务提供了标准的API接口。外部应用可以通过HTTP请求调用该接口，实现批量图片生成、自动化设计等高级功能。

HAI的Stable Diffusion部署方案还支持动态更新模型版本，确保用户始终可以使用最新的模型能力。

5.3 部署ChatGLM对话模型

ChatGLM是清华团队开源的优秀中英双语大语言模型。HAI提供了ChatGLM2-6B和ChatGLM3-6B等多个版本的一键部署支持。

部署完成后，用户可以通过Gradio WebUI界面与模型进行对话交互。HAI的ChatGLM实例预置了完整的推理优化配置，包括模型量化、批处理等，能够在保证生成质量的同时最大化推理效率。

6. 权限管理与安全配置

在生产环境中使用HAI服务时，权限管理和安全配置是不可忽视的重要环节。HAI提供了完善的访问控制机制，支持通过腾讯云访问管理进行精细化权限管理。

6.1 子账号授权

企业用户通常需要为不同的团队成员分配不同的操作权限。通过访问管理控制台，管理员可以创建自定义策略，精确控制子账号对HAI资源的访问权限。

例如，可以创建一个只读策略，允许某些成员查看HAI实例状态但不允许创建或销毁实例。也可以创建一个开发策略，允许开发人员创建和管理自己的实例但不允许修改计费相关配置。策略可以通过可视化策略生成器创建，无需编写复杂的JSON语法。

6.2 网络安全

HAI实例的网络访问可以通过多种方式进行控制。在创建HAI可信集群时，用户可以选择公共网络或专属VPC两种网络配置方式。公共网络方式适合快速对外提供服务，实例会获得公网IP地址，外部应用可以直接访问。专属VPC方式则适用于对网络隔离和安全性有较高要求的业务场景，实例部署在用户的私有网络中，仅允许内网访问。

对于通过API调用的场景，建议使用API密钥进行身份认证，并定期轮换密钥以确保安全。同时应遵循最小权限原则，只为应用分配必需的权限，避免使用主账号密钥进行日常操作。

7. 成本优化与计费说明

合理规划HAI的使用方式可以有效控制成本。HAI支持按量计费和包年包月两种计费模式。

7.1 计费模式

按量计费模式适合开发测试和弹性业务场景，用户只需为实际使用的时长付费。以GPU基础型为例，每小时费用约为1.8元。包年包月模式则适合长期稳定的生产环境，预付费用通常比按量计费更具价格优势。

HAI的算力套餐价格会随市场情况进行调整。建议用户在创建实例前通过控制台查看当前的实时价格，并根据业务需求选择最合适的套餐和计费模式。

7.2 成本优化建议

首先是合理选择算力套餐，避免过度配置。对于8B以下的小参数模型，选择GPU基础型即可满足需求。对于32B以下的中等规模模型，GPU进阶型是性价比不错的选择。只有在大规模模型推理场景下才需要考虑GPU高阶型套餐。

其次是充分利用HAI的弹性能力。对于非持续运行的业务场景，可以在不使用时销毁实例以停止计费，需要时再重新创建。HAI的分钟级部署能力使得这种按需使用模式非常高效。

第三是关注腾讯云不定期推出的优惠活动。例如在特定采购季，HAI服务可能提供0.8折起的优惠价格。

8. 常见问题问答

问1：HAI与传统GPU云服务器有什么区别？

HAI在GPU云服务器的基础上进行了深度封装，预装了操作系统、GPU驱动、CUDA、cuDNN、深度学习框架和热门AI模型。用户无需进行任何环境配置即可开始使用，部署时间从传统的数小时甚至数天缩短到1-3分钟。HAI还提供了JupyterLab、WebUI等图形化访问方式，大幅降低了使用门槛。

问2：HAI支持哪些AI模型和框架？

HAI预置了DeepSeek全系列（1.5B至671B）、ChatGLM-6B、Llama2、Stable Diffusion等热门模型。在框架层面，HAI支持PyTorch、TensorFlow等主流深度学习框架。此外，HAI还提供了WebUI、ComfyUI等可视化交互界面。

问3：如何将HAI上部署的模型集成到我的应用程序中？

HAI提供了标准的API接口供外部应用调用。以Stable Diffusion为例，应用可以通过HTTP POST请求向HAI实例的API地址发送请求，传入提示词等参数，即可获得生成的图片数据。对于大语言模型，HAI通常提供兼容OpenAI API格式的接口。腾讯云还提供了Python、Node.js、PHP、.NET等多语言SDK，方便不同技术栈的应用集成。

问4：HAI实例创建后如何获取登录信息？

对于SSH登录方式，系统会在实例创建成功后通过站内信推送登录所需的用户名、密码和公网IP地址。对于JupyterLab和WebUI方式，用户可以直接在HAI控制台中点击对应的连接按钮即可访问，无需额外的凭证信息。

问5：HAI的计费方式是怎样的？如何控制成本？

HAI支持按量计费和包年包月两种模式。按量计费按实际使用时长计费，适合开发测试场景。包年包月需要预付费用，适合长期稳定的生产环境。控制成本的建议包括：根据模型规模选择合适的算力套餐避免过度配置，非持续运行时及时销毁实例，以及关注腾讯云的优惠活动。

问6：HAI支持团队协作和权限管理吗？

支持。通过腾讯云访问管理，管理员可以创建子账号并为不同成员分配不同的操作权限。例如可以创建只读策略、开发策略、管理员策略等，实现精细化的权限控制。建议遵循最小权限原则，避免使用主账号进行日常操作。