腾讯云高性能应用服务HAI对接使用完全指南:从零部署到API集成
1. 认识腾讯云高性能应用服务HAI
在AI应用从概念验证走向生产部署的过程中,算力获取与环境配置始终是两道绕不开的门槛。传统的GPU服务器采购流程涉及硬件选型、驱动安装、CUDA版本适配、深度学习框架编译等一系列繁琐操作,往往需要数天甚至数周才能搭建出一个可用的开发环境。腾讯云高性能应用服务HAI的推出,正是为了从根本上解决这一痛点。
HAI全称为Hyper Application Inventor,是一款面向AI与科学计算的GPU/NPU应用服务产品。它的核心定位是提供即插即用的强大算力和预置环境,帮助中小企业和开发者快速部署大语言模型、AI绘图、数据科学等高性能应用。与传统的GPU云服务器不同,HAI并非简单地提供一台裸金属或虚拟机的计算资源,而是将算力、开发环境、模型应用三层能力进行了深度融合,实现了从底层硬件到上层应用的全链路封装。
HAI的产品设计理念可以用四个关键词来概括。第一个是开箱即用,系统内置了多种操作系统、GPU驱动、CUDA、cuDNN等基础组件,并预装了PyTorch、TensorFlow等主流AI框架,用户无需关心底层环境的任何细节。第二个是分钟级部署,依托云原生快照技术,将动辄几十GB的AIGC环境压缩至1到2分钟内完成部署,对比传统镜像拉取方式效率提升了十倍。第三个是智能算力匹配,系统屏蔽了可用区、VPC等复杂云计算概念,根据用户选择的应用类型自动匹配最佳性价比的算力资源。第四个是多种访问方式,除传统的SSH登录外,还提供了JupyterLab、Gradio WebUI、Cloud Studio等图形化交互界面,让不同技术背景的用户都能找到适合自己的操作路径。
从产品架构来看,HAI构建于弹性GPU算力资源池之上,平台提供多样化的GPU配置,内置极简部署模块与教学友好型工具,并配备完善的云端安全稳定协作环境。在算力层面,HAI提供GPU基础型、GPU进阶型、GPU高阶型等多个档位的套餐选择,显存从16GB到768GB不等,算力从8+TFlops到352+TFlops,覆盖从1.5B小参数模型到671B超大模型的推理需求。在应用层面,HAI预置了DeepSeek全系列、ChatGLM、Llama2、Stable Diffusion等热门模型,用户只需点击几下鼠标即可完成部署。
需要先登录腾讯云控制台,点击:腾讯云控制台,还没有账号,点击:注册后再关联,已有账号点击:登录后再关联
2. 创建你的第一个HAI实例
使用HAI服务的第一步是创建实例。整个过程在控制台中完成,无需编写任何代码,即使是初次接触云服务的开发者也能在几分钟内完成。
2.1 前提准备
在创建HAI实例之前,需要确保已经完成了以下准备工作。首先是注册腾讯云账号并完成实名认证,这是使用任何腾讯云服务的基础。其次是确认账户余额充足,因为HAI实例采用按量计费或包年包月的计费模式,创建实例时会预先冻结部分费用。如果使用的是传统账户类型,还需要先完成账户升级才能购买HAI服务。
2.2 控制台创建流程
登录腾讯云控制台后,在页面顶部的搜索框中输入HAI,在搜索结果中点击高性能应用服务HAI,进入HAI服务页面。在服务页面中点击新建按钮,进入实例创建配置页面。
配置页面主要包含以下几个关键选项。首先是应用选择,HAI提供了丰富的预置应用模板,包括DeepSeek-R1、ChatGLM3-6B、Stable Diffusion WebUI、ComfyUI等。用户可以根据自己的业务需求选择对应的应用,系统会自动匹配该应用所需的运行环境。其次是地域选择,建议选择靠近目标客户的地域,以降低网络延迟。第三是算力套餐选择,HAI提供GPU基础型、GPU进阶型、GPU高阶型等多种套餐。GPU基础型配备16GB+显存和8+TFlops算力,适合运行8B及以下参数的模型。GPU进阶型提供24GB+或32GB+显存,算力达到15-30+TFlops,适合运行32B及以下参数的模型。GPU高阶型则提供48GB到768GB的显存配置,能够支撑70B到671B的超大规模模型推理。最后是实例名称和数量等基本信息配置。
完成配置后点击立即购买,系统会自动开始部署所选的模型应用。部署过程通常在1到3分钟内完成,届时实例状态会变为运行中,用户便可以通过多种方式访问该实例了。
2.3 通过API创建实例
除了通过控制台创建实例外,HAI也提供了完整的API接口,支持程序化地创建和管理实例。这对于需要批量创建实例或实现自动化运维的场景尤为重要。
创建实例的API接口是RunInstances,接口请求域名为hai.tencentcloudapi.com。该接口支持一次创建最多10个实例。以下是调用该接口的关键参数说明:
{
'Action': 'RunInstances',
'Version': '2023-08-12',
'Region': 'ap-guangzhou',
'ApplicationId': 'app-jknfna',
'BundleType': 'XL',
'SystemDisk': {
'DiskType': 'CLOUD_PREMIUM',
'DiskSize': 250
},
'InstanceCount': 1,
'InstanceName': 'my-hai-instance'
}其中ApplicationId参数需要通过DescribeApplications接口获取,BundleType参数用于指定算力套餐类型,可选值包括XL、XL_2X、3XL、3XL_2X、4XL等。
腾讯云提供了API Explorer工具,用户可以在线调用API接口并自动生成各语言版本的SDK调用示例。API Explorer支持签名验证、在线调试和快速检索接口等能力,是开发者调试API的得力助手。
3. 访问HAI实例的三种方式
HAI实例创建成功后,用户可以通过多种方式访问实例进行开发和调试。根据不同的使用场景和技术背景,HAI提供了三种主要的访问方式:JupyterLab、WebUI和SSH。
3.1 通过JupyterLab访问
JupyterLab是最受数据科学家和AI开发者欢迎的访问方式之一。在HAI控制台的算力管理页面中,选择算力连接下的JupyterLab选项,即可打开JupyterLab界面。
HAI实例预置的JupyterLab环境包含了完整的AI开发工具链。以典型的HAI实例为例,系统自带Ubuntu 20.04操作系统、Python 3.10、PyTorch 2.5.1、CUDA 12.4、cuDNN 9等组件。用户可以直接在Jupyter Notebook中编写和运行Python代码,调用预置的AI模型进行推理或微调。这种访问方式特别适合需要进行交互式数据探索、模型实验和代码原型开发的场景。
在JupyterLab中,用户还可以打开终端(Terminal),执行命令行操作,安装额外的Python包或系统工具。这使得JupyterLab不仅是一个交互式编程环境,更是一个功能完整的云端开发工作站。
3.2 通过WebUI访问
对于不熟悉编程或者希望快速体验模型功能的用户,HAI提供了基于Gradio或ChatbotUI的WebUI访问方式。在HAI控制台中选择算力连接下的Gradio WebUI或ChatbotUI,即可打开一个图形化的交互界面。
以大语言模型为例,WebUI界面通常包含一个对话输入框和模型参数调节选项。用户可以在界面中直接输入问题,模型会实时生成回复。界面右下角通常还提供了Maximum length、Top P、Temperature等参数调节选项。Maximum length控制生成文本的长度,增加该值会允许模型生成更长的文本。Top P影响生成文本的多样性和集中度,调高该值会使生成的文本更加多样化。Temperature控制生成文本的创造性和稳定性,调高该值适合需要创意输出的场景,调低该值则适合需要精确和一致性结果的场景。
对于Stable Diffusion等AI绘画模型,WebUI界面则提供了文生图、图生图、模型切换、参数调节等丰富功能,用户可以通过图形界面完成从提示词输入到图片生成的全流程。
3.3 通过SSH访问
对于需要深度定制环境或进行系统级操作的高级用户,HAI也支持传统的SSH访问方式。在实例创建成功后,系统会通过站内信的方式推送登录所需的配置信息,包括默认用户名、登录密码和公网IP地址。用户可以使用这些信息通过SSH客户端登录到实例,获得完整的Linux shell访问权限。
SSH访问方式提供了最大的灵活性,用户可以在实例上安装任何所需的软件、修改系统配置、部署自定义的服务等。但这种方式也要求用户具备一定的Linux系统运维能力,适合有经验的技术人员使用。
4. 通过API和SDK对接HAI服务
将HAI的AI能力集成到自有业务系统中,是大多数企业用户的最终目标。HAI提供了完整的API接口和多语言SDK,支持程序化地调用部署在HAI实例上的模型服务。
4.1 获取服务调用信息
在HAI中部署模型服务后,系统会生成相应的调用地址和认证凭证。用户可以通过HAI控制台或API接口获取这些信息。对于通过HAI可信集群部署的模型服务,系统会提供一个标准的API调用地址以及访问所需的token。
以Stable Diffusion为例,模型部署成功后,系统会开放一个HTTP接口,通常位于实例IP的特定端口上(如7862)。外部应用可以通过向该接口发送HTTP请求来调用模型服务。
4.2 Python SDK调用示例
Python是AI开发中最常用的编程语言,腾讯云提供了完整的Python SDK支持HAI服务的调用。以下是一个调用HAI上部署的Stable Diffusion模型进行文生图的代码示例:
import requests
import base64
from PIL import Image
from io import BytesIO
# HAI实例上部署的Stable Diffusion API地址
api_url = 'http://your_hai_ip:7862/sdapi/v1/txt2img'
# 构造请求参数
payload = {
'prompt': 'a beautiful sunset over the ocean, digital art',
'negative_prompt': 'blurry, bad quality',
'steps': 20,
'width': 512,
'height': 512,
'cfg_scale': 7
}
# 发送POST请求
response = requests.post(api_url, json=payload)
if response.status_code == 200:
result = response.json()
# 获取返回的base64编码图片
image_data = result['images'][0]
# 解码base64得到二进制图片数据
image_bytes = base64.b64decode(image_data)
# 转换为PIL Image对象
image = Image.open(BytesIO(image_bytes))
# 保存图片
image.save('generated_image.png')
print('图片生成成功,已保存为generated_image.png')
else:
print(f'请求失败,状态码:{response.status_code}')这段代码展示了如何向HAI上部署的Stable Diffusion服务发送文生图请求。请求参数中的prompt是描述想要生成图片内容的文本提示词,negative_prompt则用于指定不希望出现在图片中的元素。steps控制扩散步数,步数越多生成的图片质量通常越高但耗时也更长。width和height指定输出图片的尺寸。cfg_scale控制文本提示对生成结果的引导强度。
对于大语言模型,调用方式类似。以DeepSeek为例,HAI实例上通常会部署兼容OpenAI API格式的接口。用户可以使用OpenAI的Python SDK或者直接通过HTTP请求调用:
import requests
# HAI实例上部署的DeepSeek API地址
api_url = 'http://your_hai_ip:8000/v1/chat/completions'
payload = {
'model': 'deepseek-chat',
'messages': [
{'role': 'system', 'content': 'You are a helpful assistant.'},
{'role': 'user', 'content': '请介绍一下腾讯云HAI服务'}
],
'temperature': 0.7,
'max_tokens': 1024
}
response = requests.post(api_url, json=payload)
if response.status_code == 200:
result = response.json()
print(result['choices'][0]['message']['content'])
else:
print(f'请求失败:{response.status_code}')4.3 多语言SDK支持
除了Python之外,腾讯云HAI还提供了多种编程语言的SDK支持。目前已经覆盖的编程语言包括Node.js、PHP、.NET等。从4.0.714版本开始,腾讯云Node.js SDK支持使用泛用性的API调用方式,开发者只需安装tencentcloud-sdk-nodejs-common包,即可向任何产品发起调用。PHP SDK要求PHP 5.6.0及以上版本,使用时需要从腾讯云控制台获取SecretID、SecretKey以及调用地址endpoint(hai.tencentcloudapi.com)。.NET开发者则可以通过NuGet包管理器安装TencentCloudSDK.Hai包来集成HAI服务。
所有语言的SDK都采用了统一化的设计理念,具有相同的接口调用方式、统一的错误码和返回包格式,大大降低了多语言开发场景下的学习成本。
5. 热门模型部署实战
HAI预置了多款热门AI模型的一键部署模板,让用户无需任何配置即可在几分钟内获得生产可用的模型服务。
5.1 部署DeepSeek大模型
DeepSeek是目前备受关注的开源大语言模型系列。腾讯云HAI自2026年2月起支持DeepSeek全系列模型的快速部署,从1.5B到671B参数规模均可一键启动。
在HAI控制台新建实例时,选择DeepSeek-R1或DeepSeek-V3等应用模板,系统自动完成模型下载、环境配置和服务启动。整个过程在3分钟内完成。部署完成后,用户可以通过WebUI界面直接与模型对话,也可以通过API接口将模型能力集成到自有应用中。
HAI还支持企业基于DeepSeek构建专属知识库与智能客服系统。通过结合Dify等AI Agent开发框架,用户可以快速搭建面向特定业务场景的智能问答系统。
5.2 部署Stable Diffusion文生图服务
Stable Diffusion是目前最流行的开源文生图模型之一。HAI提供了Stable Diffusion WebUI和ComfyUI两种部署选项。
在HAI控制台中选择Stable Diffusion WebUI应用模板,配置地域和算力套餐后即可完成部署。部署完成后,用户可以通过WebUI界面进行文生图、图生图、模型切换等操作。对于需要将AI绘画能力集成到业务系统的场景,HAI的Stable Diffusion服务提供了标准的API接口。外部应用可以通过HTTP请求调用该接口,实现批量图片生成、自动化设计等高级功能。
HAI的Stable Diffusion部署方案还支持动态更新模型版本,确保用户始终可以使用最新的模型能力。
5.3 部署ChatGLM对话模型
ChatGLM是清华团队开源的优秀中英双语大语言模型。HAI提供了ChatGLM2-6B和ChatGLM3-6B等多个版本的一键部署支持。
部署完成后,用户可以通过Gradio WebUI界面与模型进行对话交互。HAI的ChatGLM实例预置了完整的推理优化配置,包括模型量化、批处理等,能够在保证生成质量的同时最大化推理效率。
6. 权限管理与安全配置
在生产环境中使用HAI服务时,权限管理和安全配置是不可忽视的重要环节。HAI提供了完善的访问控制机制,支持通过腾讯云访问管理进行精细化权限管理。
6.1 子账号授权
企业用户通常需要为不同的团队成员分配不同的操作权限。通过访问管理控制台,管理员可以创建自定义策略,精确控制子账号对HAI资源的访问权限。
例如,可以创建一个只读策略,允许某些成员查看HAI实例状态但不允许创建或销毁实例。也可以创建一个开发策略,允许开发人员创建和管理自己的实例但不允许修改计费相关配置。策略可以通过可视化策略生成器创建,无需编写复杂的JSON语法。
6.2 网络安全
HAI实例的网络访问可以通过多种方式进行控制。在创建HAI可信集群时,用户可以选择公共网络或专属VPC两种网络配置方式。公共网络方式适合快速对外提供服务,实例会获得公网IP地址,外部应用可以直接访问。专属VPC方式则适用于对网络隔离和安全性有较高要求的业务场景,实例部署在用户的私有网络中,仅允许内网访问。
对于通过API调用的场景,建议使用API密钥进行身份认证,并定期轮换密钥以确保安全。同时应遵循最小权限原则,只为应用分配必需的权限,避免使用主账号密钥进行日常操作。
7. 成本优化与计费说明
合理规划HAI的使用方式可以有效控制成本。HAI支持按量计费和包年包月两种计费模式。
7.1 计费模式
按量计费模式适合开发测试和弹性业务场景,用户只需为实际使用的时长付费。以GPU基础型为例,每小时费用约为1.8元。包年包月模式则适合长期稳定的生产环境,预付费用通常比按量计费更具价格优势。
HAI的算力套餐价格会随市场情况进行调整。建议用户在创建实例前通过控制台查看当前的实时价格,并根据业务需求选择最合适的套餐和计费模式。
7.2 成本优化建议
首先是合理选择算力套餐,避免过度配置。对于8B以下的小参数模型,选择GPU基础型即可满足需求。对于32B以下的中等规模模型,GPU进阶型是性价比不错的选择。只有在大规模模型推理场景下才需要考虑GPU高阶型套餐。
其次是充分利用HAI的弹性能力。对于非持续运行的业务场景,可以在不使用时销毁实例以停止计费,需要时再重新创建。HAI的分钟级部署能力使得这种按需使用模式非常高效。
第三是关注腾讯云不定期推出的优惠活动。例如在特定采购季,HAI服务可能提供0.8折起的优惠价格。
8. 常见问题问答
问1:HAI与传统GPU云服务器有什么区别?
HAI在GPU云服务器的基础上进行了深度封装,预装了操作系统、GPU驱动、CUDA、cuDNN、深度学习框架和热门AI模型。用户无需进行任何环境配置即可开始使用,部署时间从传统的数小时甚至数天缩短到1-3分钟。HAI还提供了JupyterLab、WebUI等图形化访问方式,大幅降低了使用门槛。
问2:HAI支持哪些AI模型和框架?
HAI预置了DeepSeek全系列(1.5B至671B)、ChatGLM-6B、Llama2、Stable Diffusion等热门模型。在框架层面,HAI支持PyTorch、TensorFlow等主流深度学习框架。此外,HAI还提供了WebUI、ComfyUI等可视化交互界面。
问3:如何将HAI上部署的模型集成到我的应用程序中?
HAI提供了标准的API接口供外部应用调用。以Stable Diffusion为例,应用可以通过HTTP POST请求向HAI实例的API地址发送请求,传入提示词等参数,即可获得生成的图片数据。对于大语言模型,HAI通常提供兼容OpenAI API格式的接口。腾讯云还提供了Python、Node.js、PHP、.NET等多语言SDK,方便不同技术栈的应用集成。
问4:HAI实例创建后如何获取登录信息?
对于SSH登录方式,系统会在实例创建成功后通过站内信推送登录所需的用户名、密码和公网IP地址。对于JupyterLab和WebUI方式,用户可以直接在HAI控制台中点击对应的连接按钮即可访问,无需额外的凭证信息。
问5:HAI的计费方式是怎样的?如何控制成本?
HAI支持按量计费和包年包月两种模式。按量计费按实际使用时长计费,适合开发测试场景。包年包月需要预付费用,适合长期稳定的生产环境。控制成本的建议包括:根据模型规模选择合适的算力套餐避免过度配置,非持续运行时及时销毁实例,以及关注腾讯云的优惠活动。
问6:HAI支持团队协作和权限管理吗?
支持。通过腾讯云访问管理,管理员可以创建子账号并为不同成员分配不同的操作权限。例如可以创建只读策略、开发策略、管理员策略等,实现精细化的权限控制。建议遵循最小权限原则,避免使用主账号进行日常操作。




