华为云Flexus企业搜索服务(KooSearch)对接与使用全指南
华为云Flexus企业搜索服务(KooSearch)对接与使用全指南
在数字化转型浪潮下,企业非结构化数据(文档、PDF、图片、网页等)呈爆发式增长,传统数据库检索难以满足高效、精准、智能的搜索需求。华为云Flexus企业搜索服务(简称KooSearch)是基于Elasticsearch与盘古大模型构建的托管式智能搜索服务,主打开箱即用、低门槛、高性价比,支持关键词检索、语义搜索、文档问答、RAG知识库构建等核心能力,广泛应用于企业知识库、智能客服、文档检索平台、内容管理系统等场景。本文将从基础概念、服务开通、网络配置、控制台操作、API对接、高级实践、安全与成本优化等维度,全面讲解KooSearch的对接与使用方法,全程融入实操步骤与代码示例,帮助企业快速落地智能搜索业务。
一、Flexus企业搜索服务(KooSearch)核心概述
1.1 产品定位与核心能力
KooSearch是华为云Flexus云服务体系中的核心组件,面向中小企业与开发者,提供一站式智能搜索与RAG(检索增强生成)解决方案,无需自建集群、无需维护底层引擎,全程托管运维,大幅降低技术门槛与运维成本。其核心能力包括:
- 分布式检索:基于Elasticsearch的分布式架构,支持海量数据(千万级文档)的毫秒级检索,兼容结构化、非结构化数据。
- 语义搜索:集成华为盘古大模型向量能力,突破传统关键词匹配局限,支持语义理解、意图识别、多轮对话,提升搜索相关性。
- 文档问答:内置大语言模型,支持PDF、Word、PPT、图片等多格式文档解析,自动提取关键信息,生成精准问答答案。
- OCR增强:对接华为云OCR服务,支持扫描件、图片中的文字识别与表格解析,解决非结构化文档的智能解析难题。
- 灵活扩展:支持自定义模型服务、对接MaaS大模型、API网关发布,适配企业二次开发与业务集成需求。
1.2 版本规格与适用场景
KooSearch提供两大版本,企业可根据业务需求选择,核心差异如下:
| 版本类型 | 核心能力 | 适用场景 |
|---|---|---|
| 智能搜索版 | 开箱即用知识库、向量检索、关键词搜索、基础统计分析 | 企业内部文档检索、官网站内搜索、电商商品搜索、知识库管理 |
| 智能问答版 | 内置盘古大模型、RAG服务、文档问答、多轮对话、OCR增强 | 智能客服、数字员工、企业助手、文档问答平台、RAG知识库 |
目前KooSearch仅支持西南-贵阳一区域开通与使用,购买时长支持1个月至1年,包年更优惠,支持自动续费。
二、服务开通与基础环境准备
2.1 前提条件
开通KooSearch前,需满足以下条件:
- 拥有华为云账号,完成实名认证;
- 账号权限充足(建议管理员权限);
- 选择西南-贵阳一区域,准备VPC、子网、安全组资源(可新建);
- 如需OCR增强或MaaS对接,提前开通对应服务(OCR、ModelArts Studio)。
需要先登录华为云控制台,点击:华为云控制台,还没有账号,点击:注册并关联,已有账号点击:登录后关联
2.2 开通Flexus企业搜索服务(KooSearch)
服务开通是对接的第一步,全程在华为云控制台操作,步骤如下:
- 登录华为云控制台,搜索“云搜索服务”,进入管理控制台;
- 左侧导航栏选择「KooSearch > Flexus企业搜索服务」,进入服务页面;
- 点击右上角「购买Flexus企业搜索服务」,进入配置页面;
- 配置核心参数:
- 区域:固定选择「西南-贵阳一」;
- 版本规格:根据需求选择「智能搜索版」或「智能问答版」;
- 实例名称:4-16位,字母开头,支持字母、数字、中划线、下划线;
- OCR增强:按需勾选(勾选后需授权OCR服务,额外计费);
- 网络配置:选择已有VPC、子网、安全组(建议新建独立VPC,保障网络隔离);
- 购买时长:选择1个月/3个月/1年,勾选自动续费(可选);
- 确认配置无误,点击「立即购买」→「去支付」,完成支付后,等待实例创建(约5-10分钟);
- 实例状态显示「运行中」,表示开通成功,可进入KooSearch控制台操作。
2.3 网络配置(NAT网关,必选)
KooSearch实例默认部署在私有网络内,需配置公网NAT网关,实现实例与OCR、MaaS等服务的网络互通,步骤如下:
- 登录华为云控制台,搜索「NAT网关」,进入管理控制台;
- 点击「购买公网NAT网关」,配置参数:
- 计费模型:按需计费(KooSearch为离线服务);
- 区域:西南-贵阳一(与KooSearch实例同区域);
- VPC/子网:与KooSearch实例同VPC、同子网;
- 点击「立即购买」→「提交」,等待网关创建(状态显示「运行中」);
- 添加SNAT规则:网关列表→「设置规则」→「添加SNAT规则」,配置:
- 使用场景:虚拟私有云;
- 网段:选择KooSearch实例所在VPC;
- 公网IP类型:弹性公网IP(按需申请,带宽建议20Mbit/s);
- 点击「确定」,完成网络配置,确保实例可访问公网服务。
三、KooSearch控制台核心操作(知识库+数据管理)
控制台是KooSearch的核心操作入口,支持知识库创建、文档上传、搜索问答体验、模型管理等功能,是对接前的基础配置环节。
3.1 进入KooSearch控制台
- 云搜索服务控制台→「KooSearch > Flexus企业搜索服务」;
- 找到已创建的实例,点击操作列「问答」,进入KooSearch专属控制台。
3.2 创建知识库(核心载体)
知识库是KooSearch存储与管理数据的核心单元,所有文档、FAQ、结构化数据均需存入知识库,步骤如下:
- 左侧导航栏→「知识库管理」→右上角「新建知识库」;
- 基础设置:填写知识库名称、选择语言(中文/英文)、填写描述,点击「下一步」;
- 解析拆分设置:
- 开启「OCR增强」(如需解析图片、扫描件、表格);
- 配置拆分规则:默认按段落拆分,可自定义拆分长度(建议512字符)、重叠长度(建议128字符);
- 模型设置(智能问答版):
- Embedding模型:选择盘古文本向量模型(默认);
- 精排模型:开启后提升搜索相关性(默认开启);
- NLP模型:选择内置盘古大模型(默认),支持自定义对接MaaS模型;
- 高级设置:开启「知识库缓存」(提升搜索速度)、配置相关性阈值(默认0.5),点击「确定」,完成知识库创建。
3.3 数据导入(文档/FAQ/结构化数据)
KooSearch支持多格式数据导入,满足不同场景需求,核心导入方式如下:
3.3.1 上传文档(最常用)
支持格式:.doc、.docx、.pdf、.pptx、.xlsx、.csv、.txt、.png、.jpg等,单个文档≤128MB(>60MB建议API上传),图片≤10MB。
- 知识库管理→选择目标知识库→「文档管理」→「上传」;
- 点击「选择文档」,本地选择文件(支持批量上传);
- 确认上传,等待解析(状态显示「正常」即完成,解析时间与文档大小相关)。
3.3.2 创建/批量导入FAQ
用于问答场景,支持手动创建或批量导入(xlsx/xls格式):
- 文档管理→「FAQ管理」→「创建FAQ」,手动填写问题与答案;
- 批量导入:「批量导入FAQ」→上传Excel模板(含问题、答案列)→确认导入。
3.3.3 上传结构化数据
支持UTF-8编码JSON文件,单个文件≤2MB,用于结构化数据检索:
- 文档管理→「结构化数据」→「上传」;
- 选择JSON文件(格式:[{"title":"标题","content":"内容"}])→确认上传。
3.4 控制台搜索与问答体验
数据导入完成后,可直接在控制台测试搜索与问答效果,验证配置是否生效:
- 左侧导航栏→「体验平台」→右上角「资料来源」,勾选目标知识库→「确定」;
- 搜索体验:切换至「搜索」,输入关键词(如“华为云KooSearch优势”),查看返回结果(含相关性评分、高亮片段);
- 问答体验:切换至「问答」,输入自然语言问题(如“KooSearch支持哪些文档格式”),查看大模型生成的精准答案;
- 多轮对话:支持上下文关联,追问细节(如“最大支持单个文档多大”),验证对话连贯性。
四、API网关配置与API对接(核心集成方式)
控制台操作仅适用于测试与轻量场景,企业业务系统集成需通过API网关发布KooSearch接口,实现安全、稳定的远程调用,支持RESTful API,兼容Python、Java、Go、JavaScript等多语言。
4.1 配置API网关(必选)
- 进入KooSearch控制台→左侧「API管理」→「配置API网关」;
- 选择API网关实例(新建或已有),配置域名、协议(HTTPS);
- 创建APP凭据:API网关→「凭据管理」→「创建凭据」,生成AppKey与AppSecret(用于接口鉴权);
- 绑定凭据:KooSearch API管理→「绑定凭据」,选择创建的APP凭据。
4.2 发布KooSearch API
- API管理→「发布API」,选择接口类型(搜索接口/问答接口);
- 配置接口参数:路径、请求方法(POST)、超时时间(默认30s);
- 设置鉴权方式:推荐「APP认证」(安全可靠),禁用「华为IAM认证」(存在恶意刷流量风险);
- 点击「发布」,等待状态变为「已发布」,获取API调用地址。
4.3 多语言API调用代码示例
以下提供Python、Java、JavaScript三种常用语言的调用示例,实现搜索与问答功能,参数需替换为实际信息(API地址、AppKey、AppSecret、知识库ID)。
4.3.1 Python调用示例
import requests
import json
# 配置信息(替换为实际值)
API_URL = "https://xxx.apigw.huaweicloud.com/koosearch/v1/query"
APP_KEY = "your_app_key"
APP_SECRET = "your_app_secret"
KNOWLEDGE_ID = "your_knowledge_id"
def koosearch_search(query):
headers = {
"Content-Type": "application/json",
"X-AppKey": APP_KEY,
"X-AppSecret": APP_SECRET
}
data = {
"knowledge_id": KNOWLEDGE_ID,
"query": query,
"topk": 5, # 返回结果数
"threshold": 0.5 # 相关性阈值
}
try:
response = requests.post(API_URL, headers=headers, json=data)
response.raise_for_status()
result = response.json()
print("搜索结果:", json.dumps(result, ensure_ascii=False, indent=2))
return result
except requests.exceptions.RequestException as e:
print(f"调用失败:{e}")
return None
# 测试搜索
if __name__ == "__main__":
koosearch_search("华为云KooSearch对接方法")
4.3.2 Java调用示例
import com.alibaba.fastjson.JSON;
import org.apache.http.client.ClientProtocolException;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.entity.StringEntity;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import java.io.IOException;
import java.util.HashMap;
import java.util.Map;
public class KooSearchDemo {
// 配置信息(替换为实际值)
private static final String API_URL = "https://xxx.apigw.huaweicloud.com/koosearch/v1/query";
private static final String APP_KEY = "your_app_key";
private static final String APP_SECRET = "your_app_secret";
private static final String KNOWLEDGE_ID = "your_knowledge_id";
public static void main(String[] args) {
try (CloseableHttpClient httpClient = HttpClients.createDefault()) {
HttpPost httpPost = new HttpPost(API_URL);
// 设置请求头
httpPost.setHeader("Content-Type", "application/json");
httpPost.setHeader("X-AppKey", APP_KEY);
httpPost.setHeader("X-AppSecret", APP_SECRET);
// 设置请求体
Map data = new HashMap<>();
data.put("knowledge_id", KNOWLEDGE_ID);
data.put("query", "华为云KooSearch对接方法");
data.put("topk", 5);
data.put("threshold", 0.5);
StringEntity entity = new StringEntity(JSON.toJSONString(data), "UTF-8");
httpPost.setEntity(entity);
// 发送请求
try (CloseableHttpResponse response = httpClient.execute(httpPost)) {
String result = EntityUtils.toString(response.getEntity(), "UTF-8");
System.out.println("搜索结果:" + result);
} catch (ClientProtocolException e) {
e.printStackTrace();
}
} catch (IOException e) {
e.printStackTrace();
}
}
}
4.3.3 JavaScript(Node.js)调用示例
const axios = require('axios');
// 配置信息(替换为实际值)
const API_URL = "https://xxx.apigw.huaweicloud.com/koosearch/v1/query";
const APP_KEY = "your_app_key";
const APP_SECRET = "your_app_secret";
const KNOWLEDGE_ID = "your_knowledge_id";
async function koosearchSearch(query) {
try {
const response = await axios.post(API_URL, {
knowledge_id: KNOWLEDGE_ID,
query: query,
topk: 5,
threshold: 0.5
}, {
headers: {
'Content-Type': 'application/json',
'X-AppKey': APP_KEY,
'X-AppSecret': APP_SECRET
}
});
console.log("搜索结果:", JSON.stringify(response.data, null, 2));
return response.data;
} catch (error) {
console.error("调用失败:", error.response ? error.response.data : error.message);
}
}
// 测试搜索
koosearchSearch("华为云KooSearch对接方法");
五、高级实践:OCR增强与MaaS大模型对接
5.1 OCR增强:文档智能解析(扫描件/图片/表格)
OCR增强是KooSearch的核心高级能力,对接华为云OCR服务,支持扫描件、图片、表格、公式的智能解析,解决非结构化文档的检索难题。
- 开通OCR服务:华为云控制台→搜索「文字识别OCR」→开通「智能文档解析」功能;
- 开启KooSearch OCR增强:实例配置→勾选「OCR增强」(创建实例时配置,已创建实例可在控制台修改);
- 知识库开启OCR:新建/编辑知识库→解析拆分设置→勾选「OCR增强」「解析图片」「解析表格」;
- 上传文档:上传扫描件、图片、PDF文档,KooSearch自动调用OCR服务解析文字与表格,生成可检索文本;
- 验证效果:搜索图片中的文字或表格内容,可精准返回结果。
5.2 对接MaaS大模型:自定义问答能力
KooSearch支持对接华为云ModelArts Studio(MaaS)大模型服务,自定义问答模型,适配行业场景(如金融、政务、医疗)。
- 部署MaaS模型:ModelArts Studio→选择模型(如DeepSeek)→创建「我的模型」→部署为模型服务,获取:
- API接口公网地址;
- 调用模型名称;
- AppCode(认证用);
- KooSearch新建模型服务:KooSearch控制台→模型管理→新建模型服务;
- 配置模型参数:
- 模型服务名称:自定义;
- 模型类型:NLP模型-昇腾云;
- 访问地址:MaaS模型API公网地址;
- 昇腾云模型名称:MaaS调用模型名称;
- 认证类型:自定义认证,添加请求头:X-Apig-AppCode: {MaaS AppCode};
- 绑定知识库:编辑知识库→模型设置→NLP模型服务→选择新建的MaaS模型;
- 自定义Prompt:知识库→更多设置→搜索增强自定义prompt,配置行业化提示词(如金融场景:“请结合金融文档,精准回答用户问题,引用原文数据”);
- 验证问答:体验平台测试问答,验证MaaS模型生成效果。
六、安全配置与成本优化
6.1 安全配置(必做)
- API鉴权:严格使用APP认证,禁止IAM认证,定期轮换AppKey与AppSecret;
- 网络隔离:KooSearch实例部署在私有VPC,安全组仅开放必要端口(如443);
- 数据加密:开启文档存储加密(控制台配置),传输使用HTTPS协议;
- 权限管控:使用IAM子账号,分配最小权限(如仅允许文档上传、搜索,禁止实例删除);
- 访问限流:API网关配置限流规则(如每秒10次请求),防止恶意攻击。
6.2 成本优化
- 版本选择:仅需搜索功能选「智能搜索版」,无需额外付费;
- 时长选择:长期使用(>9个月)选择包年,节省30%+费用;
- OCR按需使用:仅解析扫描件时开启OCR增强,避免不必要计费;
- 数据清理:定期删除无用文档,减少存储占用;
- 内网访问:业务系统与KooSearch同VPC时,使用内网地址访问,免公网流量费用。
七、常见问题与排查
- 实例创建失败:检查区域是否为西南-贵阳一、VPC子网是否存在、配额是否充足;
- 文档解析失败:检查文档格式是否支持、大小是否超限、OCR增强是否开启(扫描件);
- API调用失败:检查AppKey/AppSecret是否正确、API是否发布、网络是否连通、限流规则是否触发;
- 搜索结果不精准:调整相关性阈值、开启精排模型、优化文档拆分规则、补充高质量数据;
- 问答无答案:检查知识库是否绑定、文档是否正常解析、Prompt配置是否合理、MaaS模型是否正常运行。
八、总结
华为云Flexus企业搜索服务(KooSearch)以低门槛、高性价比、强能力的优势,为企业提供一站式智能搜索与RAG解决方案,无需自建集群、无需维护底层引擎,开箱即用,快速落地。本文从服务开通、网络配置、知识库管理、API对接、高级实践、安全与成本优化等维度,全面讲解了KooSearch的对接与使用方法,全程融入实操步骤与代码示例,覆盖从基础到高级的全流程需求。企业可基于KooSearch快速构建智能知识库、文档问答平台、智能客服等应用,释放非结构化数据价值,助力数字化转型。
常见问答
- 问:KooSearch支持哪些区域开通?
答:目前仅支持西南-贵阳一区域开通与使用。 - 问:KooSearch单个文档最大支持多大?
答:单个文档≤128MB,超过60MB建议通过API上传;图片≤10MB。 - 问:KooSearch是否支持语义搜索?
答:支持,集成华为盘古大模型向量能力,支持语义理解与意图识别。 - 问:对接MaaS大模型是否需要额外付费?
答:需要,MaaS大模型服务单独计费,KooSearch对接免费。 - 问:KooSearch API调用是否有免费额度?
答:新用户有免费试用额度,超出后按调用次数与流量计费。 - 问:KooSearch支持多轮对话吗?
答:支持,智能问答版内置大模型,支持上下文关联的多轮对话。



