Holo3-35B-A3B 开放权重本地部署与 GUI Agent 方案

本地部署 Holo3 构建企业级 GUI Agent
与 Computer Use 系统

Holo3 是 H Company 面向 GUI Agent 与 Computer Use 场景推出的新一代视觉语言模型。 开放权重版本 Holo3-35B-A3B 支持 web、desktop、mobile 场景下的界面理解、元素定位、任务导航与动作执行, 适合企业自动化、浏览器操作、表单处理与跨系统工作流。

35B
总参数
3B
激活参数
GUI Agent
核心定位
Holo3 Runtime
Transformers / vLLM
$ pip install transformers accelerate vllm
Dependencies installed
$ python app.py
Loading model: Hcompany/Holo3-35B-A3B
Mode: image-text-to-text
Task: GUI navigation / localization
Server started at http://0.0.0.0:8000
Self-host ready
能力
Vision
能力
Grounding
能力
Navigation
Open Weights
35B-A3B MoE

算力服务器推荐

面向 Holo3-35B-A3B 本地部署、GUI Agent 推理与企业自动化场景的配置建议

基础款

适用于本地测试、界面理解验证、元素定位实验与小规模自动化原型

消费级开发型

RTX 4090

原型验证
部署方式 量化 / 单机推理
推荐用途 元素定位
显存建议 24GB+
适合任务 截图理解
适用场景:PoC、桌面实验、网页截图理解、点击点位验证
高端工作站型

RTX 5090

推荐
部署方式 量化 / 多任务
推荐用途 导航推理
显存建议 32GB+
适合任务 Agent 原型
适用场景:浏览器自动化、业务流程验证、电脑操作代理原型

企业款

适用于企业级 GUI Agent、网页导航平台、表单与审批自动化

主流企业型

4×H200

主流企业级
部署方式 vLLM / 服务化
精度 BF16 / FP8
推荐用途 多用户调用
适合系统 GUI Agent 平台
适用场景:企业自动填单、知识系统操作、浏览器流程执行、RPA 增强
高性能服务器型

8×H100

高并发
部署方式 集群推理
主要能力 Navigation + Reasoning
推荐架构 API Gateway + Queue
适合任务 生产级自动化
适用场景:企业浏览器代理、跨系统任务流、业务软件自动操作、数字员工

旗舰款

适用于多租户 Computer Use 平台、企业 Agent Fabric 与大规模任务编排

平台化部署型

K8s + GPU Pool

平台化
核心组件 Scheduler / Tracing
能力侧重 可观测 / 审计
推荐架构 多租户隔离
支持功能 任务回放
适用场景:集团级自动化平台、统一浏览器代理底座、企业任务执行中台
自治执行型

Agent Fabric

顶级旗舰
部署方式 Multi-Agent Fabric
任务能力 跨系统编排
平台形态 自治操作平台
目标系统 Enterprise Ops
适用场景:企业数字员工、跨应用自动化、电脑使用智能体平台、运营中枢

应用场景分析

围绕 Holo3 的界面理解、元素定位、导航推理与动作执行能力构建企业应用

浏览器自动化

在复杂网页中执行搜索、点击、填写表单、跳转页面与多步任务,提升企业流程自动化能力。

核心能力 Navigation
推荐配置 4×L40S
适用:运营、电商、客服、采购

界面理解与定位

对截图、桌面界面、管理后台和业务软件进行视觉理解,精准识别可交互元素和动作目标。

核心能力 Grounding
推荐配置 4090 / 5090
适用:桌面软件、ERP、CRM、BPM

文档驱动操作

根据 PDF、邮件、截图和业务规则,从文档中提取信息后在多个系统中完成录入与处理。

核心能力 Vision + Action
推荐配置 H100 / H200
适用:财务、采购、人力、法务

跨系统任务流

在多个应用之间切换执行任务,例如读取报价单、校验预算、发送审批邮件和回写记录。

核心能力 Multi-App Workflow
推荐配置 8×H100
适用:企业运营、共享服务、流程中心

企业数字员工

通过 Holo3 构建可观察、可审计、可回放的企业数字员工,提升标准化流程处理效率。

核心能力 Enterprise Readiness
推荐配置 K8s + GPU Pool
适用:集团中台、共享中心、运营平台

网页与桌面混合代理

同时理解浏览器页面、桌面程序和移动端界面,支撑更复杂的全流程业务自动化能力。

核心能力 Web / Desktop / Mobile
推荐配置 企业款以上
适用:复杂业务链路、跨端操作、混合办公

Holo3 本地部署指南

基于开放权重 Holo3-35B-A3B 构建本地 GUI Agent 推理服务与企业自动化系统

1

环境准备与依赖安装

安装 Python、PyTorch、Transformers 和 vLLM,为 Holo3 本地推理与服务化部署准备环境。

# 创建虚拟环境
python -m venv holo3-env
source holo3-env/bin/activate

# 安装依赖
pip install torch torchvision torchaudio
pip install transformers accelerate sentencepiece vllm

# 验证 GPU
python -c "import torch; print(torch.cuda.is_available())"
2

下载 Holo3-35B-A3B 模型

从 Hugging Face 下载开放权重版本 Holo3-35B-A3B,用于本地视觉导航与 GUI Agent 推理。

from huggingface_hub import snapshot_download

model_dir = snapshot_download(
    repo_id="Hcompany/Holo3-35B-A3B",
    local_dir="./models/holo3-35b-a3b",
    local_dir_use_symlinks=False
)

print("Model downloaded to:", model_dir)
3

加载模型并进行视觉推理

基于 Transformers 加载模型,输入截图或界面图像,让 Holo3 输出元素理解、动作决策或导航说明。

import torch
from transformers import AutoProcessor, AutoModelForImageTextToText

processor = AutoProcessor.from_pretrained("./models/holo3-35b-a3b")
model = AutoModelForImageTextToText.from_pretrained(
    "./models/holo3-35b-a3b",
    torch_dtype=torch.bfloat16,
    device_map="auto"
)
4

封装 OpenAI 兼容或内部 API 服务

通过 vLLM 或自定义 FastAPI 服务,统一向浏览器代理、RPA 系统和工作流平台输出推理接口。

from vllm import LLM

llm = LLM(
    model="./models/holo3-35b-a3b"
)

# 可继续接入 FastAPI / OpenAI-compatible API
5

接入浏览器代理与监控链路

将 Holo3 服务接入浏览器控制、桌面自动化执行器和任务调度平台,并记录日志、截图和回放信息。

import requests

payload = {
    "messages": [{"role": "user", "content": "请识别这个页面上的登录按钮位置"}]
}

resp = requests.post("http://localhost:8000/v1/chat/completions", json=payload)
print(resp.json())

Holo3 一键本地部署方案

我们提供从模型选型、截图推理、导航服务到浏览器 Agent 接入的完整落地方案

资讯问答

开启您的 Holo3 本地部署

获取定制化部署方案、GUI Agent 设计与企业自动化落地支持

在线客服
微信公众号
免费拨打0592-5580190
免费拨打0592-5580190 技术热线 0592-5580190 或 18950029502
客服热线 17750597993
返回顶部
返回头部 返回顶部