算力免费领

注册实名认证得10元现金

召唤好算友

邀请好友各得5元算力金

暖冬算力季

首充100赠10现金余额

算力智能托管

算力服务器托管与集群建设

GPU服务器容器实例租用

仅需两步，即可拥有一台高性能GPU服务器容器实例云主机，秒级拉取AI镜像，轻松开展智算工作！

容器环境

内置常见模型运行环境一键部署

PyTorchTensorFlowJAXPaddlePaddle

卡型丰富

支持多种异构显卡按小时租用

JYGPU

METAX • Centurion

Ascend • Agent

工作流

NVIDIA 4090

显存24GB|AI算力 330 FLOPS

¥2.25/时

¥1.80 /时

CPU

15核

内存

60GB

数据盘

100GB

NVIDIA 4090(48G)

显存48GB|AI算力 330 FLOPS

¥2.85/时

¥2.28 /时

CPU

15核

内存

96GB

数据盘

500GB

NVIDIA H20

显存96GB|AI算力 148 FLOPS

¥7.75/时

¥6.20 /时

CPU

24核

内存

128GB

数据盘

50GB

算力强劲的裸金属服务器租用

裸金属形式交付，提供专属算力资源，适配企业级AI服务、深度学习等场景

todo.icon 查看完整价格列表

4090 24G × 8 裸金属服务器

入门级AI卡，适配中小推理任务

NVLinkIB网卡四川一区

¥9900/时节省20%

¥ 7920 /月

8 × 330T FLOPS (FP16)

2 × Intel（单颗64逻辑核心）

8 × 64GB DDR4

2 × 3.84TB 硬盘空间

需要申请更优价格？联系算力顾问

4090 24G × 8 裸金属服务器

入门级AI卡，适配中小推理任务

NVLink裸服务器四川一区

¥9900/时节省20%

¥ 7920 /月

8 × 330T FLOPS (FP16)

2 × Intel（单颗64逻辑核心）

8 × 64GB DDR4

2 × 3.84TB 硬盘空间

需要申请更优价格？联系算力顾问

4090 24G × 8 裸金属服务器

入门级AI卡，适配中小推理任务

NVLink裸服务器四川一区

¥9900/时节省20%

¥ 7920 /月

8 × 330T FLOPS (FP16)

2 × Intel（单颗64逻辑核心）

8 × 64GB DDR4

2 × 3.84TB 硬盘空间

需要申请更优价格？联系算力顾问

4090 24G × 8 裸金属服务器

入门级AI卡，适配中小推理任务

NVLink裸服务器四川一区

¥9900/时节省20%

¥ 7920 /月

8 × 330T FLOPS (FP16)

2 × Intel（单颗64逻辑核心）

8 × 64GB DDR4

2 × 3.84TB 硬盘空间

需要申请更优价格？联系算力顾问

丰富的模型与镜像可供选择

极智算平台预设多种热门镜像与AI模型，结合容器的快速拉起特性，用户零门槛可一键部署，在几分钟内启动一个预置的AI环境

满足企业级AI应用

平台支持异构混合部署，突破大模型算力瓶颈

极智算提供的主流镜像包括基础镜像、应用镜像、自定义镜像等，模型涵盖大语言模型（如DeepSeek、Qwen、Llama）、视觉模型（如Stable Diffusion）和多模态模型等。

DeepSeek-R1

对话知识库

开源且基于MIT协议，推理能力强，模块化支持中文理解、支持复杂任务

GLM-Z1

多语言对话智能客服

推理速度快，性价比高，出能胜任DeepSeek-R1

Llama 4 Maverick

通用复写作图像识别

混合专家架构，图像理解能力强，适合创意写作和通用助手

Qwen 2.5-VL

辅助设计智能编辑

支持文本、视觉、音频等多种输入，能够生成高质量的图文内容

极智算平台优势

①种类多：从入门级GPU到专业GPU全覆盖，②价格实惠：同类产品价格最优，③灵活租赁：可按小时、按天、按月等方式租赁

高性能GPU服务器集群

提供多种高性能GPU型号，如NVIDIA A100、H100、H800等，具备强大的计算能力和高显存带宽。支持FP32、TF32等多种混合精度计算，能够满足不同精度需求的计算任务，提升计算效率和资源利用率。同时，优化了对稀疏矩阵运算的支持，减少了AI模型运算中的冗余计算。

支持根据项目需求弹性扩展或收缩算力资源，能够灵活应对不同阶段的算力需求波动，确保资源的高效利用。为用户提供定制化的算力解决方案，满足不同行业和应用场景的特定需求。

灵活的算力租赁模式

提供按小时、按天、按月按等多种灵活的算力租赁方式，用户可以根据实际需求选择合适的计费模式，避免算力资源浪费，降低使用成本。

丰富多样的算力交付形式

通过容器化和裸金属两种主要方式，为用户提供灵活、高效且高性能的算力租赁服务，以满足从弹性计算到高性能计算的不同业务需求，实现算力资源的高效利用和优化配置。

容器化算力租赁

基于容器虚拟化技术的轻量级计算资源，通过容器封装实现应用隔离与快速部署。具备弹性伸缩、高资源利用率和跨平台迁移的特性。

弹性扩展与敏捷部署

支持按需动态调整资源分配，适应业务负载变化

微服务架构友好

支持分布式和异构计算，便于独立部署

算力池化优化

将异构算力资源统一管理，实现资源的按需申请与使用

轻量级隔离

通过控制组等技术实现轻量级隔离，减少资源消耗

裸金属算力租赁

直接运行在GPU服务器上的算力资源，具备高计算性能、资源独占、高稳定性和强安全性的特点。适合对性能和安全性要求极高的大模业务场景。

高性能算力输出

无虚拟化开销，适合密集型AI任务

高安全性

物理机隔离，适合对安全要求较高的场景

适合高负载应用

对性能要求极高的AI应用，如深度学习等

算力资源独占

避免算力资源争抢，确保AI应用运行的稳定性