数算岛 开源 智算 平台(SSD-PAI)

李文慧 · 开源 数算岛AI计算平台 GPU池化软件 - 一站式 AI人工智能训练推理平台——系统安装量1000+ 是您快速部署线上业务和二次开发的最佳选择。 李文慧 国内知名开源工作者 全栈工程师 华为云最具价值专家 http://suanli.huizhidata.com/http://suanli.huizhidata.com/

数算岛 开源 智算 平台(SSD-PAI)

一、产品概述

智能时代一体化算力服务平台解决方案

可提供统一、灵活、易用、全面的算力资源管理与调度策略,解决传统算力使用场景中算力资源碎片化、用户需求多样化、运维管理工作量大等问题。

(1)可整合零散、异构算力资源进行统一管理与调度,实现化零为整,提升算力资源整体利用率。

(2)为算力租户提供一个可伸缩、可定制、相对隔离且开箱即用的在线计算环境,用户可通过浏览器使用平台的完整功能。

(3)有效支撑用户研发过程闭环,提供数据准备→运行环境→训练/计算→成果归档/复用的研发全流程的环境/工具支持,促进智能生态蓬勃发展。

二、功能特点

1、支持异构算力资源统一管理&调度

(1)可接入校园内部各算力集群,打破算力孤岛,实现统一管理。

(2)支持对不同型号硬件设备的统一管理。

(3)用户可指定使用的资源类型,平台进行按需调度。

2、丰富、便捷的在线研发环境

(1)支持云桌面、Jupyter、SSH 1、Web IDE、Web Terminal 2、低代码“拖拉拽”流程建模等多款开箱即用的算力使用环境,满足用户对不同研发环境的需求。

(2)支持一键导入社区开源的Docker镜像,无需任何改动即可在线使用,提升科研效率。

(3)用户可在浏览器使用平台的完整功能,达到“任何人、任何时间、任何地点”均能使用本平台的效果。

注1: 可针对校园机房安全策略提供直连及代理连接两种不同的SSH连接方式

注2: 基于CG WebTerminal实现在浏览器中执行shell命令以使用几乎任何类型的运行环境

3、全流程研发工具支撑

(1)提供数据标注、离线运行、训练记录、GPU分布式计算等工具或框架支持。

(2)支撑研发过程形成闭环:数据准备 → 运行环境 → 模型训练 → 成果归档 → 成果复用。

4、基于共享的资源配额管理

(1)管理员可为用户设置资源使用总配额及单个项目的资源上限,对CPU、内存、GPU等资源使用量进行限定。

(2)用户(组)在配额限定范围内可自由申请资源及变更软件环境,无需管理员干预。

(3)支持自动、手动、延迟等多种资源释放策略,在满足用户需求同时尽快回收算力资源。

(4)支持灵活设置用户的项目最长运行时间,倒计时结束即可强制收回项目申请的资源。

##5、支持数据共享
(1)可公开各类科研成果,包括模型、项目、数据集及软件环境(镜像)等。

(2)支持对各类公开科研成果进行复用,加速成果转化及科研合作。

6、多粒度GPU算力调度

(1)VGPU技术支持:多用户同时用一张卡。

(2)分布式GPU算力支持:一个用户同时用多张卡。

7、应用中心

(1)开发者可将开发完成的服务/应用发布到应用中心,供其它用户使用,促进成果交流。

(2)用户可在此寻找对自己有帮助的应用,激发创作灵感。

(3)其它平台的应用可直接使用应用中心内的服务或应用,提升系统研发效率。

平台架构:轻量、易用、灵活、全面、开箱即用

关注公众号“文慧的科技江湖”

Last Updated: 2024/09/12 14:02:55
安徽省充换电基础设施综合监管服务平台数据接入指南(版本v1.1) 隐藏知识点!电单车充电桩招投标硬件软件全攻略。—— 慧哥开源充电桩平台(8月第三篇)
OωO 取消
  • |´・ω・)ノ
  • ヾ(≧∇≦*)ゝ
  • (☆ω☆)
  • (╯‵□′)
  •  ̄﹃ ̄
  • (/ω\)
  • →_→
  • (ノ°ο°)ノ
  • ⌇●﹏●⌇
  • (ฅ´ω`ฅ)
  • φ( ̄∇ ̄o)
  • ヾ(´・ ・`。)ノ"
  • (ó﹏ò。)
  • Σ(っ °Д °;)っ
  • ( ,,´・ω・)ノ
  • ╮(╯▽╰)╭
  • (。•ˇ‸ˇ•。)
  • >﹏<
  • ( ๑´•ω•)
  • "(´っω・`。)
  • "(ㆆᴗㆆ)