V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
hubahuba
V2EX  ›  问与答

学校的 GPU 分配问题

  •  
  •   hubahuba · 2022-04-28 09:08:10 +08:00 · 2741 次点击
    这是一个创建于 965 天前的主题,其中的信息可能已经有所发展或是发生改变。

    学校分配了 10 块 2080ti 给我们组做实验用

    可这个机房在另一个校区 那个老师只暴力丢给我们一个 teamview 账号密码··· 经过沟通后表示各种问题无法给我们做 GPU 服务器部署···

    所以想问问大家,在这样的情况下,如何做资源的分配呢?

    (理想状态的是容器化管理,每个同学都有自己的子账号,自己的 environment )

    14 条回复    2022-04-28 18:45:20 +08:00
    pxiphx891
        1
    pxiphx891  
       2022-04-28 09:12:25 +08:00
    如何做资源的分配?从阿里买一套 DataWorks 就行了
    villivateur
        2
    villivateur  
       2022-04-28 09:14:48 +08:00
    要不直接装 10 台主机?这样简单暴力高效
    hubahuba
        3
    hubahuba  
    OP
       2022-04-28 09:20:13 +08:00
    @villivateur 它装在一台上 5T 我真怕哪个同学直接给我删光了 (/捂脸哭)
    weak
        4
    weak  
       2022-04-28 09:20:57 +08:00 via iPhone
    直接 10 台主机 本来建议 pve 直通的 但是这个太麻烦了
    hubahuba
        5
    hubahuba  
    OP
       2022-04-28 09:22:55 +08:00
    @weak 我问过 他说没有那么多机器了···
    hubahuba
        6
    hubahuba  
    OP
       2022-04-28 09:26:22 +08:00
    对不起 此贴终结 刚才我看到这个账号就两块 GPU 刚打电话问了下 目前其他的没有机器装
    fuxiaopang
        7
    fuxiaopang  
       2022-04-28 09:40:23 +08:00   ❤️ 2
    国内,尤其是国家直属 985 院校的小型固定资产,在采购完的一瞬间就没有价值了,之后的使用维护都没有响应款项,出问题项目负责人、学院院长还要担责,但是明面上还要和学生按照当时报批的用途忽悠,等真想用困难重重。最后自己占了小便宜,学校早晚会想办法要回来。就像我们学校的渲染农场,所有人都不知道藏在哪里,怎么申请使用。后来教育部领导来视察才参观过。对比而言,北京市直属的高校要好很多,费用充足。
    dayeye2006199
        8
    dayeye2006199  
       2022-04-28 09:46:35 +08:00
    @hubahuba OP 我们是专门做裸金属上的数据科学实验开发环境的,对 CPU GPU 和存储进行池化。方便添加一下我的微信聊聊吗? eXVodWlfc2hpCg==
    hubahuba
        9
    hubahuba  
    OP
       2022-04-28 09:57:41 +08:00
    @fuxiaopang 太对了

    买的时候院长还挺用心的 说实验室不能没设备

    谁想到买过来就立马变了,不是说设备问题。

    管理,运营,人员,上上下下都是洞

    甚至那个管设备的老师跟我说“他一个人多多忙···没时间做这些···”···
    jim9606
        10
    jim9606  
       2022-04-28 10:18:53 +08:00
    自己组装几台放办公室里好了,维护也不用看别人眼色,我这边不少组就是这么干了。让教授出点经费搞几台组装机还是容易些的吧?放异地机房又没远程管理和可用性保障的话那没啥优势。
    管理的话组内专用不给 root 问题也不会很大,或者就弄个 portainer CE 。
    vast0906
        11
    vast0906  
       2022-04-28 10:37:41 +08:00
    搞成 Linux 跑个单点的 k8s ,通过 NVIDIA 的 gpu 做 gpu 划分; 然后一人一个 deployment 里面跑 jupyterlab 。访问的话 可以考虑下 WireGuard
    liuliangyz
        12
    liuliangyz  
       2022-04-28 10:53:35 +08:00
    @hubahuba 小伙子,你太年轻了,你以为你的项目组能搞出很高的产出吗?
    学校说分给你们组,不代表老师就按你们要求分配。
    从另外一个方便,既然是一个学校的,只是不同校区,你们有没有主动去另外一个校区找老师,协助老师把这 10 块 gpu 部署好。
    podel
        13
    podel  
       2022-04-28 11:04:48 +08:00
    可以考虑 k8s k8s 可以直接分配 gpu 资源。也可以多多账户进行管理。就是要学习一下。
    学习好了。会非常方便的。
    crazydd
        14
    crazydd  
       2022-04-28 18:45:20 +08:00
    LSF 大家一起 bsub 排队呀
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4216 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 05:31 · PVG 13:31 · LAX 21:31 · JFK 00:31
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.