成果、专家、团队、院校、需求、企业在线对接

  • 高文通与江苏省生产力促进中心企业咨询与知识产权服务中心对接成功
  • 纪秀林与江苏省生产力促进中心高层次人才与外国专家服务处对接成功
  • 纪秀林与江苏省生产力促进中心高层次人才与外国专家服务处对接成功
  • 张超与江苏省生产力促进中心企业咨询与知识产权服务中心对接成功
  • 刘平与江苏省生产力促进中心高层次人才与外国专家服务处对接成功
  • 南京光启机电有限公司与聂俊对接成功

云原生环境下基于共享式GPU的分布式容器调度系统

成果编号:38066
价格:面议
完成单位:南京邮电大学
单位类别:其他高校
完成时间:2024年
成熟程度:试生产阶段
服务产业领域: 电子信息
发布人:chencan 离线
为满足企业部署人工智能应用的需求,本项目研发云原生环境下基于共享式GPU的分布式容器调度系统,旨在构建智能机器学习平台,实现人工智能应用的智能部署与管理。本系统通过根据集群中GPU显卡的细颗粒度指标状态合理调度容器,使得多容器任务可以共享GPU,同时,通过考虑节点内的显卡指标状态、空闲显存和配额情况来将待调度容器调度到最适配的节点上,从而提高集群的GPU资源利用率,以适配机器学习任务等复杂场景的计算需求。本系统不仅有着出色的调度性能和负载均衡能力,而且可以保证集群整体有更好的资源利用率和最快的任务完成时间。
65 次浏览 分享到

成果介绍

科技计划:
成果形式:新技术
合作方式:技术转让、技术开发、技术咨询、技术服务
参与活动: 2023年高校院所走进镇江产学研合作对接活动 第二届江苏产学研合作对接大会 2023年高校院所服务苏北五市产学研合作对接活动
专利情况: 正在申请 ,其中:发明专利 1
已授权专利,其中:发明专利 4
专利号:
ZL202010034706.5
ZL202010506445.2
ZL201910836417.4
CN202110264399.4
成果简介
综合介绍
为满足企业部署人工智能应用的需求,本项目研发云原生环境下基于共享式GPU的分布式容器调度系统,旨在构建智能机器学习平台,实现人工智能应用的智能部署与管理。本系统通过根据集群中GPU显卡的细颗粒度指标状态合理调度容器,使得多容器任务可以共享GPU,同时,通过考虑节点内的显卡指标状态、空闲显存和配额情况来将待调度容器调度到最适配的节点上,从而提高集群的GPU资源利用率,以适配机器学习任务等复杂场景的计算需求。本系统不仅有着出色的调度性能和负载均衡能力,而且可以保证集群整体有更好的资源利用率和最快的任务完成时间。
创新要点
本项目着力于解决基于GPU的机器学习任务的合理性调度问题,提出了一种基于GPU的调度评分算法以适配基于GPU的机器学习任务作业。
技术指标
(1)系统支持主流的深度学习框架:Tensorflow和Pytorch。 (2)为多用户提供运行人工智能业务的实验环境。 (3)并且允许用户定制人工智能业务的实验环境。 (4)实现对用户定制的人工智能业务实验环境的部署。
其他说明
完成人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看
联系人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看

咨询与解答