科技计划:
成果形式:新技术
合作方式:技术转让、技术开发、技术咨询、技术服务
参与活动:
2023年高校院所走进镇江产学研合作对接活动
第二届江苏产学研合作对接大会
2023年高校院所服务苏北五市产学研合作对接活动
专利情况:
正在申请 ,其中:发明专利 1 项
已授权专利,其中:发明专利 4 项
专利号:
ZL202010034706.5
ZL202010506445.2
ZL201910836417.4
CN202110264399.4
成果简介
综合介绍
为满足企业部署人工智能应用的需求,本项目研发云原生环境下基于共享式GPU的分布式容器调度系统,旨在构建智能机器学习平台,实现人工智能应用的智能部署与管理。本系统通过根据集群中GPU显卡的细颗粒度指标状态合理调度容器,使得多容器任务可以共享GPU,同时,通过考虑节点内的显卡指标状态、空闲显存和配额情况来将待调度容器调度到最适配的节点上,从而提高集群的GPU资源利用率,以适配机器学习任务等复杂场景的计算需求。本系统不仅有着出色的调度性能和负载均衡能力,而且可以保证集群整体有更好的资源利用率和最快的任务完成时间。
创新要点
本项目着力于解决基于GPU的机器学习任务的合理性调度问题,提出了一种基于GPU的调度评分算法以适配基于GPU的机器学习任务作业。
技术指标
(1)系统支持主流的深度学习框架:Tensorflow和Pytorch。
(2)为多用户提供运行人工智能业务的实验环境。
(3)并且允许用户定制人工智能业务的实验环境。
(4)实现对用户定制的人工智能业务实验环境的部署。
其他说明
完成人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看
联系人信息
姓名:对接成功后可查看
所在部门:对接成功后可查看
职务:对接成功后可查看
职称:对接成功后可查看
手机:对接成功后可查看
E-mail:对接成功后可查看
电话:对接成功后可查看
传真:对接成功后可查看
邮编:对接成功后可查看
通讯地址:对接成功后可查看