阿里云推出面向自动驾驶领域模型的训练、推理加速框架PAI-TurboX。该框架可提升感知、规划控制乃至世界模型的训推效率,在多个行业模型的训练任务中,PAI-TurboX均可缩短50%的时间。
目前,业界主流的自动驾驶方案需要融合图像、激光雷达、毫米波雷达、GPS等多个模态数据,但大规模训练样本数据加载和预处理的效率较低,导致GPU资源浪费;同时,自动驾驶模型算子数量巨大,使用现有训推框架系统执行效率低下,且优化门槛高。
据悉,阿里云推出的PAI-TurboX,在多模态数据预处理、离线大规模模型训练以及实时智驾推理等环节提供了全面的解决方案。在系统侧,PAI-TurboX通过优化CPU亲和性、动态编译、流水线并行等策略,显著提升模型的训练推理效率;在数据侧,PAI-TurboX提出了高性能的DataLoader引擎,并且优化了数据预处理流程和实现了智能训练样本分组,有效提升数据处理效率。
此外,PAI-TurboX还提供了算子优化和量化等能力,可进一步减少训练阶段的访存延迟,提升吞吐效率。同时,在推理任务中,能在保障精度的同时降低计算开销与内存带宽需求,可实现异构平台下的高性能推理部署。
实测结果显示,在自动驾驶的3D物体检测模型BEVFusion训练任务中,PAI-TurboX可以将训练时间缩短58.5%;在实时在线矢量化高精地图构建模型MapTR训练任务中,PAI-TurboX可以将训练时间缩短53%;在端到端自动驾驶模型SparseDrive训练任务中,PAI-TurboX可以在感知模块训练和联合训练两个阶段获得明显的速度提升,相同训练步数下可分别缩短51.5%和48.5%的训练时间。
据介绍,阿里云人工智能平台PAI可提供贯穿AI开发和运维全流程的平台服务。自2016年以来,PAI已累计服务超过10万家企业客户及数百万AI开发者,支撑阿里云百炼、魔搭社区等MaaS服务及社区。
文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。
奥维云网(AVC)推总数据显示,2024年1-9月明火炊具线上零售额94.2亿元,同比增加3.1%,其中抖音渠道表现优异,同比有14%的涨幅,传统电商略有下滑,同比降低2.3%。
“以前都要去窗口办,一套流程下来都要半个月了,现在方便多了!”打开“重庆公积金”微信小程序,按照提示流程提交相关材料,仅几秒钟,重庆市民曾某的账户就打进了21600元。
华硕ProArt创艺27 Pro PA279CRV显示器,凭借其优秀的性能配置和精准的色彩呈现能力,为您的创作工作带来实质性的帮助,双十一期间低至2799元,性价比很高,简直是创作者们的首选。