学术报告
9月22日 NVIDIA应用案例技术交流讲座
发布时间:2022-09-19
讲座议程
时间:2022年9月22日19:30-22:00
地点:腾讯会议355-715-015
主持人:江颖教授
内容:
1. 基于大模型的模型分布式训练和并行加速——Megatron-LM在NLP的应用(报告人:杨东旭,报告时长:25分钟)
报告人简介:英伟达解决方案架构师,负责GPU加速,并行计算优化,大规模分布式训练以及图计算等方向。具有多年异构系统并行计算开发和优化工作经历,在CUDA加速和并行计算方向有丰富经验。
报告摘要:本报告基于Megatron对大规模NLP模型分布式训练中的数据并行,张量并行和流水线并行进行了分析和探讨,并分享了在DGX-A100集群上的相关实践。
2. 推理的和可解释性的AI应用——自然语言推理,基于Triton的应用(报告人:卢翔龙,报告时长:25分钟)
报告人简介:英伟达资深解决方案架构师,拥有华中科技大学本科学位和美国亚利桑那州立大学工学硕士学位,技术方向为TensorRT, Triton等NVIDIA推理解决方案。
报告摘要:本报告将介绍Triton的整体架构,包含功能性和性能方面的深入解读,并分享cv on Triton ensemble pipeline参考设计,部署代码具体实践相关内容。
3. AI for Science框架Modulus介绍及在流体力学中的应用(报告人:戴志翔,报告时长:25分钟)
报告人简介:英伟达解决方案架构师,负责英伟达教科研行业GPU计算解决方案设计与研究,方向包括GPU在高性能计算、深度学习和数据科学等领域的应用,GPU 的分布式并行计算加速,CUDA及OpenACC的应用程序移植和性能优化。
报告摘要:NVIDIA Modulus 是用于开发物理机器学习(Physics-ML)模型的框架,使用物理控制方程(PDE)、模拟数据和观测数据来构造数字孪生模型。NVIDIA Modulus引入多种先进的AI模型,包括物理信息神经网络,傅里叶神经算子,物理信息神经算子,超分辨率网络等,支持参数化设计,实现多GPU多节点线性扩展,提供了基于Python的API,能够为缺乏 AI 专业知识,但对 AI for science的需求快速增长的众多领域提供支持,被广泛用于CFD、传热、固体、电磁波、地震波、气象预报、超分辨率等领域。本次报告内容包括:Modulus总体介绍、先进的AI模型、不同领域的应用以及在流体力学中的优势。
4. AI在电镜图像处理当中的应用(报告人:石道辰,报告时长:25分钟)
报告人简介:英伟达解决方案架构师,负责英伟达高校与教育科研的合作项目与研究。主要研究与工作方向涵盖高性能计算编程实现与CUDA/OpenACC程序优化;高性能计算或者人工智能在生物学当中的应用;深度学习与系统应用、计算机视觉、视频分析等。
报告摘要:在冷冻电镜领域,生物大分子的结构解析离不开原始数据的处理。从电镜直接得到的是包含了噪声和信息的图像,有非常多的方法开发出来,使得科研人员尽可能拿到较高质量的图像。之前的方法较多依赖生物或者物理基础,而且人工工作量较多。本次活动主要介绍基于人工智能的一些方法,从而减轻人工操作时间成本,加速科学研究。
5. 面向分子动力学的AI应用(报告人:马四腾,报告时长:25分钟)
报告人简介:英伟达解决方案架构师,负责英伟达教科研行业GPU计算解决方案设计与研究,方向包括GPU在高性能计算、深度学习和数据科学等领域的应用,GPU 的分布式并行计算加速,CUDA及OpenACC 的应用程序移植和性能优化。
报告摘要:本次交流内容主要涉及两部分内容:介绍支持GPU平台的分子动力学应用及相关安装测试内容;介绍分子动力学+AI在材料计算领域相关内容。
6. 双方交流讨论(时长:25分钟)