专题论坛2:构建大模型的国产软硬件生态
.
发布人:  发布时间:2024-07-26   动态浏览次数:

论坛背景及意义:大模型技术及其应用依赖高性能的计算硬件和鲁棒高效的深度学习框架。然而,我国人工智能发展面临着Nvidia+Pytorch形成的生态屏障,导致国产硬件和深度学习框架的迭代和演进缓慢,难以支撑我国人工智能应用的广阔场景和广泛需求。本论坛邀请来自企业学术届的专家和学者,就大模型的国产软硬件生态建设展开研讨,以期从软硬件一体的角度,促进我国人工智能软硬件生态的良性循环和发展。


论坛主席:穆太江 清华大学


主席介绍:穆太江,清华大学计算机科学与技术系助理研究员。主要研究方向为计算图形学、计算机视觉等,在重要国际会议和期刊发表论文40余篇,其中3篇论文入选ESI热点论文。主持了自然科学基金委青年科学基金项目和北京市科技计划项目任务,作为骨干参与了多项国家重大项目。现担任中国计算机学会计算机辅助设计与图形学专委会委员,VCIBA期刊青年编委等。


时间:8月16日 13:30-15:20

地点:三楼国际厅A



论坛讲者:严俊驰 上海交通大学


讲者介绍:严俊驰,上海交通大学人工智能学院和计算机系教授/支部书记,科技部新一代人工智能重大项目、基金委交叉学部人工智能重大研究计划项目、人工智能优青项目负责人,教育部深度学习资源建设首席专家、CCF优博。曾任IBM研究院(首席)研究员。主要研究兴趣为机器学习及交叉应用。发表顶级论文超过200篇。长期任ICML/NeurIPS/ICLR领域主席,TPAMI、PRJ编委,获最具影响力榜首顶会论文两次(AAAI21/IJCAI23),最佳论文候选一次(CVPR24),省部级自然科学一等奖一次,学术引用近两万次。


报告题目:自动驾驶的国产生态建设探索与思考

时间:8月16日 13:30-15:20

地点:三楼国际厅A

报告摘要:自动驾驶是全球科技创新热点,然而现有开源算法绝大多数都是国外框架下的实现,其高度模块化和封装带来的工程难度使得市面上目前缺乏国产开源框架支持。认识到这一点,我们从当今最前沿的端到端自动驾驶出发,以CVPR2023最佳论文UniAD的国产框架实现为起点,计划逐步覆盖自动驾驶开源社区常见常用的前沿算法,推动自动驾驶国产框架生态的建设,以期深化芯片-框架-产业一体化的互相推进效果。


论坛讲者:曹泽文 长沙景嘉微电子股份有限公司


讲者介绍:曹泽文,长沙景嘉微电子股份有限公司副总经理、研究员。博士毕业于国防科技大学,国家图形处理芯片及智能系统创新中心副主任,湖南省智能环境感知与信息处理系统工程技术研究中心主任,某部电子基础产品领域专家,中国指控学会C4ISR技术委员会委员、CCF抗恶劣环境计算机专委会委员。


报告题目:自主GPU研发及生态建设

时间:8月16日 13:30-15:20

地点:三楼国际厅A

报告摘要:GPU是当前人工智能市场占有率最高的芯片,在未来很长一段时间内,仍将占据主导地位。长沙景嘉微立足自主,研制了4代多款GPU芯片,支持OpenGL 4.6、OpenGL ES 3.2、Vulkan 1.3、WebGL 2.0、OpenCL 3.0,DirectX11等,支持硬件虚拟化SR-IOV,最大支持32个VF,支持直通和分片两种模式灵活配置;能与国产化计算机平台适配,满足金融等领域对高性能图形渲染显示,支持高性能通用计算、云桌面、云渲染等场景需求。


论坛讲者:王豪杰 清华大学


讲者介绍:王豪杰,清华大学计算机系助理研究员,主要在人工智能编译器和高性能计算领域开展研究工作,相关成果发表于OSDI、ATC、PPoPP、SC、PLDI、TC、TPDS等相关领域内顶级国际会议和期刊,获得了ICS 2021最佳学生论文奖和TPDS 2022 最佳论文亚军。曾获清华大学优秀博士学位论文、北京市优秀毕业生、清华大学“水木学者”、清华大学优秀博士后、ACM SIGHPC China优博奖等荣誉,获国家自然科学基金青年科学基金等项目资助,入选北京市青年人才托举工程。


报告题目:多层次协同优化的人工智能编译器

时间:8月16日 13:30-15:20

地点:三楼国际厅A

报告摘要:现有人工智能编译器将编译过程解耦为高层次的图层优化、低层次的算子层优化,简化了人工智能应用编译优化过程,却错失了不同层次之间的跨层次协同优化机会。多层次协同优化的人工智能编译器,通过图层、算子层等不同层次间互感知的协同优化方法,打通了人工智能应用软硬件之间不同层次的优化信息,为人工智能芯片的高效使用提供了有效方法,进一步扩展了人工智能应用的优化空间。


论坛讲者:杨国炜 非十科技


讲者介绍:杨国炜,非十科技技术副总裁、联合创始人。博士毕业于清华大学计算机系计算机图形学实验室,师从胡事民院士。主要研究方向为计算机图形学、深度学习框架,他是国产深度学习框架计图Jittor的核心成员。研究成果发表在IEEE TVCG、ACM TOG、CVMJ和中国科学等期刊上。


报告题目:基于计图的AI 辅助编程

时间:8月16日 13:30-15:20

地点:三楼国际厅A

报告摘要:基于大语言模型的代码生成理解正在形成新的软件开发范式。非十科技基于国产深度学习框架计图(Jittor)突破了大模型训练资源要求高、推理延迟大、部署成本高等困难,得益于计图的元算子融合技术、高效分布式计算、动态swap机制等,显著提升了训练和推理速度、降低了代码大模型的部署应用成本,并基于此提供了迅捷、准确的AI代码助手服务,相比国际同类服务将延迟时间缩短约70%,准确度提高约20%。


上一篇:大模型与三维内容生成返回首页下一篇:具身智能