专题论坛1:大模型与三维内容生成
.
发布人:  发布时间:2024-07-26   动态浏览次数:

论坛背景及意义:随着人工智能和深度学习技术的迅猛发展,大规模神经网络模型在文本、图像和视频领域展现出了强大的理解和生成能力。作为新时代数字媒体形态的重要组成部分,三维内容的生成技术也在大模型的推动下取得了长足进展。本次论坛旨在促进这一跨学科前沿领域的学术交流与合作,将邀请国内外相关领域的顶尖学者和专家,共同探讨大模型时代三维内容生成的技术路径和未来发展方向,推动人机交互、虚拟现实、计算机视觉、计算机图形学等领域的创新发展。


论坛主席:张松海 清华大学


主席介绍:张松海副教授主要从事虚拟现实与计算机图形学、图像/视频处理、可视化等方面的教学和科研工作,在交通标志检测与分类、人像分割、三维内容合成、VR重定向行走等方面提出了一系列创新成果,在IEEE TVCG、IEEE TIP、IEEE TMM等国际期刊和ACM SIGGRAPH、IEEE CVPR、ECCV、IEEE VR、ISMAR等国际会议上发表论文30余篇,获国家科技进步二等奖1项(2018,排名第三)。


时间:8月16日 13:30-15:20

地点:三楼国际厅B+C



论坛讲者:曹炎培 VAST


讲者介绍:曹炎培,2009-2013年,于清华大学计算机科学与技术系本科学习,获多次校级奖项。2013-2018年,继续攻读博士学位,师从胡事民院士,专注计算机图形学与三维视觉,期间赴德国RWTH Aachen University交流,获Pacific Graphics 2014最佳论文奖。在三维数字化、几何建模、生成式AI及真实感渲染等方面的研究成果,多次在SIGGRAPH、CVPR等顶级会议和期刊发表,累计引用1200余次。共同创立3D生成式AI开源项目threestudio,荣获2023年度CCF优秀开源项目奖。2017-2019年间作为创业公司Owlii的创始团队成员及CTO,开发高精度实时动态3D重建、压缩与传输系统,并成功应用于CES、SIGGRAPH等国际展会及天猫双十一等大型活动(Owlii公司于2019年被快手收购)。2019-2021年,快手Y-tech高级研究员,开发低成本视觉动作捕捉系统、4D人脸几何和材质重建lightstage的软硬件系统,跨平台服务快手App等业务。2021-2023年,腾讯AI Lab和PCG ARC Lab专家研究员(T12)、三维方向负责人,负责三维数字化和三维生成方向的研究。2023年至今,任VAST公司首席科学家。


报告题目:三维内容生成中的神经网络架构探索

时间:8月16日 13:30-15:20

地点:三楼国际厅B+C

报告摘要:随着三维生成式AI技术的迅速发展,高效、准确的三维数据表示和强大的神经网络架构成为推动领域进步的关键。本报告将分享VAST团队在三维生成和三维神经网络架构方面的近期探索,以及对于该领域的一些思考。


论坛讲者:高林 中国科学院


讲者介绍:高林,中国科学院博士生导师,移动计算与新型终端北京市重点实验室研究员,中国科学院大学岗位教授,国家自然科学基金委优青,北京市杰青,英国皇家学会牛顿高级学者,在清华大学获得工学博士学位(导师:胡事民院士),曾在德国亚琛工业大学进行公派访问研究(合作导师:Leif Kobbelt教授)。计算机图形学,三维计算机视觉,数字几何处理,深度几何学习。


报告题目:面向动态复杂材质拓扑的3D几何建模

时间:8月16日 13:30-15:20

地点:三楼国际厅B+C

报告摘要:面向动态复杂材质的高真实感3D几何建模方法研究。近期,生成式人工智能取得了快速的发展,诞生了诸如GhatGPT,StableDiffusion,Sora等生产力工具,正在成为构建新质生产力的关键要素。其中三维模型是非常普遍和被广泛应用的数字媒体内容,高效的生成高质量的三维模型是学术界和工业界所关注的前沿课题。其中,生成式人工智能的发展为上述课题的研究带来了新的研究思路和研究方法,并形成了系列基于生成式人工智能的三维模型建模方法(3D AIGC)。在本次报告中,我们将分享3D AIGC的背景,现状与相应的技术挑战,并将探索如何重建和生成高质量的三维模型。包括重建生成具有复杂拓扑结构和透明材质的三维模型以及通过线稿几何交互的方法生成高动态的三维模型,并将介绍最新的几何表征技术的发展,包括神经辐射场,高斯泼溅方法和高斯网。


论坛讲者:韩晓光 香港中文大学(深圳)


讲者介绍:韩晓光博士,现任香港中文大学(深圳)理工学院和未来智联网络研究院助理教授,校长青年学者,目前担任未来智联网络研究院助理院长。他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文60余篇,包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助,香港中文大学(深圳)青年科研奖。目前也担任CVPR2023,NeurIPS 2023以及CVPR2024领域主席。他的工作还曾两次获得CCF图形开源数据集奖(DeepFashion3D和MVImgNet),2019年和2020年连续两年入选计算机视觉顶级会议CVPR最佳论文列表(入选率分别为0.8%和0.4%),他也曾获得IEEE TVCG最佳审稿人提名奖。


报告题目:三维生成,卷不过怎么办?

时间:8月16日 13:30-15:20

地点:三楼国际厅B+C

报告摘要:三维生成在过去短短的两年内,技术迭代飞快,从2D升维到3D原生,可谓是非常之“卷”。作为图形领域的研究者,在没有数据没有算力,“卷”不过的情况下,如何做科研呢?本报告将结合我们近期的一些工作,为大家简单分享一些个人经验,希望对大家有所帮助。本报告所包含的工作涵盖了我们组在ECCV 2024 以及 Siggraph Asia 2024上的最新进展。


论坛讲者:杨磊 商汤科技


讲者介绍:杨磊,于2015年从清华大学获得了学士学位,于2020年从香港中文大学获得博士学位,师从林达华教授,目前任商汤科技研究总监。他作为主要负责人之一推动OpenXRLab开源体系建设,在相关领域的顶级会议或期刊上发表了30余篇论文,包括CVPR,ICCV,ECCV,NeurIPS,SIGGRAPH和T-PAMI等,参与的工作曾入选计算机视觉顶级会议CVPR 2023最佳论文列表(0.1%)。

报告题目:3D参数化人体运动的捕捉与生成

时间:8月16日 13:30-15:20

地点:三楼国际厅B+C

报告摘要:在生成式AI时代,数据是Scaling Law的必要条件,而3D人体运动数据的匮乏制约了其生成模型的发展。实际上,3D人体运动数据并非稀缺,但由于格式繁杂等原因,其统一利用面临诸多困难。本次报告将介绍我们近期的几篇工作,探讨如何统一多种3D人体运动数据集,将3D参数化人体运动的捕捉与生成推向更大的规模。


5F60


论坛讲者:黄其兴 德州大学


讲者介绍:黄其兴于2012年从斯坦福大学获得了博士学位,师从Leonidas Guibas教授。本科和硕士就读于清华大学。目前德州大学奥斯丁分校计算机系副教授。他的主要研究方向包括计算机图形学,计算机视觉和机器学习,在相关领域的顶级会议或期刊上发表了100余篇论文,包括SIGGRAPH/SIGGRAPH Asia, CVPR, ECCV,ICCV, NeurIPS, ICML, 和ICLR等。所写论文多次获得最佳论文奖和最佳论文提名,包括2013 Symposium on Geometry Processing 最佳论文奖。别的奖项包括2021 NSF Career Award。他多次担任顶会的程序委员会委员以及领域主席。


报告题目:从二维和三维的混合数据来学习三维基础模型

时间:8月16日 13:30-15:20

地点:三楼国际厅B+C

报告摘要:我们处在基础模型的时代。大语言和大语言视觉模型体现的很强的能力,它们产生了很多实际的运用,然后这个趋势会进一步发展。关于基础模型一个很重要的信息是数据的尺度和干净的数据要远远比数据的表示和训练的方法重要。但是在三维世界里面我们遇到的问题就是我们没有以及将来也很难有图片和文本那种尺度的数据。这个报告会介绍我们近期的一系列工作来怎么从图片数据里来学习三维基础模型。


上一篇:几何深度学习技术论坛返回首页下一篇:构建大模型的国产软硬件生态