年度热点回顾
.
发布人:  发布时间:2024-08-11   动态浏览次数:


年度热点回顾

主持人:韩晓光  香港中文大学(深圳)


韩晓光博士,现任香港中文大学(深圳)理工学院助理教授,校长青年学者。他于2017年获得香港大学计算机科学专业博士学位。其研究方向包括计算机视觉和计算机图形学等,在该方向著名国际期刊和会议已发表论文近100篇,包括顶级会议和期刊SIGGRAPH(Asia), CVPR, ICCV, ECCV, NeurIPS, ACM TOG, IEEE TPAMI等。他曾获得吴文俊人工智能优秀青年奖,广东省杰出青年基金资助,香港中文大学(深圳)青年科研奖。目前也担任CVPR2023/2024,NeurIPS 2023以及ECCV2024领域主席,同时也是IEEE TVCG 以及 Computer&Graphics 的编委。他的工作曾两次获得CCF图形开源数据集奖(DeepFashion3D和MVImgNet),曾两次入选CVPR最佳论文列表。


时间:8月18日 15:10-16:40

地点:三楼国际厅B+C




报告人:陈冠英 中山大学


陈冠英,现任中山大学网络空间安全学院副教授,博士生导师。本科毕业于中山大学,并于2021年初在香港大学取得博士学位。近年来在领域内一流的期刊和会议(如CVPR/ICCV/ECCV与TPAMI/IJCV)上发表了20余篇工作,其中多篇论文入选Oral/Spotlight报告。主持国自然青年基金和深圳市优秀科技创新人才培养‐青年项目,入选2021年百度全球AI华人新星百强榜单。担任NeurIPS 2024领域主席、CSIG-3DV专委委员、VALSE和GAMES执委委员。


报告题目:智能三维内容生成

时间:8月18日 15:10-16:40

地点:三楼国际厅B+C

报告摘要:近年来,随着先进神经表示和生成模型的出现,三维内容生成领域发展迅速。这些先进技术使得高质量和多样化的三维模型生成成为可能。本报告将回顾三维内容生成领域的年度进展,介绍该领域仍面临的问题和挑战,并展望未来的发展趋势。






报告人:马月昕 上海科技大学


马月昕,上海科技大学研究员、助理教授、博导。博士毕业于香港大学,曾到法国国家信息与自动化研究所、美国北卡罗莱纳大学教堂山分校、百度研究院进行访问学习。主要研究方向为三维视觉、机器人,尤其是三维场景理解、多模态感知、具身智能、自动驾驶等。共发表相关领域顶会或顶刊论文60余篇,包括Science Robotics、TPAMI、CVPR、ICCV、ECCV、SIGGRAPH、AAAI等。获得上海市领军人才(海外)、上海市优秀教学成果(高等教育类)一等奖、国家自然科学基金青年基金项目等。曾获SemanticKITTI、NuScenes、Argoverse等多个自动驾驶挑战赛冠军和亚军。


报告题目:面向具身智能的通用模型年度进展报告

时间:8月18日 15:10-16:40

地点:三楼国际厅B+C

报告摘要:具身智能依赖于物理实体与环境的动态互动来感知信息、解析问题并执行任务,是智能科学最前沿的研究方向之一,也是迈向通用人工智能的关键路径之一。感知、认知与行为是具身智能中的主要模块,三者相互依存、相互制约,共同构成闭环的动态智能系统。本报告将概述具身智能中感知、认知与行为的通用模型研究的最新进展,并对目前存在的挑战与未来的研究方向进行探讨。





报告人:晏轶超 上海交通大学


晏轶超,上海交通大学人工智能研究院助理教授,博士生导师。获上海交通大学电子工程系学士、博士学位,法国里昂中央理工学院硕士学位,曾担任阿联酋起源人工智能研究院研究科学家。主要研究方向为三维数字人技术,发表包括TPAMI、CVPR、NeurIPS在内的论文30余篇。先后主持国家自然科学基金青年项目、CCF-阿里巴巴青年科学家基金等项目8项。曾入选上海市海外高层次人才计划,获2020年度中国图象图形学学会优秀博士论文奖。


报告题目:数字人技术年度进展报告:重建、编辑与生成

时间:8月18日 15:10-16:40

地点:三楼国际厅B+C

报告摘要:面对大规模三维数字人的生产需求,利用生成式人工智能技术产生高拟真,规模化的虚拟数字人正逐渐成为研究热点。三维高斯、大模型等技术在过去一年快速发展,并与数字人技术进行了广泛结合,本次报告将从数字人重建、生成、编辑等方向介绍数字人领域的最近进展,对数字人技术的发展趋势进行探讨。





报告人:曾爱玲 腾讯


曾爱玲目前是腾讯的资深研究员,研究方向包括以人为中心的视觉和多模态感知、理解、交互和生成,具体包括2D/3D人体姿态估计/动作识别/三维人体重建/基于LLM的动作理解,以及多模态可控的人物图片/动作/视频生成。她在香港中文大学计算机科学与工程系获得博士学位,在相关顶级学术会议CVPR、NeurIPS、ICLR、AAAI等上发表了三十多篇论文,谷歌学术引用超过两千次,主导的工作在Github star累计超过八千次,其中一篇第一作者的时空长序列预测文章评选为AAAI 2023最有影响力的Top-3研究工作。


报告题目:人物视频与动作生成年度进展

时间:8月18日 15:10-16:40

地点:三楼国际厅B+C

报告摘要:随着生成式人工智能的快速发展,以人为中心的视频和动作生成在过去一年里取得了显著的进展。不同于通用视频生成,人物视频生成会考虑更多以人为中心的技术设计与先验知识引入,使得相关领域的生成质量与可控性更高,更接近产业可应用的程度。本次报告将围绕这一领域的最新研究进展、梳理发展路线以及发展趋势展开。具体来说,我会分别介绍1.人物视频生成;2.人物动作生成的基本概念、相关任务、数据建设、关键技术与重要进展,包括动作捕捉与理解、生成模型在该领域的应用等。最后,报告还将探讨人物视频与动作生成的未来发展趋势与挑战,包括多任务多模态相互融合、精细化可控生成、与通用人物生成模型等。