CSIG图像图形学科前沿讲习班—"空间智能基础与进阶"

时间:2025-07-01      来源: 中国图象图形学学会

2025年6月28日-29日,由中国图象图形学学会(CSIG)主办、深圳大学与广东省图象图形学会承办的第33期图像图形学科前沿讲习班(IGAL33)在深圳达实大厦会议中心举办。本期讲习班主题为“空间智能基础与进阶”由深圳大学胡瑞珍教授担任学术主任,来自学术界与工业界的10位专家学者和103位学员齐聚一堂,共同探讨空间智能的发展与机遇,讲习班现场专家学者倾情分享,学员认真学习,全程在学术的热情烘托下热烈进行。

BJ2A8171.jpg

讲习班活动现场

6月28日上午,讲习班学术主任、CSIG智能图形专业委员会副主任胡瑞珍教授致开班辞。她对嘉宾和参会者对活动的支持表示衷心感谢,并对本次讲习班的组织情况进行简要介绍,嘉宾和学员们将围绕空间感知、空间推理、空间想象与空间交互四大专题进行主题学习与交流。

BJ2A7849.jpg

胡瑞珍教授致开班辞

随后,空间感知专题汇报正式开始,本专题由清华大学深圳国际研究生院唐彦嵩研究员主持。

BJ2A7865.jpg

唐彦嵩研究员介绍专题讲者

浙江大学崔兆鹏研究员做了题为“空间智能中的相机位姿估计:从传统几何优化到神经渲染优化”的报告。他系统介绍了相机位姿估计的理论基础,回顾了在传统几何优化范式下的经典方法,重点探讨了基于神经渲染的位姿估计与同步定位与建图技术的最新进展,最后总结并展望了相机位姿估计系统在准确性、扩展性、可解释性、多模态融合等方面的未来方向。

BJ2A7888.jpg

崔兆鹏研究员进行专题报告

香港大学赵恒爽助理教授做了题为“深度估计”的报告。他详尽梳理了深度估计技术的发展脉络,包括传统方法、基于深度学习的方法、以及最新的基于数据驱动的创新算法,详细说明了这些方法的优势与局限,并展示了许多令人印象深刻的应用实例。此外,他还探讨了深度估计面临的主要挑战,包括如何处理纹理匮乏等问题,以及如何提升深度估计的精确度与稳定性。 

BJ2A8140.jpg

赵恒爽助理教授进行专题报告

香港科技大学刘缘助理教授做了题为“从神经场表达到生成模型的三维重建算法技术更迭”的报告。他系统梳理了神经场表达 NeRF、NeuS 向 Gaussian Splatting 演进的技术脉络,深度剖析了其在三维重建任务中的迭代路径与未来趋势。同时,报告聚焦 3R 系列创新技术与生成式模型的发展,探讨了这些新技术如何重塑传统三维重建范式,并讨论了未来三维重建可能的发展方向。

BJ2A8293.jpg

刘缘助理教授进行专题报告

6月28日下午,空间推理专题报告正式开始,本专题由香港中文大学(深圳)韩晓光助理教授主持。

BJ2A8524.jpg

韩晓光助理教授介绍专题讲者

香港大学齐晓娟助理教授做了题为“三维空间理解:从模型设计到数据设计”的报告。她介绍了三维空间理解方面的最新进展,涵盖了从模型设计到数据设计。在模型设计方面,她将介绍了三维点云处理中的关键架构演进——从 PointNet、自适应卷积到基于 Transformer 的框架,展示了这些构建模块如何在提升模型能力的同时解决计算效率问题。在数据设计方面,她深入探讨了自监督训练、合成数据的利用以及知识蒸馏等技术在三维模型中的应用。

BJ2A8507.jpg

齐晓娟助理教授进行专题报告

上海人工智能实验室王泰博士做了题为“下一代三维多模态大模型:迈向在线时空理解推理”的报告。他的报告聚焦于如何实现大模型高效的在线时空理解,介绍了领域内在线三维感知推理的基础进展,详细梳理了大语言模型同构的新型三维多模态大模型流式推理范式及相关基准,并介绍了下游时空推理、精确定位、视觉语言导航等核心任务的应用和挑战。

BJ2A8533.jpg

王泰博士进行专题报告

在茶歇环节,专家学者和学员们在间歇之余开展了面对面深入交流,在品尝美食的过程中不断碰撞出新的思维火花。

BJ2A8668.jpg

茶歇环节

随后是讲习班的Panel环节,当天进行汇报的五位讲者回答现场师生提出的问题并就热点学术问题开展讨论,例如如何提升大模型空间理解能力等,现场同学也就自身科研生活中遇到的问题向各位专家学者寻求建议。本场Panel环节由韩晓光助理教授主持,现场热情高涨,交流氛围浓厚。

BJ2A8694.jpg

Panel环节

6月29日上午,空间想象专题汇报正式开始,本专题由中山大学李冠彬教授主持。

BJ2A8827.jpg

李冠彬教授介绍专题讲者

浙江大学彭思达研究员做了题为“面向自动驾驶仿真的动态街景重建技术导论”的报告。他分析了自动驾驶仿真对自动驾驶的价值及其包含的功能模块,展示了自动驾驶仿真对于动态场景建模技术的需求,包括多模态仿真质量、几何重建质量、场景丰富度,并在此基础上,介绍了动态街景重建技术的基础与最新进展,讨论了当前仍存在的重要问题。

BJ2A8947.jpg

彭思达研究员进行专题报告

上海科技大学顾家远助理教授做了题为“面向机器人操作的仿真:挑战与前沿进展”的报告。他的报告系统探讨了面向机器人操作的仿真技术体系,深入分析了机器人操作仿真面临的核心挑战与技术难点,系统梳理了主流仿真平台的设计理念与创新实践,他从图形学视角出发,分享了具身智能的仿真素材生成前沿工作。 

BJ2A9113.jpg

顾家远助理教授进行专题报告

腾讯ARC Lab胡文博研究员做了题为“基于视频生成模型的场景演变生成最新进展”的报告。他系统梳理了视频生成模型中对相机控制的主流方法、演进路线及各自特点,并在此基础上,从动态可控性、光照可控性、物理一致性等方向对现有方法进行梳理介绍,系统总结了当前场景生成所面临的挑战。

BJ2A9271.jpg

胡文博研究员进行专题报告

6月29日下午,空间交互专题报告正式开始,本专题由国防科技大学徐凯教授主持。

BJ2A9480.jpg

徐凯教授介绍专题讲者

香港大学李弘扬助理教授做了题为“机器人导航:现状与挑战”的报告。他系统介绍了传统机器人导航的基本概念和基础原理,总结了传统方法存在的缺点,并引入了具身智能导航任务以及面临的挑战。此外,他还系统梳理了导航任务常用的室内外模拟环境和评价标准,总结了现有方法和未来仍面临的挑战。

BJ2A9464.jpg

李弘扬助理教授进行专题报告

清华大学弋力助理教授做了题为“从人-物交互中学习通用具身操作技能”的报告。他的报告聚焦于从人类手与物体交互的运动数据中学习通用的灵巧操作技能,他以灵巧抓取、灵巧操纵、人形机器人与人类交互三个方向为切入点,详细梳理了现有工作及其优缺点,并对现存挑战进行了系统总结。

BJ2A9486.jpg

弋力助理教授进行专题报告

Panel环节由国防科技大学徐凯教授主持,当天进行汇报的讲者和现场师生就一些具体问题如Sim-to-Real过程中物理参数的设置和未来研究方向开展了热烈讨论,碰撞出许多思维的火花。在激烈的讨论氛围中,本次讲习班圆满结束。

BJ2A9748.jpg

讲习班圆满结束



Copyright © 2025 中国图象图形学学会

京公网安备 11010802035643号 京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服