时间:2025-05-08 来源: 中国图象图形学学会
一、活动简介
“CSIG图像图形中国行”是由中国图象图形学学会主办的学术活动,旨在推动图像图形学科的普及,加强各高校研究所以及企业间的交流。自2017年4月起,分别在扬州大学、哈尔滨工业大学、兰州大学、杭州电子科技大学、北京交通大学、海南大学、福州大学、西北农林科技大学、佛山科技学院等及深圳、烟台成功举办了100余期,线上线下参会人数累计数万人次,受到业界好评。本次“CSIG图像图形中国行”由CSIG智能图形专委会与中南大学联合承办,交流主题为“三维世界的生成、感知与计算”。
主办单位:中国图象图形学学会(CSIG)
承办单位:CSIG智能图形专委会、中南大学
会议时间:2025年05月11日15:00
会议地点:中南大学潇湘校区信息楼535 报告厅
二、执行主席
夏佳志 教授
中南大学计算机学院副院长、教授,入选国家级青年人才。主要研究领域为数据可视化、计算机图形学。主持国家自然科学基金区域联合重点项目、军科委重点课题、湖南省杰出青年科学基金等项目,获CHI 2025最佳论文提名、IEEE VIS 2020 最佳论文提名,IEEE CAD/Graphics 2017最佳论文,任ChinaVis 2021 论文共同主席, ChinaVis 2019-2020 前沿综述共同主席,IEEE VIS 2025 Short Paper 共同主席,CCF CAD/CG 2025程序主席、《计算机辅助设计与图形学学报》编委,《Frontiers of Computer Science》与《Visual Informatics》青年编委。
三、特邀专家
张兆翔 研究员
个人简介:张兆翔,博士,研究员,博士生导师,IAPR Fellow,长江学者特聘教授,中国科学院自动化研究所模式识别实验室常务副主任,中国科学院大学岗位教授。研究兴趣包括:模式识别、具身智能、智能体学习,在IEEE T-PAMI、IJCV等顶级期刊与CVPR、ICCV、ECCV、NeurIPS等顶级会议发表论文200余篇,授权专利30余项,承担了国家自然科学基金重点项目、重点国际(地区)合作研究项目、中电科企业联合重点支持项目等多项国家级科研项目,多次担任CVPR、ICCV、NeurIPS、ICLR等顶会Area Chair。以第一完成人获得北京市科学技术奖科技进步奖一等奖。
报告题目:世界模型初探:重建、生成与推演
报告摘要:当下人工智能的发展日新月异。一方面,以多模态大模型、生成式大模型为代表的新技术层出不穷;另一方面,以具身智能、Agent为代表的新应用不断深入。在这些技术与应用的衔接中,世界模型是最关键的核心使能技术。本报告着重阐述世界模型的重要价值和可行性,从真实场景重建、多元环境生成和推演未来状态,探讨构建世界模型的关键技术路线和我们在相关路线上初步探索,最终目标是打通从构建到仿真的完整闭环,打破虚拟和现实世界的界限,为无人具身系统提供可靠的训练场。最后本报告将阐述在世界模型构建的思考与展望。
许威威 教授
个人简介:许威威,浙江大学计算机科学与技术学院CAD&CG国家重点实验室长聘教授,教育部长江学者。曾任日本立命馆大学博士后,微软亚洲研究院网络图形组研究员, 杭州师范大学浙江省钱江学者特聘教授。主要研究方向为智能三维感知、重建和仿真。在国内外高水平学术会议和期刊发表论文100余篇,其中ACM Transactions on Graphics, IEEE TVCG、IEEE CVPR、AAAI等CCF-A类论文60余篇。获中国和美国授权专利15项。所开发的高精度、高真实感三维重建技术在先临高精度扫描仪、百度阿波罗自动驾驶仿真平台、华为河图和徐工机械远程驾驶舱、凌迪数码服装仿真中得到应用。2014年受国家自然科学基金优秀青年基金资助,主持国家自然科学基金重点项目一项。
报告题目:端到端的三维内容构建技术研究
报告摘要:近年来,三维场景的端到端重建技术极大提升了从图像自动恢复三维表达的自动化程度,在基于图像的绘制、逆向重建等领域获得了快速的发展。该表达可通过可微绘制技术从传感器数据直接构建几何和材质的隐式表达,简化了传统场景构建技术流程,支持自由视点绘制、体积视频和全息会议等虚拟现实应用。本报告聚焦于介绍神经隐式场、3DGS及其中关键技术原理,并对其在场景重建、材质计算、人体重建等三维内容构建上取得的进展进行介绍。
刘偲 教授
个人简介: 刘偲,北京航空航天大学人工智能学院副院长,教授,博士生导师,中国图象图形学学会理事、副秘书长。曾获获国家科技进步二等奖,中国图象图形学学会自然科学奖一等奖。国家自然科学基金优秀青年基金获得者,主持企业创新发展联合基金重点支持项目等多个项目,担任科技创新2030-重大项目课题负责人。主要从事具身智能与多模态内容理解的研究工作,发表CCF-A类论文100余篇,Google Scholar引用16000余次。
报告题目:大模型时代的无人机视觉语言导航
报告摘要:近年来,对大语言模型的不断探索为增强具身智能决策的可解释性和可控性开辟了新的途径。然而,基于大模型的规划器仍然面临着重大挑战,包括大量的资源消耗和极长的推理时间,这对实际部署构成了重大障碍。鉴于这些挑战,本次报告介绍了异步大模型增强闭环决策框架,解耦了大模型和小模型规划器的推理过程。分别在无人机视觉语言导航与自动驾驶场景进行了验证,取得了优异的导航性能。
王树徽 研究员
个人简介:王树徽,中科院计算所研究员,博导。2006年于清华大学获得工学学士学位,2012年7月于中国科学院计算技术研究所获得工学博士学位,2014年10月从中国科学院计算所博士后出站并留所工作,历任助理研究员、副研究员(2015)、研究员(2020)。从事计算机视觉、多媒体分析、机器学习等方向研究,提出了扁平学习、可信多模态学习等理论方法框架,在人工智能领域顶级期刊和会议论文110余篇,申请专利20余项、合作撰写译著1本;担任多个国际顶级会议的领域主席和领域内重要期刊的编委会成员或客座编委,在高水平国际会议上组织了多次学术专题研讨会和学科竞赛;承担科技部重点研发项目课题、基金委优秀青年科学基金等十余项国家级/省部级项目,作为子课题负责人或技术骨干参与科技创新2030-新一代人工智能重大项目、973课题、863项目/课题的研究工作,参与完成了“中国人工智能2.0发展战略研究”中“跨媒体智能”部分内容撰写;获得吴文俊人工智能自然科学一等奖、北京市科技进步二等奖、全国多媒体大会最佳论文奖、领跑者5000(F5000)中国精品科技期刊顶尖学术论文等奖励,研究成果在智能制造、辅助设计、网络内容服务、视频分析等场景中得到验证和应用。
报告题目:扁平学习-去中心化的神经拟态计算框架
报告摘要: 深度学习虽已取得巨大成功,然其以规模化为核心目标的技术体系存在计算复杂、能耗巨大等诸多问题,并非模拟人脑机制的最优方式。本报告从神经元连接建模角度出发,阐述了如何从哈密顿动力学视角将神经元系统解耦,并将其作用关系用路径积分进行建模,提出了扁平学习的神经计算系统规模化构建思想,由此出发提出了深度学习->扁平学习的异构模型转换方法,并在语言、视觉、图等数据模态上尝试实现了扁平化模型的训练,进一步将该思想应用到基础模型的参数微调任务中,在常识推理、图像分类/检测/识别、图/节点分类等任务上进行了方法验证。最后结合已取得的进展,对该理论框架的未来发展方向进行探讨。
四、会议流程
15:00-15:30主题报告:张兆翔研究员
15:30 -16:00 主题报告:许威威教授
16:00-16:30 主题报告:刘偲教授
16:30-17:00 主题报告:王树徽教授
五、联系方式
承办方联系人:夏老师 18692258120 xiajiazhi@csu.edu.cn
主办方联系人:王老师 010-82544754 info@csig.org.cn