时间:2025-07-12 来源: 中国图象图形学学会
本期讲习班以"交通智能前沿技术"为主题,旨在探讨人工智能与计算机视觉技术如何重塑现代交通系统。随着深度学习和大模型的迅猛发展,交通智能已从单点感知演进至全域感知-认知-决策的闭环体系,为城市交通管理与智能驾驶带来前所未有的技术变革。当前,多源异构数据融合已实现全天候、全场景的交通环境理解;时空预测模型能够准确把握交通流演化规律;而端到端的决策控制框架则使交通系统在复杂场景中展现出自适应与协同特性。然而,面对城市级交通场景的不确定性与开放性,我们仍需攻克诸多挑战:交通场景下的多模态数据融合与应用、开放场景下的具身感知与导航、以及智能交通信控系统的精准预测与优化等。
讲习班将邀请多模态大模型、具身智能、交通控制等领域的顶尖学者与工业界专家,通过理论前沿与实践案例的深度解析,共同探讨交通智能从感知到决策的技术路径与发展趋势。内容将覆盖场景理解与世界建模、强化学习在交通信控中的应用、具身智能驾驶技术等关键议题,并展望特定场景无人驾驶系统的商业化应用、体验质量评价、高保真数字人技术等前沿应用场景。我们期待通过此次讲习班,促进计算机视觉、人工智能与交通控制等多学科的深度交叉,共同推动交通智能技术的理论突破与实践落地,为未来城市智慧交通体系的构建提供科学引领与技术支撑。
01组织单位
主办单位:中国图象图形学学会(CSIG)
承办单位:CSIG交通视频专委会,北京航空航天大学青岛研究院
02日程安排
时间:2025年8月17日至8月18日
地点:山东省青岛市蓝海大饭店(青岛石老人海水浴场国际会展中心店)
03报名及注册费
1.本期讲习班限报120人,根据缴费先后顺序录取,报满为止。
2.2025年8月16日(含)前注册并缴费:CSIG会员2000元/人,非会员2500元/人(赠送1年CSIG会员);现场缴费:会员、非会员均为3000元/人;CSIG团体会员参加,按CSIG会员标准缴费;同一单位组团(5人及以上)报名,均按CSIG会员标准缴费。
3.注册费包括讲课资料和2天会议期间午餐,其它食宿、交通自理。
4.即日起至2025年8月16日,请登录会议注册网站注册。
5.会议注册网址:
https://meeting.csig.org.cn/10343
04学术主任
赵耀
赵耀,长江学者特聘教授、国家杰出青年科学基金获得者、万人计划科技创新领军人才、IEEE Fellow。现任“视觉智能交叉创新”教育部国际联合实验室主任、“科幻音视频智能处理”北京市重点实验室主任。研究领域为数字媒体信息处理与智能分析,包括图像\视频压缩,数字媒体内容安全,媒体内容分析与理解,人工智能、无人驾驶等。主持了新一代人工项目、973计划、863计划等项目30余项。在包括IEEE Trans.等国内外期刊、会议上发表论文200余篇。作为第一完成人获北京市科学技术奖一等奖等省部级奖励5项、世界互联网大会领先科技奖1项。指导的博士生8人获北京市和中国计算机学会优秀博士论文奖。受邀担任了 IEEE Transactions on Cybernetics、IEEE Transactions on Circuits and Systems for Video Technology等多个国际杂志编委。他是国务院学科评议组成员,科技部重点研发计划云计算与大数据专项总体组专家。
05特邀讲者
魏云超
魏云超,北京交通大学二级教授,教育部长江学者。曾在NUS、UIUC、UTS从事研究工作,主要研究方向包括面向非完美数据的视觉感知、多模态数据分析与推理、生成式人工智能等,发表TPAMI、CVPR等顶级期刊/会议论文100多篇,Google引用超27000次。入选AI 100、MIT TR35 China、百度全球高潜力华人青年学者、《澳大利亚人》TOP 40 Rising Star,获世界互联网大会领先科技奖、教育部自然科学奖一等奖、ImageNet目标检测冠军及多项CVPR竞赛冠军等奖励。主持国自然重大研究计划重点项目、国家重点研发计划青年科学家项目、北京市自然科学基金海淀联合基金重点项目等10余项。担任计算机学院科研副院长、“视觉智能交叉创新”教育部国际联合实验室副主任、“科幻音视频智能处理”北京市重点实验室副主任等职务。
报告题目:AI看交通:从图像识别到世界建模
报告摘要:图像识别技术在交通场景中的应用正从感知走向认知。早期方法依赖有监督的深度网络,完成各类识别任务。随着自监督学习的发展,模型逐步摆脱对大量标注的依赖,提升了泛化能力。近年来,视觉基座模型实现多任务统一建模,为复杂交通环境下的感知提供通用解决方案。进一步地,世界模型通过构建可预测的环境表征,使智能体具备规划与推理能力。本报告结合交通场景相关案例,回顾图像识别的发展脉络,探讨其在智能交通系统中的演进趋势与应用前景。
翟广涛
翟广涛,上海交通大学教授,上海人工智能实验室双聘研究员,IEEE Fellow,国家自然科学基金杰出青年基金获得者,多年从事多媒体智能相关研究,入选Clarivate全球高被引学者,获IEEE多媒体汇刊和IEEE广播技术汇刊最佳论文奖等国际奖励30余项。以第一完成人获得中国电子学会自然科学一等奖、技术发明一等奖及中国图象图形学学会技术发明一等奖,主持国家自然科学基金重点、国家重点研发计划等项目。任Elsevier期刊Displays主编、上海市图像图形学学会理事长。
报告题目:体验质量评价的进展与展望
报告摘要:回顾体验质量(QoE)评价领域的发展,包括针对PGC、UGC和AIGC等不同内容来源及2D/3D、VR/AR等呈现方式的视觉内容开展质量评价的技术路径,讨论近期的基于多模态大模型的视觉质量评价思路,介绍若干代表性成果,并对尺度法则约束下的QoE领域未来技术发展路径进行探讨。
孙宏滨
孙宏滨,国家级特聘教授,现担任西安交通大学人工智能学院副院长、人机混合增强智能全国重点实验室副主任。研究方向为嵌入式视觉、自主智能系统与智能芯片。围绕上述领域的国际学术前沿、国家重大需求,共发表国际顶级期刊/会议论文120篇,其中4篇论文获最佳(或提名)论文奖;获国家发明专利43项,集成电路布图专有权6项,主持国家级科研项目14项;获得国家技术发明二等奖、国家教学成果一等奖、陕西省自然科学一等奖、中国自动化学会自然科学一等奖、求是人工智能科教奖青年奖等。
报告题目:具身智能驾驶:技术现状与未来趋势
报告摘要:智能驾驶历经数十年发展,从早期辅助系统逐步迈向高度自动化阶段。当前 L2 级辅助驾驶已规模化应用,而具身智能的融入正推动其从 “数据驱动” 向 “物理交互” 升级。具身智能作为通过物理实体与环境实时交互的智能系统,强调感知、推理与行动的闭环,其核心在于多模态感知、生成式建模与自监督学习的融合,实现对复杂环境的动态理解与精准决策。未来,具身智能驾驶将聚焦多模态大模型融合、虚实协同训练及产业链生态构建,同时推动芯片国产化与开源生态建设,最终构建 “车路云协同” 的智能化交通生态。这一技术变革不仅重塑汽车产业底层逻辑,更将为智慧城市、智能制造等领域带来深远影响。报告将回顾智能驾驶发展的历史,重点介绍具身智驾的技术现状与未来趋势。
吕科
吕科,中国科学院大学特聘教授、博士生导师,国家级科技领军人才,科技部创新人才推进计划“中青年科技创新领军人才”,鹏城国家实验室双聘教授,国家重点研发计划“基础科研条件与重大科学仪器设备研发”专项项目首席科学家,享受国务院政府特殊津贴专家。主要研究方向为图像处理、智能信息处理技术。中国图象图形学学会交通视频专委会副主任,中国计算机学会多媒体专委会常委。
报告题目:高保真数字人技术研究进展与展望
报告摘要:2024年中国科协发布的十大前沿科技问题中,“情智兼备数字人与机器人”位列重大科学问题之首,充分彰显了国家在数字人技术发展领域的战略布局和高度重视。作为新一代智能交互的核心载体,高保真数字人技术正在深刻重塑通讯、教育、传媒等关键领域的应用范式。高真实感数字人技术通过深度融合计算机图形学、人工智能、多模态交互与物理仿真等前沿技术,构建出在外观形态、动作表现、情感表达及行为逻辑等维度全方位逼近真实人类的数字实体。其核心技术创新在于实现了从静态视觉呈现到动态行为逻辑的全维度交互仿真,能够在实时交互过程中持续保持自然流畅的沉浸式体验,最终创造出与人类无感知差异的数字形态。值得注意的是,高保真数字人不仅是技术工具的革命性突破,更深远影响着社会协作模式、文化形态演进乃至人类自我认知的重构。本报告将探讨数字人技术的关键突破与核心挑战,重点围绕数据构建、基座模型、控制编辑及沉浸交互等核心技术领域的最新研究进展展开论述,并对数字内容创作、智能客服与数字营销、人形机器人驱动等典型应用场景的落地挑战进行深入分析。
王兴刚
王兴刚,华中科技大学电信学院教授博导,国家“万人计划”青年拔尖人才,现任Image and Vision Computing期刊(Elsevier, IF 4.2)共同主编。主要从事基础模型、视觉表征学习、目标检测分割跟踪等领域研究、在IEEE TPAMI、IJCV、CVPR、ICCV、NeurIPS等顶级期刊会议发表学术论文80余篇,谷歌学术引用4万余次,其中一作/通讯1000+引用论文5篇,入选Elsevier 2023中国高被引学者。担任CVPR, ICCV, NeurIPS等会议领域主席,IEEE TPAMI、Machine Vision and Application等期刊编委。入选了中国科协青年人才托举工程,获湖北青年五四奖章、CSIG青年科学家奖、吴文俊人工智能优秀青年奖、CVMJ 2021最佳论文奖、湖北省自然科学二等奖等,指导学生获2022年全国“互联网+”大赛金奖、2023年挑战杯“揭榜挂帅”专项赛全国一等奖。
报告题目:面向端到端自动驾驶的多模态大模型
报告摘要:本次报告将介绍课题组围绕自动驾驶视觉感知和规划做出的一系列工作。首先将介绍如何以 Transformer 为核心,构建了驾驶场景三维目标和地图元素(MapTR,ICLR 23;LanGAP,ECCV 24;MapTRv2,IJCV 25)的稀疏表示并对其进行精确的定位,预测动态目标的运动轨迹,进而实现自车的轨迹规划(VAD,ICCV 23),以及如何进行高效的占据栅格预测(OSP,ECCV 24;Symphonies,CVPR 24;GaussTR,CVPR 25)。进而介绍在大模型时代如何利用多模态大模型来实现更加通用的端到端自动驾驶技术,包括面向端到端驾驶的截断扩散模型(DiffusionDirve,CVPR 25),视觉语言模型高层决策引导的端到端自动驾驶(Senna,arXiv 24),以及基于强化学习和多模态模型的自动驾驶(RAD, arXiv 25; AlphaDrive, arXiv 25; ReCogDrive, arXiv 25)。
余贵珍
余贵珍,北京航空航天大学交通科学与工程学院教授、博导,科技创新领军人才。长期从事车路智能感知与控制方向研究,创立露天矿山无人驾驶龙头企业踏歌智行。主持国家和省部委项目20多项,获国家科学技术进步奖二等奖1项、国家教学成果一等奖1项、省部级一等奖2项。发表SCI论文80多篇,授权发明专利140多项。
报告题目:特定场景无人驾驶运输系统关键技术和商业化应用思考
报告摘要:报告介绍了当前特定场景货物运输需求和痛点,分析当前自动驾驶技术发展现状和趋势,提出了特定场景无人驾驶运输系统架构。针对特定场景无人驾驶运输的需求特点,分析了特定场景无人驾驶运输核心关键技术与实现路径,并对特定场景无人驾驶运输技术应用和商业化进行了展望。
阚美娜
阚美娜,中国科学院计算技术研究所,研究员。研究领域为计算机视觉与具身智能。相关成果在TPAMI、IJCV、CVPR、ICCV等相关领域主流国际期刊与会议上面发表论文60余篇,获得FG PaSC视频人脸识别竞赛冠军、ACM MM亲属关系识别竞赛冠军、CVPR面部关键点定位竞赛亚军、FCS杰出论文奖。此外,获中国计算机学会优秀博士学位论文奖、中国图象图形学学会石青云女科学家奖青年奖、北京市科技新星计划等。
报告题目:开放场景具身感知与导航
报告摘要:近些年随着生成与具身智能技术的发展,开放环境的下的感知与导航取得了很大的突破,本报告将围绕结构以及半结构化场景的导航问题,介绍开放环境感知、世界模型、以及轨迹预测规划等内容。
闵万里
闵万里,深圳清华大学研究院数字化工程服务中心主任,中国科技部新一代人工智能战略咨询委员会委员,神思电子技术股份有限公司首席科学家,原阿里云机器智能首席科学家。浙江省海外高层次人才,山东省泰山产业领军人才。1997年毕业于中国科学技术大学少年班数理专业本科,2004年获得芝加哥大学统计学博士学位, 研究领域包括随机过程,网络流,概率论及机器学习。先后在IBM TJ Watson Research Center , IBM Singapore, Google, 阿里巴巴就职。获得40多项国内外专利授权,由人民出版社出版了4本专著。
报告题目: 多模态数据与强化学习应用于预测性交通信控
报告摘要:城市交通流的多模态时空数据采集愈加丰富,解析与融合的多维度网络流指标再代入道路网络的拓扑结构能够标定出局部动力学特征,在此基础上再构造奖励函数实现在线反馈强化学习的控制闭环。如果网络流是独立不相干或者长程弱相关性,可以证明 此方法的稳定性。并介绍基于这套方法的城市级别实战案例。
06 联系方式
联系人:黄老师
联系电话:010-82544754
邮箱:igal@csig.org.cn