时间:2023-09-28 来源: 中国图象图形学学会
CSIG图像图形技术挑战赛是由中国图象图形学学会(CSIG)主办的系列赛事,旨在促进我国图像图形技术及相关产业的发展和应用,解决企业面临的技术难题,扩大企业宣传规模,帮助企业吸引更多的优秀人才。
第四届CSIG图像图形技术挑战赛包含九个竞赛项目:“光照渲染及渲染优化”、“实时流体粒子物理仿真动画加优化”、“行人属性识别”、“开放世界目标检测竞赛”、“CSIG FAT-AI 2023 人脸活体检测挑战赛”、“基于AI的量化选股投资策略建模与可视分析”、“表格结构识别挑战赛”、”视觉惯性里程计“和”激光雷达里程计“。共计3084支队伍参赛。
比赛结果可查询学会竞赛网站:http://challenge.csig.org.cn。
竞赛项目一
光照渲染及渲染优化
图 1 承办方AMD介绍光照渲染及渲染优化赛道
竞赛项目一由中国图象图形学学会(CSIG)和AMD承办。通过模拟光线的反射、折射、散射等物理特性,光线追踪可以创建高质量的视觉效果,呈现出真实世界中的光照效果,增强用户的沉浸感和真实感,广泛应用于电影、游戏、虚拟现实等娱乐产业中。
本项目提出了搭建一套支持光线追踪渲染技术的引擎的任务。赛事方提供比赛用场景,参赛者实现光追功能。本项目目的在对当前的光线追踪渲染技术进行探索,进一步促进当前该方向的发展。
图 2 光照渲染及渲染优化赛道颁奖
竞赛项目二
实时流体粒子物理仿真动画加优化
图 3 承办方AMD介绍光照渲染及渲染优化赛道
竞赛项目二由中国图象图形学学会(CSIG)和AMD承办。实时流体粒子物理仿真动画加优化通过仿真粒子的物理属性和行为,可以模拟流体的流动、碰撞、分裂等各种特性,使得动画更加真实、生动,让观众更好地沉浸其中,还能保证动画在实时环境中的性能和响应速度,为交互体验提供更好的表现。
本项目提出了搭建一套硬件光线追踪技术作为碰撞检测的实时流体粒子物理仿真动画引擎的任务。 要求参赛者实现粒子间相互受力的实时动态效果,包含经典流体粒子仿真模型。
图 4 实时流体粒子物理仿真动画加优化赛道颁奖
竞赛项目三
行人属性识别
图 5 承办方天翼云介绍行人属性识别赛道
竞赛项目三由天翼云科技有限公司承办。随着人工智能的急速发展,行人属性识别在视频监控等领域有着良好的应用场景。行人属性识别是指基于行人图像,检测出行人后再判断行人具备哪种属性的过程。行人属性大多为与个体相关的语义特征,比较常见的行人属性包括性别、年龄、服饰的颜色款式及是否有背包、帽子等附属物品。被广泛应用于危险行为预警、交通违章监控、工业安防和自动售货机、自动柜员机、商场和车站等公共场所的目标人物锁定等领域。行人属性识别的应用能大规模提高在监控视频中提取有效信息的效率,降低人力物力的消耗。
本竞赛项目提出了基于多任务的细粒度图像分类任务——行人属性识别,目的在于锻炼参赛者解决真实场景问题的能力,为细粒度图像分类领域提供新的解决思路,推动其在真实场景下的落地。
图 6 行人属性识别赛道颁奖
竞赛项目四
开放世界目标检测竞赛
图 7 承办方360公司介绍开放世界目标检测赛道
竞赛项目四由360公司承办。目标检测是计算机视觉中的核心任务之一,主要目的是让计算机可以自动识别图片中目标的类别,并标示出每个目标的位置。当前主流的目标检测方法主要针对闭集目标开发,即在整个任务前期需要对待检测目标进行类别定义,并进行人工数据标注,通过有监督模型训练使模型达到目标检测的目的。这一方式可以处理的待检测目标通常限定在几十类以内。但是当需要检测的目标类别增加到几千、万类时,上述方式在数据标注环节上已无法应对。与此同时,已训练模型也无法应对新的类别。当有新的类别出现时,需要手动进行标注并再次训练该模型,整体效率较低。
本竞赛项目提出了一种开放词集目标检测——开放世界目标检测竞赛,旨在为解决上述问题提供新思路,推动目标检测算法开发。
图 8 开放世界目标检测赛道颁奖
竞赛项目五
CSIG FAT-AI 2023人脸活体检测挑战赛
图 9 承办方视频图像信息智能分析与共享应用技术国家工程实验室介绍人脸活体检测赛道
竞赛项目五由视频图像信息智能分析与共享应用技术国家工程实验室承办,中国科学院自动化研究所协办。如今,人脸识别技术在各行各业中的应用越来越广泛,给人们日常生活带来便利的同时,也面临着各类人脸欺诈攻击。一旦虚假人脸攻击成功,极有可能对用户造成重大损失,因此针对防欺诈的人脸活体检测技术的深入研究已经势在必行。
本次挑战赛旨在对人脸真伪进行判断,即判断视频或图像中捕获的人脸是否来自一个真实的人脸,还是来自照片或面具伪装的人脸。挑战赛的测评数据集来源于开放场景。
图 10 人脸活体检测赛道颁奖
竞赛项目六
基于AI的量化选股投资策略建模与可视分析
图 11 承办方百度飞桨介绍基于AI的量化选股投资策略建模与可视分析赛道
竞赛项目六由百度飞桨承办。量化选股投资策略建模是一种利用数学和计算机方法来分析市场数据,以确定投资组合的投资策略。量化选股投资策略通常采用机器学习(如线性回归、决策树等)和深度学习(如LSTM、Transformer、CNN等)等方法,发现潜在的市场趋势和规律,并据此制定有效的交易决策。这种方式不仅解决了传统主观判断带来的偏差问题,还提升了交易效率与回报水平,是量化投资人员常用的技术手段。
在此任务中,工银瑞信为赛事提供的训练数据为近十余年、976万条真实脱敏股票因子特征数据,为参赛选手提供了重要的实践素材,供参赛者进行建模,对股票的未来收益率进行预测,并制定有效的投资策略。
图 12 基于AI的量化选股投资策略建模与可视分析赛道颁奖
竞赛项目七
表格结构识别挑战赛
图 13 表格结构识别赛道赛题
竞赛项目七由语音及语言信息处理国家工程研究中心和科大讯飞股份有限公司承办。在知识信息时代,文档是知识数据库创建、光学字符识别(OCR)、文档检索等众多认知过程的重要信s息来源。表格作为一种特殊的实体,以简洁的形式传达重要信息,在金融、行政、档案文件等领域非常普遍。利用计算机对表格结构进行识别还原,能够辅助更高效地处理表格信息,具有非常重要的应用价值。
随着深度学习的迅猛发展,表格结构识别技术也取得了许多新的进展。为全面评估表格结构识别系统的性能,本次赛题收集了来源不用场景下的表格图像(有线表格和无线表格),如电子文档、拍照表格图像等。部分表格图像存在复杂背景、图像形变等,使得该任务极具挑战性。
图 14 表格结构识别赛道颁奖
竞赛项目八
视觉惯性里程计
图 15 承办方厦门大学介绍视觉惯性里程计赛道
竞赛项目八由厦门大学、CSIG三维视觉专业委员会承办。视觉惯性里程计是SLAM中的重要技术之一,已经达到了成熟的水平。尽管在精度、速度、或鲁棒性上,视觉与惯导融合的里程计都具有很好的性能。但是现阶段,越来越多的研究者开始研究SLAM系统的整体性能。此外,在实际运用中,视觉惯性里程计面临很多问题,例如光照、场景的突变、非惯性系等困难场景中的定位。
因为上述问题,本竞赛项目推出一个数据集,并开放可提交的视觉惯性里程计榜单用于参赛者挑战,赛事将基于该数据集,从跟踪精度、跟踪速度和计算效率等方面对提交的SLAM系统的整体性能进行评价。
竞赛项目九
激光雷达里程计
图 16 激光雷达里程计赛道答辩
竞赛项目九由厦门大学、CSIG三维视觉专业委员会承办。激光雷达里程计作为SLAM中最重要技术之一,近些年来得到了深入的研究。相较于其他传感器,激光雷达里程计具有精度高、速度快、鲁棒性强等优点。但是,在实际使用中,激光雷达里程计依然存在长时间运行垂直偏移、受动态物体影响大等问题。
因为上述问题,本竞赛项目推出一个数据集,并开放可提交的视觉惯性里程计榜单用于参赛者挑战,赛事将基于该数据集,从跟踪精度、跟踪速度和计算效率等方面对提交的SLAM系统的整体性能进行评价。
图 17 激光雷达里程计赛道颁奖
总决赛获奖队伍
第四届CSIG图像图形技术挑战赛总决赛于第十二届国际图像图形大会(ICIG2023)期间举行。各竞赛项目的冠军队伍参加了总决赛,中国图象图形学学会理事、副秘书长、北京航空航天大学刘偲教授主持总决赛。由中国图象图形学学会常务理事、安徽大学罗斌教授,以及中国图象图形学学会理事、华东师范大学吕岳教授、云南大学钱文华教授、中南大学蒋朝辉教授、北方民族大学周涛教授担任总决赛的评委。根据各竞赛项目冠军队伍现场答辩情况,总决赛评出冠军、亚军队伍各一支,季军队伍两支,并由中国图象图形学学会理事、竞赛与培训工作委员会主任、华中科技大学桑农教授宣布了竞赛结果。2023年9月23日晚宴上,举办了CSIG图像图形技术挑战赛总决赛的颁奖仪式,学会副理事长王涌天教授、赖剑煌教授、副理事长兼秘书长马惠敏教授分别为第四届CSIG图像图形技术挑战赛总决赛冠、亚、季军队伍颁发荣誉证书。
图 18 刘偲教授主持总决赛
图 19 总决赛评委专家
图 20 总决赛现场
图 21 总决赛冠军队伍颁奖
总决赛冠军为“光照渲染及渲染优化”竞赛项目的“提瓦特观光”团队,团队成员有刘剑澎、朱鹏辉、余斐然,他们来自华南理工大学。
图 22 总决赛亚军队伍颁奖
总决赛亚军为“CSIG FAT-AI 2023人脸活体检测挑战赛”竞赛项目的”参赛选手王东,来自杭州魔点科技有限公司。
图 23 总决赛季军队伍颁奖
总决赛两支季军之一为“表格结构识别挑战赛”竞赛项目的“DDDC”团队,熊嘉诚是团队成员,来自中国科学院上海药物所。另一支季军为“激光雷达里程计赛道”竞赛项目的“Peach-SLAM“团队,团队成员有袁子康、郎丰天、汪潇翔、徐天乐,指导老师是杨欣,他们来自华中科技大学。
第四届CSIG图像图形技术挑战赛圆满结束。