CSIG图像图形中国行-中山大学将于11月17日举办

时间:2024-11-11      来源: 中国图象图形学学会

一、活动简介

“CSIG图像图形中国行”是由中国图象图形学学会主办的学术活动,旨在推动图像图形学科的普及,加强各高校研究所以及企业间的交流。自2017年4月起,分别在扬州大学、哈尔滨工业大学、兰州大学、杭州电子科技大学、北京交通大学、海南大学、福州大学、西北农林科技大学、佛山科技学院等及深圳、烟台成功举办了100余期,线上线下参会人数累计数万人次,受到业界好评。本次“CSIG图像图形中国行走进中山大学”由CSIG青年工作委员会与中山大学联合承办,交流主题为AIGC内容的守护与治理:生成多样性与可控性探索之旅

AIGC技术的飞速发展极大地丰富了数字媒体生态,但同时也引发了一系列挑战,如内容多样性和可控性无法兼顾,导致“有毒”内容的传播不受限;“幻觉”的存在降低了户对生成内容的信任度进而增加了AIGC落地难度。近年来,国家对AIGC生成内容治理政策的明确也反映了对此问题的关注。然而,在预防和治理AIGC生成内容方面,我国仍面临诸多挑战,并关系到国家安全和社会稳定。本论坛将聚焦于AIGC生成多样性与可控性问题,探讨在追求生成内容多样性的同时,如何确保生成的内容与用户提问强相关,准确度满足用户要求。在此基础上,识别并降低生成内容的“毒性”。针对AIGC内容治理的挑战,本次论坛将深入探讨如何通过技术创新提升生成内容的多样性和可控性,避免AIGC幻觉欺骗问题,并构建一个全面的内容生成预防与检测体系来降低有毒内容出现频率。

屏幕截图 2024-11-11 162916.png 

主办单位:中国图象图形学学会(CSIG)、中国计算机学会(CCF)

承办单位:中国图象图形学学会青年工作委员会、深圳市计算机学会大模型专委会、CCF YOCSEF深圳、CCF深圳、清华大学深圳国际研究生院、哈尔滨工业大学(深圳)、中山大学·深圳

时间:2024年11月17日 14:30-18:00

地点:深圳大学城清华大学深圳国际研究生院一期C栋502

    

二、执行主席

图片4.jpg

任文琦 教授

任文琦,教授,中山大学“百人计划”引进人才,主持国家自然科学优秀青年基金,天津大学与美国加州大学Merced分校联合培养博士,从事计算机视觉与多媒体内容安全领域的研究。在CCF-A类期刊和会议长文发表学术论文70余篇(6篇ESI高被引论文,2篇热点论文),Google学术引用12000余次,入选2022/2023爱思唯尔中国高被引学者。多次担任CVPR、ICLR、AAAI等AI和CV领域重要学术会议的领域主席和高级程序委员会委员。主持国家自然科学基金4项,深圳市优秀科技创新人才培养项目,华为、腾讯等企业合作项目。获中国计算机学会优博奖、吴文俊人工智能优秀青年奖、中国图象图形学学会自然科学一等奖(3/5)。

 

图片5.jpg

漆舒汉 副教授

哈尔滨工业大学(深圳)副教授,博士生导师,鹏城实验室双聘研究学者,中国计算机学会(CCF)会员,CCF-多媒体专委会执行委员,YOCSEF(深圳)学术秘书。曾任新加坡国立大学访问学者,腾讯优图实验室高级研究员。在国际著名学术会议和期刊上共发表论文50余篇,其中包括SIGIR, ICME, TMM,TNNLS等国际一流会议和期刊。与此同时,还是多个著名国际会议及期刊的委员及评委,其中包括IEEE TMM,IEEE TNNLS,IEEE TKDE,IJCAI等国际一流期刊和会议的审稿人。个人主持科研经费超过600万元,当前主持国家自然科学基金2项,广东省自然科学基金2项,参与国家重点研发计划共2项,中央军委重点项目3项。


三、特邀专家

图片1.jpg

罗文坚 教授

个人简介:罗文坚,博士,教授,博士生导师,广东省珠江人才计划领军人才,网络空间安全研究中心副主任,广东省安全智能新技术重点实验室副主任,鹏城实验室访问研究员。作为项目负责人承担了国家重点研发计划项目课题、国家自然科学基金面上项目等二十多项国家、省部级、市级以及企业合作项目。目前担任Information Sciences、Journal of Information Security and Application等期刊的副编辑或编委。曾任包括ICSI 2023大会主席、CCF B类会议PPSN 2020宣传主席、CCF C类会议IJCNN 2021讲座主席等在内的20多个国际国内学术会议程序委员会和组织委员会的各类主席。主要研究方向为人工智能与安全,在国内外重要学术期刊和会议上发表论文100多篇,其中IEEE/ACM Transactions和JCR一区期刊论文及CCF A类会议论文60多篇。

报告题目:人工智能安全中的对抗样本与模型逆向问题

报告摘要:随着人工智能技术,特别是深度学习模型的广泛应用,人工智能系统中的安全与隐私问题已成为一个重要的研究分支。本报告将简要介绍人工智能安全领域的一些进展,主要内容包括两个方面,即多标签对抗样本和模型逆向。对于多标签对抗样本,主要是介绍黑盒生成算法和完全黑盒生成方法,且这两种算法都基于差分进化设计的。对于模型逆向,将首先介绍基本思想,然后介绍两种基于差分演化的模型逆向测试技术。

图片2.jpg 

文德 研究员

个人简介:文德,清华大学经济管理深圳研究院大湾区数字经济研究中心AI技术负责人、特聘研究员。

 报告题目:智能体化工作流(Agentic Workflow)在跨学科研究中的作用与意义

 报告摘要:随着科学技术的飞速发展,跨学科研究已成为解决复杂问题和推动创新的关键途径。清AI智能体化工作流(TsingAW),由清华大学团队开发,作为一种构建、编排和运行多智能体系统的学术实验性框架,为跨学科研究提供了全新的方法和工具。本报告将深入探讨TsingAW在跨学科研究中的作用与意义。我们将详细介绍其核心概念、主要功能以及在会议决策、实证研究、数学模型验证等领域的实际应用。通过分析TsingAW如何促进不同学科之间的高效协作、加速知识共享与融合,我们将阐述其对提升研究效率、创新能力和成果质量的影响。最终,报告将为研究者提供在跨学科环境中实施TsingAW的策略与建议,助力更深入的学术交流和创新实践。

 

图片3.jpg 

袁粒 助理教授

个人简介:袁粒,北京大学信息工程学院助理教授、博士生导师、国家高层次青年人才,入选2022年国家优秀留学生奖(归国类)、2023年福布斯亚洲30U30等,主持国家科技创新2030重大项目课题和国自然基金等。 研究方向为多模态深度学习,代表性学术工作包括VOLO, T2T-ViT等深度神经网络框架,以第一/通讯作者在国际期刊和顶会上发表论文40余篇,包括Nature Computational Science、IEEE TPAMI/CVPR等,代表性一作论文单篇被引两千余次,代表性应用工作包括ChatExcel、Open-Sora Plan视频生成开源计划。

报告题目:生成未必理解:从视频生成到理解与生成统一架构

报告摘要:近几年以视觉-语言双模态为主的视频理解和生成领域蓬勃发展。当前主流视频多模态理解模型主要是借助大语言模型作为理解和逻辑推理的“中枢”,以自回归式Transformer为主干模型,而视频多模态生成仍然以扩散式Transformer (Diffusion Transformer)或者Diffusion ConvNets作为主要模型。所以视频多模态理解和生成在两条不同的技术路径上发展,当前已有的视频理解和生成一体架构大部分是依靠不同架构“搭积木”方式实现,原生的统一架构尚不成熟。要实现视频生成和理解统一的多模态架构,需要探索自回归式路径和扩散式生成的融合或者选择其一,本次报告先介绍团队的视频生成开源模型Open-Sora Plan,然后讲解探索视频生成的自回归式路线,以及将视频生成往多模态理解路线上统一,最后探讨未来生成理解可能的统一架构。


图片1(1).png 

张健 助理教授

个人简介:张健,北京大学深圳研究生院信息工程学院助理教授/研究员、博士生导师,视觉信息智能学习实验室(VILLA)负责人。主要围绕“智能可控图像生成”这一前沿领域,深入开展高效图像重建、可控图像生成和精准图像编辑三个关键方向研究。已在Nature Commun Eng、TPAMI、TIP、IJCV、SPM、CVPR、NeurIPS、ICCV、ICLR等高水平国际期刊和会议上发表论文100余篇,谷歌学术引用9600余次,h-index值为49(单篇一作最高引用1200余次);连续5年入选斯坦福全球前2%顶尖科学家榜单,获得北大青年教师教学比赛一等奖、华为MindSpore学术奖励基金项目优秀奖、国际期刊/会议最佳论文奖五次、NTIRE全球挑战赛冠军。致力于产学研相结合,成果应用于字节、免展、Stability Al、Hugging Face等国内外知名公司产品中。曾任YOCSEF深圳AC委员,现担任深圳市人工智能学会青工委主任、广东省图象图形学会理事、CSIG青工委委员、VALSE执行委员、JVCIR等国际期刊编委等。主页:https://jianzhang.tech/。

报告题目:基于大模型的视觉内容可控生成与篡改检测

报告摘要:扩散模型在图像和视频生成领域展现非凡的能力,其生成视觉效果令人瞩目。尽管如此,如何精确控制扩散模型以生成符合用户给定特定条件的视觉内容,仍然是一个充满挑战的技术难题。这涉及到可控视觉内容生成,包括细粒度控制和交互式编辑等多方面。本报告将展示团队在视觉内容可控生成这一前沿领域的一系列研究成果,进行不同维度归纳总结,涵盖零值域分解约束(DDNM)、能量函数引导(FreeDoM)、拖拽式编辑(DragonDiffusion)、适配器控制(T2I-Adapter)、运动内容控制(ReVideo)等。此外,还将分享团队在面向AIGC内容安全方面的探索和实践,包括多功能水印(EditGuard)以及基于多模态大语言模型的可解释图像篡改定位(FakeShield)等。


四、会议流程

微信截图_20241112091628.png

五、联系方式

承办方联系人:

张老师  15829105810  zhangyzh236@mail.sysu.edu.cn 

主办方联系人:

王老师  010-82544754   info@csig.org.cn



Copyright © 2024 中国图象图形学学会

京公网安备 11010802035643号 京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服