第二十七期 CSIG文档图像分析与识别专业委员会学术微沙龙成功举办

时间:2024-06-03      来源: 中国图象图形学学会

图片1.jpg

CSIG文档图像分析与识别专业委员会学术微沙龙(简称:文档图像微沙龙)在线学术报告会第二十七期于2024年5月21日成功举行。本沙龙由中国图象图形学学会主办,文档图像分析与识别专委会发起承办,中国图象图形学报协办。本场活动邀请北京大学王选计算机研究所两位青年学生:刘亦天、罗宇轩 ,围绕其SIGGRAPH 2024和ICRA 2024最新成果,分享报告:1. 基于四叉树表示的高效字体生成2. CalliRewrite: 从书法图像中恢复书写行为的无监督学习方法。

 图片2.jpg

 图片3.jpg 

图片4.jpg 

报告的主持人本场活动邀请北京大学王选计算机研究所副连宙辉教授 担任主持人。第一位报告人是北京大学刘亦天博士,围绕其SIGGRAPH 2024字形计算成果介绍,题目为“基于四叉树表示的高效字体生成”。报告首先介绍了字形计算中字体生成任务的背景与实际意义。该任务旨在利用算法或模型自动化的生成计算机字体,以降低字体设计成本。目前的方法受限于字形表示的局限性,难以生成高分辨率字形,且仍需较长时间生成。报告之后介绍了为解决这一问题提出的高效字形表示方法与字体生成方法。具体而言,该方法将字形分解为字形轮廓与内部填充,并将其表示为四叉树形式以去除冗余信息,再使用基于离散扩散模型与对偶四叉树图卷积设计的QT-Font模型生成目标字体。最后报告列举了各方面实验结果,进一步证明了该方法在生成质量与生成成本等方面相较于现有方法的优势。第二位报告人是北京大学罗宇轩同学,围绕其ICRA 2024机器人与控制成果进行介绍,题目为“CalliRewrite: 从书法图像中恢复书写行为的无监督学习方法”。报告从人类对陌生文字的认知智能与对不同书写工具的精细控制角度获得启发,提出了一种无监督的书法机器人控制方法,根据字形图像输入还原出精细的机械臂控制轨迹。该方法将问题拆分为两部分:无监督的粗略笔画拆分与带约束的强化学习微调方法。针对这两个阶段,报告提出了适配的无监督损失函数、渐进训练方法与有效的强化学习奖励函数。进一步,报告所展示的定量与真机实验结果进一步验证了该方法在不同书体、文字以及不同工具下控制的有效性,能够恢复完整合理的笔画拆分并生成适配多样的书写工具控制。

报告论文:

[1]Y. Liu, Z. Lian. QT-Font: High-efficiency Font Synthesis via Quadtree-based Diffusion ModelsSIGGRAPH 2024

[2]Y. Luo, Z. Wu, Z. Lian, CalliRewrite: Recovering Handwriting Behaviors from Calligraphy Images without Supervision, ICRA 2024 (selected as a finalist of the ICRA Best Paper Award in Service Robotics)

本次报告会获得良好效果,我们期待更多优秀青年学子在文档图像领域取得研究进展,并在后续的沙龙报告会中踊跃参与、共同进步!

错过直播的同学可以前往B站观看回放视频,链接:

https://www.bilibili.com/video/BV1Az421e7gs/

扫描二维码观看

图片5.jpg


Copyright © 2025 中国图象图形学学会

京公网安备 11010802035643号 京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服