本网讯(通讯员 田方浩)8月10日上午,计算机科学与工程学院(人工智能学院)特邀西湖大学讲席教授、IEEE Fellow凌海滨博士在计算机大楼118会议室作题为“计算机视觉与更多领域的人工智能(Artificail Intelligence in Computer Vision and Beyond)”的学术报告。校党委副书记、校长张彦铎教授,学院优秀校友广东科学技术职业学院机器人学院院长余正泓教授,学院相关专业教师、博士研究生、硕士研究生参加会议,报告会由学院副院长周华兵教授主持。

凌海滨教授从团队近年的研究成果为切入点,围绕“视觉理解、机器学习、增强现实、生物医学工程、AI for Science”五大领域展开深度剖析。凌教授系统回顾了姿态估计、动作识别与目标跟踪任务的演进历程,从传统方法到Transformer架构的转变,重点介绍了“Tracking with Transformer”等统一框架,展示了如何在不依赖多尺度特征和在线更新的条件下实现最优性能(SOTA)。他聚焦于“领域自适应”与“非反向传播学习”两条技术路线,以KUDA框架为例,阐述如何利用“一元约束+二元关系”等先验知识,在目标域数据无标签的条件下弥补监督信号不足,从而在多个任务和数据集上显著缓解了域间分布差异带来的性能下降。在空间增强现实方面,凌教授以“Language-Guided Projection”技术为核心,展示如何通过自然语言指令生成投影内容并管理布局,达到动态场景下的亚像素级对准。同时,针对光学相干断层扫描(OCT)血流估计中现有ODT系统在“复杂、耗时、伪影多”的难题,凌教授团队提出端到端深度学习框架(OCTA-Flow),该方法可直接从常用的 OCTA 图像推断血流速度,无需传统ODT所需的专用相位测量硬件和复杂的采集流程,从而降低了系统成本并简化了操作。讲座还介绍了在AI for Science的新探索:将 Transformer 架构引入量子物理建模,提出变分 Transformer 方法(Variational Transformer Ansatz),高效求解耗散量子多体系统的稳态密度算子。凭借自注意力对长程关联的建模能力,该方法在精度和可扩展性上表现突出,相关成果已发表于《Physical Review B》等顶级期刊。
互动环节中,凌海滨教授就“青年教师如何精准捕捉科研方向”“多模态视觉理解与生成技术的发展路径”等问题与师生展开热烈讨论。师生们对凌教授在视觉理解、机器学习、增强现实、生物医学工程及AI for Science等领域的成果表现出浓厚兴趣,并表示将以此次报告为契机,进一步深化学术交流与合作。

专家简介:
凌海滨,西湖大学讲席教授(Chair Professor),IEEE Fellow,现任《IEEE模式分析与机器智能汇刊》(TPAMI)、《IEEE可视化与计算机图形汇刊》(TVCG)、《计算机视觉与图像理解》(CVIU)、《模式识别》(PR)等期刊副主编,并长期担任CVPR、ICCV、ECCV、ACMMM和WACV等国际顶会领域主席(AreaChair)。凌教授1997年和2000年分别获得北京大学学士和硕士学位,2006年获马里兰大学帕克分校博士学位。其研究领域涵盖计算机视觉、增强现实、医学图像分析、机器学习及面向科学的AI,曾获ACM UIST最佳学生论文奖(2003)、美国国家科学基金会杰出青年学者奖(NSF CAREER Award,2014)、雅虎教师研究与参与奖(2019)、亚马逊机器学习研究奖(2019)及IEEE VR最佳期刊论文奖(2021)等荣誉。
(审稿 张炜 周华兵)