2026年上半年,全球人工智能顶级会议相继揭晓评审结果,美图旗下核心研发团队美图影像研究院(MTLab)收获颇丰,有6篇学术成果获得录用,覆盖深度学习领域顶级会议ICLR2026、计算机视觉领域顶级会议CVPR2026、机器学习领域顶级会议ICML2026。
近年来,随着人工智能与千行百业的深度融合,大模型和多模态研发呈现井喷式发展,全球人工智能领域各大顶级会议吸引了一众高质量学者,根据官方报道显示,ICLR2026投稿量超19000篇,录用率27.4%;ICML2026超23000篇,录用率26.6%;CVPR2026投稿量更是远超30000篇,有效投稿数多达16092篇,录用率25.42%,仅有少数研究成果能够从中脱颖而出。
据了解,美图影像研究院(MTLab)的研究成果主要聚焦在大模型研发、多模态融合、机器学习、强化学习的前沿理论创新及生成式AI的产业化应用落地,研究者们通过语境学习的开放词表场景文本编辑,以自我提示的方式实现了对图像中多国语种文字的任意编辑与修改;通过研发基于随机桥模型的新框架BridgeRemoval,实现精准消除视频中特定物体;通过引入双向语义流机制实现了基于文本驱动的精细分割,在保持分割准确性的同时提升了对复杂场景的响应精度;提出了全新的参考帧引导视频编辑统一框架MiVE,以多尺度VLM条件与统一多模态融合实现了基于参考帧引导的视频编辑。
此外,美图影像研究院(MTLab)还提出了基于扩散Transformer(DiT)的3D位置编码框架——PositionalEncodingField(PE-Field)实现了单图新视角合成与可控空间图像编辑,以及基于扩散模型提出All-in-OneSlider的新方法框架,实现了全新人脸属性的连续精细化操控等核心技术的新一轮突破。
值得一提的是,美图影像研究院(MTLab)在追求技术突破的同时也完成了产业落地,多项创新技术成果已应用于美图旗下AI产品,如助力美图秀秀实现“视频美型背景保护”功能、“AI消除”功能,美颜相机实现“人像美化“功能,Wink实现“改一帧、改全片”功能、“视频路人消除”功能,美图设计室实现“无痕改字”功能等等,在实现技术指标提升的同时,更直接地转化为自然的视觉效果与流畅的交互体验,为美图产品的高速发展与用户体验的持续优化提供坚实的支撑。
未经允许不得转载:手机云川网 » 美图6项研发成果入选人工智能顶会CVPR 2026、ICLR 2026与ICML 2026






