美图6项研发成果入选人工智能顶会CVPR 2026、ICLR 2026与ICML 2026-手机云川网

2026年上半年，全球人工智能顶级会议相继揭晓评审结果，美图旗下核心研发团队美图影像研究院（MTLab）收获颇丰，有6篇学术成果获得录用，覆盖深度学习领域顶级会议ICLR2026、计算机视觉领域顶级会议CVPR2026、机器学习领域顶级会议ICML2026。

近年来，随着人工智能与千行百业的深度融合，大模型和多模态研发呈现井喷式发展，全球人工智能领域各大顶级会议吸引了一众高质量学者，根据官方报道显示，ICLR2026投稿量超19000篇，录用率27.4%；ICML2026超23000篇，录用率26.6%；CVPR2026投稿量更是远超30000篇，有效投稿数多达16092篇，录用率25.42%，仅有少数研究成果能够从中脱颖而出。

据了解，美图影像研究院（MTLab）的研究成果主要聚焦在大模型研发、多模态融合、机器学习、强化学习的前沿理论创新及生成式AI的产业化应用落地，研究者们通过语境学习的开放词表场景文本编辑，以自我提示的方式实现了对图像中多国语种文字的任意编辑与修改；通过研发基于随机桥模型的新框架BridgeRemoval，实现精准消除视频中特定物体；通过引入双向语义流机制实现了基于文本驱动的精细分割，在保持分割准确性的同时提升了对复杂场景的响应精度；提出了全新的参考帧引导视频编辑统一框架MiVE，以多尺度VLM条件与统一多模态融合实现了基于参考帧引导的视频编辑。

此外，美图影像研究院（MTLab）还提出了基于扩散Transformer（DiT）的3D位置编码框架——PositionalEncodingField（PE-Field）实现了单图新视角合成与可控空间图像编辑，以及基于扩散模型提出All-in-OneSlider的新方法框架，实现了全新人脸属性的连续精细化操控等核心技术的新一轮突破。

值得一提的是，美图影像研究院（MTLab）在追求技术突破的同时也完成了产业落地，多项创新技术成果已应用于美图旗下AI产品，如助力美图秀秀实现“视频美型背景保护”功能、“AI消除”功能，美颜相机实现“人像美化“功能，Wink实现“改一帧、改全片”功能、“视频路人消除”功能，美图设计室实现“无痕改字”功能等等，在实现技术指标提升的同时，更直接地转化为自然的视觉效果与流畅的交互体验，为美图产品的高速发展与用户体验的持续优化提供坚实的支撑。

未经允许不得转载：手机云川网 » 美图6项研发成果入选人工智能顶会CVPR 2026、ICLR 2026与ICML 2026

相关推荐