原文中文,约3700字,阅读约需9分钟。发表于:2024-11-28t05:31:48z。 aixiv专栏促进学术交流,adobe与罗切斯特大学研究多模态大模型的计算冗余,提出yopo剪枝方案。实验表明,llava-1.5仅需12%的计算量即可保持性能,有效解决视觉token的计算开销问题。