本研究针对大型视觉-语言模型(vlms)在遥感领域能力评估缺乏全面基准的问题,提出了coreval基准,以客观评估这些模型的遥感能力。通过六个次维度和二十二个具体任务的细致分类,coreval确保对6,263个问题的严格质量控制,帮助识别当前模型的短板,促进其在遥感应用中的改善。
大规模语言模型推动了人工智能的发展,尤其在远程感知领域。研究团队构建了高质量的图像字幕数据集rsicap,包含2,585个详细注释,促进了视觉语言模型的训练与评估。
本研究针对大型视觉-语言模型(vlms)在遥感领域能力评估缺乏全面基准的问题,提出了coreval基准,以客观评估这些模型的遥感能力。通过六个次维度和二十二个具体任务的细致分类,coreval确保对6,263个问题的严格质量控制,帮助识别当前模型的短板,促进其在遥感应用中的改善。
大规模语言模型推动了人工智能的发展,尤其在远程感知领域。研究团队构建了高质量的图像字幕数据集rsicap,包含2,585个详细注释,促进了视觉语言模型的训练与评估。