提出了一种基于提示的上下文和领域感知的预训练框架(panda),用于解决预训练视觉语言模型在视觉和语言导航任务中的领域差异和交叉模态对齐的问题,并通过对比学习进一步优化预训练模型。实验结果表明,panda 在 r2r 和 reverie 任务上优于之前的最先进方法。
本文介绍了一种名为panda的预训练框架,用于解决预训练视觉语言模型在视觉和语言导航任务中的领域差异和交叉模态对齐的问题。通过对比学习,panda在r2r和reverie任务上取得了优于之前方法的结果。
提出了一种基于提示的上下文和领域感知的预训练框架(panda),用于解决预训练视觉语言模型在视觉和语言导航任务中的领域差异和交叉模态对齐的问题,并通过对比学习进一步优化预训练模型。实验结果表明,panda 在 r2r 和 reverie 任务上优于之前的最先进方法。
本文介绍了一种名为panda的预训练框架,用于解决预训练视觉语言模型在视觉和语言导航任务中的领域差异和交叉模态对齐的问题。通过对比学习,panda在r2r和reverie任务上取得了优于之前方法的结果。