本研究解决了现有自动语音识别(asr)和大型语言模型(llm)在边缘设备上部署的挑战,特别是由于个体用户的多样化需求导致的个性化训练不足。提出了一种资源高效的跨模态对齐框架,实现了asr与llm的有效集成,提高了训练速度和对齐质量,对边缘设备的应用具有重要意义。
本研究提出了一种高效的跨模态对齐框架,解决了边缘设备上自动语音识别与大型语言模型个性化训练不足的问题,提升了训练速度和对齐质量。
本研究解决了现有自动语音识别(asr)和大型语言模型(llm)在边缘设备上部署的挑战,特别是由于个体用户的多样化需求导致的个性化训练不足。提出了一种资源高效的跨模态对齐框架,实现了asr与llm的有效集成,提高了训练速度和对齐质量,对边缘设备的应用具有重要意义。
本研究提出了一种高效的跨模态对齐框架,解决了边缘设备上自动语音识别与大型语言模型个性化训练不足的问题,提升了训练速度和对齐质量。