本研究针对自监督学习模型在低资源语言自动语音识别中的领域差异问题,提出了一种改进的高效微调方案。通过增加中间适应步骤,仅更新1-5%的模型参数,实验证明该方法在适应未见语言时,相较传统微调方法提高了多达28%的字符和音素错误率表现。
本研究提出了一种改进的自监督学习模型微调方案,针对低资源语言的自动语音识别领域差异。通过增加中间适应步骤,仅更新1-5%的模型参数,实验证明该方法在适应未见语言时,字符和音素错误率降低了28%。
本研究针对自监督学习模型在低资源语言自动语音识别中的领域差异问题,提出了一种改进的高效微调方案。通过增加中间适应步骤,仅更新1-5%的模型参数,实验证明该方法在适应未见语言时,相较传统微调方法提高了多达28%的字符和音素错误率表现。
本研究提出了一种改进的自监督学习模型微调方案,针对低资源语言的自动语音识别领域差异。通过增加中间适应步骤,仅更新1-5%的模型参数,实验证明该方法在适应未见语言时,字符和音素错误率降低了28%。