本文提出了一种新颖的多阶段微调策略,旨在利用openai的whisper模型提升低资源语言的自动语音识别(asr)性能。通过在语言学相似的语言之间逐步适应模型,研究在数字资源有限的malasar语言上取得了显著的效果,最终实现了51.9%的词错误率(wer),并通过后处理进一步减少至47.3%。
本文提出了一种多阶段微调策略,利用openai的whisper模型提升低资源语言的自动语音识别性能。在malasar语言上实现了51.9%的词错误率,经过后处理降低至47.3%。
本文提出了一种新颖的多阶段微调策略,旨在利用openai的whisper模型提升低资源语言的自动语音识别(asr)性能。通过在语言学相似的语言之间逐步适应模型,研究在数字资源有限的malasar语言上取得了显著的效果,最终实现了51.9%的词错误率(wer),并通过后处理进一步减少至47.3%。
本文提出了一种多阶段微调策略,利用openai的whisper模型提升低资源语言的自动语音识别性能。在malasar语言上实现了51.9%的词错误率,经过后处理降低至47.3%。