(相关资料图)
Meta 公司(前身为 Facebook)采取了一种革命性的方法来训练其人工智能 (AI)模型,以识别和生成超过一千种语言的语音。
圣经作为数据来源
这个大胆的实验使用圣经作为主要数据来源,希望这些算法能够帮助保护濒危语言。
Meta 项目涉及通过GitHub 代码托管平台向公众发布他们的新语言模型。目标是让开发人员能够使用不同的语言工作,并创建新的和多样化的语音应用程序。
为了实现这一目标,新的元模型使用两个数据集进行了训练。前者包括1,107 种语言的新约圣经录音,而后者包括 3,809 种语言的未标记的新约录音。
数据的复杂性
在人工智能 (AI) 领域,普遍的挑战之一是缺乏数据。Meta 的研究科学家和该项目的参与者 Michael Auli 解释说:“对于英语,我们有大量高质量的数据集,还有一些其他语言,但我们在没有足够的数据集方面苦苦挣扎。数据对于那些有 1000 人使用的语言。
研究人员现在报告说,他们的模型能够用 1,000 多种语言进行对话并识别 4,000 多种。考虑到世界上大约有 7,000 种语言,这一成就尤为重要。
此外,与OpenAI Whisper等其他竞争公司的模型相比,Meta 版本的错误率减半,尽管覆盖的语言数量是 OpenAI Whisper 的 11 倍。