Meta 推出新计划 旨在改进语音和翻译 AI

Meta 最近宣布与联合国教科文组织(UNESCO)合作推出一项新的语言技术伙伴计划,旨在收集多种语言的语音录音和文字记录,以推动未来开放可用的人工智能(AI)发展。 这项计划特别关注那些在数字环境中被忽视的少数民族语言。 根据 Meta 的介绍,该计划希望吸引合作伙伴,提供超过10小时的语音录音及其转录内容、丰富的书面文本,以及翻译句子的集合。

Meta 最近宣布与联合国教科文组织(UNESCO)合作推出一项新的语言技术伙伴计划,旨在收集多种语言的语音录音和文字记录,以推动未来开放可用的人工智能(AI)发展。这项计划特别关注那些在数字环境中被忽视的少数民族语言。

根据 Meta 的介绍,该计划希望吸引合作伙伴,提供超过10小时的语音录音及其转录内容、丰富的书面文本,以及翻译句子的集合。Meta 希望通过与合作伙伴的共同努力,将这些语言整合到其 AI 语音识别和翻译模型中,最终形成的成果将以开源形式发布。

音频 声波 智能语音

图源备注:图片由AI生成,图片授权服务商Midjourney

截至目前,已确认的合作伙伴包括加拿大北部的努纳武特地区政府,该地区部分居民使用一种被称为因纽特语的语言。Meta 在其博客中表示:“我们的努力特别聚焦于服务不足的语言,以支持联合国教科文组织的工作。最终,我们的目标是创建智能系统,能够理解并回应复杂的人类需求,无论语言或文化背景如何。”

为了配合这一计划,Meta 还将发布一个开放源代码的机器翻译基准,旨在评估语言翻译模型的性能。这个基准由语言学家设计,支持七种语言,并可通过 AI 开发平台 Hugging Face 进行访问和贡献。

Meta 将这两项举措视为慈善行动,但公司也因此将受益于其语音识别和翻译模型的升级。Meta 持续扩展其 AI 助手 Meta AI 支持的语言数量,并测试例如 Instagram Reels 中语音翻译的功能,允许创作者对其语音进行配音和自动同步。

尽管 Meta 在语言处理方面的努力值得关注,但该公司在非英语内容的处理上曾受到不少批评。有报告显示,Facebook 在处理意大利语和西班牙语的 COVID-19虚假信息时,几乎有70% 的内容未被标记,而英语内容的未标记比例仅为29%。此外,泄露的文件显示,阿拉伯语内容常常被错误标记为仇恨言论。Meta 表示,正采取措施改善其翻译和内容审核技术,以应对这些挑战。

相关资讯

联合国教科文组织报告称生成式 AI 加剧性别偏见,呼吁各国政府制定监管框架

联合国教科文组织 7 日发布研究报告称,大语言模型存在性别偏见、种族刻板印象等倾向。报告指出,女性在大模型的描述中,从事家务劳动的频率是男性的 4 倍,且常常与“家”、“家庭”和“孩子”等词汇联系在一起,而男性名字则与“商业”、“管理层”、“薪水”和“职业”等词汇联系在一起。此次联合国教科文组织发起了“大语言模型中对妇女和女童的偏见”的研究,对大语言模型中的“刻板印象”进行深入分析。研究的部分内容是测量人工智能生成文本的多样性,内容涉及不同性别、文化背景的人群,测试对象包含 OpenAI 的 GPT-3.5、GPT

扎克伯格表示,2025年底Meta将拥有130万个用于AI的GPU

Meta 首席执行官马克・扎克伯格在最近的一篇 Facebook 帖子中宣布,公司计划在2025年大幅提升资本支出,旨在在激烈的人工智能竞争中保持领先地位。 扎克伯格表示,Meta 预计在2025年的资本支出将达到600亿到800亿美元,主要用于数据中心建设和扩充 AI 开发团队。 这一预算范围几乎是 Meta 去年350亿到400亿美元支出的两倍。

Meta计划在2025年投入高达650亿美元以推进人工智能发展

扎克伯格近日宣布,Meta将在2025年投入高达650亿美元,用于增强其人工智能(AI)项目。 他在 Facebook 上发文表示,2025年将是人工智能的关键一年,预计 Meta 的 AI 助手将为超过10亿用户提供服务,Llama4模型将成为行业领先的尖端模型。 此外,Meta 还计划开发一款 AI 工程师,能够逐渐为公司的研发工作贡献代码。