法国电信巨头Orange近日宣布了一项重要合作计划,旨在推动非洲地区语言的人工智能发展。这一计划是与微软支持的OpenAI和Facebook母公司meta共同展开的。
Orange透露,他们将基于OpenAI的Whisper和meta的Llama这两个开源AI模型,开发定制化的AI模型。这些模型将专注于理解西非地区独特的语言,这些语言在现有的大多数对话系统中往往无法被准确识别。
目前,大型AI公司所使用的训练数据大多来自美国,导致在处理欧洲、中东和非洲等地区时,可能会丢失重要的文化和语言背景信息。Orange首席人工智能官Steve Jarrett指出,这使得现有的AI模型在理解使用不太常用语言编写的文本和语音通信时面临困难。
“通过开放模型,我们可以进行微调,向模型中引入原本训练时未包含的额外信息。”Jarrett在接受采访时说,“我们正在添加对西非地区语言的识别能力,这是目前任何AI都无法做到的。”
Orange计划首先在2025年初推出支持沃洛夫语和普拉姆语的AI模型。沃洛夫语主要在塞内加尔、冈比亚和毛里塔尼亚南部使用,而普拉姆语则主要在塞内加尔流行。这两种语言的使用者分别约为1600万和600万人。
Orange表示,这些开源AI模型将对外提供,并免费授权用于非商业用途,如公共卫生和教育领域。他们还计划扩大这一计划,最终覆盖所有18个西非国家。
Jarrett强调,现有的大型语言模型,如OpenAI的GPT、meta的Llama和Anthropic的Claude,并不完全适合非洲的需求,因为它们没有针对非洲地区的数据进行训练。因此,Orange与合作伙伴决定开发更适合非洲语言的定制化模型。
这一计划还体现了全球范围内日益受到关注的概念——主权人工智能。这一概念强调,各国和地区应通过本地化数据存储和处理,确保AI系统能够代表特定的语言、文化和历史,从而加强对核心技术基础设施的控制。
Orange还计划将数据处理和OpenAI模型的托管本地化到欧洲数据中心。这将使他们能够提前获得OpenAI最新、最先进的AI模型,并帮助构建新的应用程序,如用于客户服务的AI语音系统。
Jarrett表示,Orange致力于“负责任地”使用AI,并考虑到与该技术巨大能源需求相关的环境问题。他们不会总是对每个问题都使用庞大的语言模型(LLM),而是会根据具体情况选择最合适的解决方案。
除了改善客户服务外,Orange还计划利用AI技术优化其核心业务——移动网络。Jarrett说:“在网络方面,我们不仅使用AI来优化网络规划方式,还优化如何正确运营网络。所有网络设备产生的数据量非常庞大,借助AI系统,我们可以帮助识别数据中的模式,甚至在客户注意到之前,这些模式就可以帮助我们识别和预测故障。”
这一合作计划不仅有助于提升非洲地区语言的AI识别能力,还体现了Orange在推动主权人工智能和负责任使用AI方面的努力。
通过本地化数据处理和模型托管,Orange希望能够更好地服务于西非国家,并推动该地区在AI技术方面的发展。