阿里巴巴“通义千问”赋能新加坡AI自研大语言模型“海狮”最新版本
此次合作中,阿里巴巴也将为该大语言模型的“高级后训练”提供技术支持。
本文由AI辅助翻译
【新加坡】阿里云于周一(11月24日)宣布,支持新加坡人工智能(AI Singapore,简称AISG)发布的最新版“海狮”(Sea-Lion)大语言模型(LLM)——Qwen-Sea-Lion-v4。
阿里云在一份新闻稿中表示,这一最新版本是基于阿里巴巴的 Qwen3-32B 基础模型构建的。新闻稿指出,新版本的发布标志着“AISG在为本区域提供功能更强大、更易于使用的人工智能解决方案的努力中,迈出了重要一步”。
根据合作协议,阿里巴巴还将为该大语言模型的“高级后训练”提供技术支持。
阿里云还表示,Qwen3-32B 基础模型使用了超过1000亿个东南亚语言词元(token)进行了进一步训练,以增强其解读本地表达、对话细微差别和区域知识领域的能力。
作为“通义千问”(Qwen)系列的最新迭代,Qwen3 的基础模型本身就已在一个庞大且多样化的数据库上进行预训练,该数据库涵盖119种语言和方言,总计36万亿个词元。
这使其从一开始就具备了更广泛的语言覆盖能力,包括那些在主流人工智能模型中通常代表性不足的东南亚语言。
作为回报,AI Singapore 贡献了其在开源区域性数据整理、优化以及跨东南亚语言任务评估方面的专长。
阿里云智能新加坡总经理 Choong Hon Keat 表示,将该模型的多语言和推理优势与 AI Singapore 深厚的区域专长相结合,展示了开放式合作如何能让先进的人工智能变得更具“包容性和本地相关性”。
他补充道:“我们期待能支持更多开发者、企业和公共部门合作伙伴,去构建能够真正理解本区域语言和文化的应用程序。”
在参数少于2000亿(200B)的开源模型中,Qwen-Sea-Lion-v4 目前在东南亚语言模型综合评估(South-east Asian Holistic Evaluation of Language Models)中排名第一。该模型可在 AI Singapore 网站或 Hugging Face 上免费下载。
2023年12月,一项耗资7000万新元的计划被公开发布,旨在发展新加坡在多模态大语言模型方面的研发和工程能力。
该项目由新加坡国家研究基金会(National Research Foundation)资助,并获得资讯通信媒体发展局(Infocomm Media Development Authority)的支持。
Decoding Asia newsletter: your guide to navigating Asia in a new global order. Sign up here to get Decoding Asia newsletter. Delivered to your inbox. Free.
Copyright SPH Media. All rights reserved.
TRENDING NOW
CSE Global independent director quits after clashes with chairman Eugene Lai over board refresh
What’s wrong with Orchard Road? Experts weigh in on the street’s cachet and its future
‘I felt like dying’: Thai Singha beer scion speaks up after disclosure of alleged sexual abuse
Rare brutalist Singapore house opens to the public before changing hands