阿里巴巴“通义千问”赋能新加坡AI自研大语言模型“海狮”最新版本
此次合作中,阿里巴巴也将为该大语言模型的“高级后训练”提供技术支持。
DeeperDive is a beta AI feature. Refer to full articles for the facts.
本文由AI辅助翻译
【新加坡】阿里云于周一(11月24日)宣布,支持新加坡人工智能(AI Singapore,简称AISG)发布的最新版“海狮”(Sea-Lion)大语言模型(LLM)——Qwen-Sea-Lion-v4。
阿里云在一份新闻稿中表示,这一最新版本是基于阿里巴巴的 Qwen3-32B 基础模型构建的。新闻稿指出,新版本的发布标志着“AISG在为本区域提供功能更强大、更易于使用的人工智能解决方案的努力中,迈出了重要一步”。
根据合作协议,阿里巴巴还将为该大语言模型的“高级后训练”提供技术支持。
阿里云还表示,Qwen3-32B 基础模型使用了超过1000亿个东南亚语言词元(token)进行了进一步训练,以增强其解读本地表达、对话细微差别和区域知识领域的能力。
作为“通义千问”(Qwen)系列的最新迭代,Qwen3 的基础模型本身就已在一个庞大且多样化的数据库上进行预训练,该数据库涵盖119种语言和方言,总计36万亿个词元。
这使其从一开始就具备了更广泛的语言覆盖能力,包括那些在主流人工智能模型中通常代表性不足的东南亚语言。
Navigate Asia in
a new global order
Get the insights delivered to your inbox.
作为回报,AI Singapore 贡献了其在开源区域性数据整理、优化以及跨东南亚语言任务评估方面的专长。
阿里云智能新加坡总经理 Choong Hon Keat 表示,将该模型的多语言和推理优势与 AI Singapore 深厚的区域专长相结合,展示了开放式合作如何能让先进的人工智能变得更具“包容性和本地相关性”。
他补充道:“我们期待能支持更多开发者、企业和公共部门合作伙伴,去构建能够真正理解本区域语言和文化的应用程序。”
在参数少于2000亿(200B)的开源模型中,Qwen-Sea-Lion-v4 目前在东南亚语言模型综合评估(South-east Asian Holistic Evaluation of Language Models)中排名第一。该模型可在 AI Singapore 网站或 Hugging Face 上免费下载。
2023年12月,一项耗资7000万新元的计划被公开发布,旨在发展新加坡在多模态大语言模型方面的研发和工程能力。
该项目由新加坡国家研究基金会(National Research Foundation)资助,并获得资讯通信媒体发展局(Infocomm Media Development Authority)的支持。
Decoding Asia newsletter: your guide to navigating Asia in a new global order. Sign up here to get Decoding Asia newsletter. Delivered to your inbox. Free.
Copyright SPH Media. All rights reserved.