阿里通义大模型一周年:开源不会落后,也要追求更好的商业化
图片来源:阿里云方面提供
一年多前,阿里云 CTO 周靖人在同客户的一次碰面沟通中曾说到," 通义千问大模型与 GPT-4 还有很大的差距 ",而在今天,这一局面已经发生了变化。
5 月 9 日,在阿里云举办的 "AI 智领者 " 峰会上,阿里云正式官宣发布通义千问 2.5。根据权威基准 OpenCompass 的测评结果显示,通义千问 2.5 得分追平 GPT-4 Turbo,是该基准首次录得国产大模型取得如此佳绩。
相比此前的通义千问 2.1,通义千问 2.5 的理解能力、逻辑推理、指令遵循、代码能力分别提升 9%、16%、19%、10%。峰会上,通义千问还发布了 1100 亿参数开源模型 Qwen1.5-110B,服务于企业自建专属模型的阿里云百炼大模型平台也实现了升级。此外,原通义千问 APP 宣布更名为 " 通义 APP",致力于成为 " 通情达义 " 的全能 AI 助手。
微博是最早一批上阿里云的客户,也是通义大模型的最早客户。峰会现场,微博 COO、新浪移动 CEO 王巍透露微博已经将通义大模型技术应用于多个场景,其中包括 AI 评论、AI 明星陪聊、虚拟角色帐号、星座大模型、信息流广告创意生成等。
微博王巍之后,登场演讲的是小米集团小爱总经理王刚。小米旗下的 AI 助理小爱同学是新近与通义大模型合作的客户,借助大模型,小爱同学强化了其在图片生成、图片理解等方面的多模态 AI 生成能力。以小米汽车 SU7 为例,车上的小爱同学可遵从乘客的自然语言指令,在车载中控屏画出 " 小猫爬上窗台 " 等画面,增加亲子互动和乘车乐趣。
微博和小爱同学是通义大模型一前一后合作的两个代表,事实上大模型如何赋能企业实际业务,也是这场阿里云 AI 智领者峰会的一大主题,无论是登场的阿里云 CTO 周靖人还是阿里云公共事业部总裁刘伟光,两者一直强调的一句话即是," 大模型即服务 "。
阿里云仍是坚定的互联网开源精神拥趸。去年 8 月通义宣布加入开源行列,沿着 " 全模态、全尺寸 " 开源路线陆续推出十多款模型,截至目前,通义开源模型下载量已经超过 700 万,这在一定程度上加速了其他大模型的应用落地。
在大模型的技术路线上,与阿里云不同的是,拥有文心一言的百度则认为 " 开源会越来越落后 "。在今年 4 月的 Create 2024 百度 AI 开发者大会上,百度创始人、董事长兼首席执行官李彦宏称," 大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以,开源模型会越来越落后。"
其后不久,Meta 则发布了其目前为止最先进的开源模型 Llama 3,提供 8B 和 70B 的预训练和指令微调版本。开源模型不仅在技术路线上尚未达成共识,在开源社区内部也存在激烈竞争。
此外,大会现场,阿里云 CTO 周靖人重点提及了百炼大模型平台的最新进展。
百炼平台完成了从模型开发、应用开发到算力底座升级,更加易用、更加开放,引入更多模型,还率先兼容 LlamaIndex 等开源框架,企业可自由替换能力组件来适配自身系统。针对当下企业最关注的 RAG 链路,百炼提供灵活开放的企业级检索增强服务,5 到 10 行代码即可搭建 RAG 应用,让大模型拥有 " 最强外挂 "。
简而言之,在原先开发者可通过百炼平台 " 拖拉拽 "5 分钟开发一款大模型应用后,此次百炼平台已升级为阿里云承载云 +AI 能力的重要平台,提供一站式、全托管的大模型定制与应用服务。
周靖人表示,接下来百炼将继续做对开发者最友好、最开放的大模型平台。百炼也将进一步支持三方模型的微调训练和云上专属部署,帮助大模型生态中的企业提供商业化服务。据了解,阿里云百炼已服务了一汽、微博、完美世界、朗新集团、央视网、蓝凌科技等企业。
整体来看,在市场竞争加剧环境下,作为国内云市场领头羊的阿里云营收增长也回落到了个位数,其前段时间开打的云服务 " 全网最低价 " 意味着其相比起利润,要更追求客户量。如何在追求更多客户的同时提升商业化效率,是阿里云当下面临的一道课题。
通义大模型给了一个解题方法。根据阿里云方面数据来看,通义通过阿里云服务企业超过 9 万、通过钉钉服务企业超过 220 万。这其中,在 AI 智领者峰会上登台演讲的微博、小米旗下小爱同学、众安保险是通义商业化进程中的代表客户。