微软(Microsoft)发布了最新款中型模型,力求在该领域获得一个立足点,但AI负责人穆斯塔法•苏莱曼(Mustafa Suleyman)承认,这家科技巨头仍然缺乏构建前沿系统所需的算力。
这家软件巨头周四发布了一款语音转录模型,苏莱曼称其为同类模型中最先进的产品。该公司正加大力度追赶竞争对手,并减少对OpenAI的依赖。
微软尚未发布能够在编码和文本生成等技术含量更高的领域竞争的大语言模型(LLM),它在这些领域落后于市场领军者Anthropic、谷歌(Google)和OpenAI。
“我们目前还无法构建最大规模的模型,尽管我们的算力正在提升,有望在今年晚些时候具备那样的能力。”苏莱曼告诉英国《金融时报》。
“因此,我们目前在中型模型领域展开竞争。”他说。他还说,这在成本、性能、质量和大规模使用之间达到了“最优”平衡。
在去年末重组与OpenAI之间的独家合作关系后,微软一直在大举投资,力求在AI模型方面实现“自给自足”。
该公司正致力于开发前沿模型,使其能够在无需依赖第三方的情况下,为其众多商业和消费者服务提供支持。
拥有世界最大云计算业务之一的微软,必须平衡数据中心算力的分配,既要满足公司内部AI项目的需求,又要满足OpenAI等客户以及其传统企业软件的需求。
与其他提供商一样,微软在提供算力方面也受到诸多因素的限制,包括当地反对意见以及设备、电力和劳动力的短缺。
苏莱曼的言论似乎表明,这些制约因素正在影响微软开发内部AI。
他是在微软新成立的超级智能(Superintelligence)团队在迈阿密举行场外会议期间接受英国《金融时报》采访的。本周,他和首席执行官萨蒂亚•纳德拉(Satya Nadella)向这个有350余名成员的团队介绍了微软的“长期算力路线图”和目标。
作为谷歌DeepMind的联合创始人,苏莱曼于2024年加入微软,领导其面向消费者的AI业务。去年末,在微软与OpenAI重新谈判合同之际,他组建了超级智能团队。
新合同允许OpenAI与微软的竞争对手达成云计算协议,同时也让这家软件巨头能够自由构建自己的先进模型,并与身为初创公司的OpenAI直接竞争。
微软去年公布了首款基础模型MAI-1,称其为“内部专家混合模型”,该模型在1.5万个英伟达(Nvidia) H100 GPU上进行了训练,但目前仍处于预览阶段,并未全面开放。
苏莱曼从包括谷歌在内的竞争对手那里挖走了人才,最近还聘请了西雅图艾伦研究所(Allen Institute)前首席执行官阿里•法哈迪(Ali Farhadi),以增强其团队实力。
“我们实验室的使命是在未来两到三年内实现微软的AI自给自足。”他说,“这意味着构建前沿规模的芯片集群,加大数据预算投入,以便在未来几年达到世界一流水平。”
苏莱曼说,他的团队聚焦于降低AI工具的成本,其转录模型将在定价上胜过竞争对手。“我们预计市场需求将会巨大。”他说。
上月,苏莱曼在公司内部的职责有所缩减,以便他专注于模型开发。Snap前高管雅各布•安德烈乌(Jacob Andreou)受命负责Copilot品牌的所有AI产品,并直接向纳德拉汇报。
译者/和风