标签:
导读 在预计将包含人工智能功能的iOS18发布之前,苹果研究人员发表了一篇论文,重点介绍了他们如何训练新的大型语言模型(LLM)。该法学硕士称为MM
在预计将包含人工智能功能的iOS18发布之前,苹果研究人员发表了一篇论文,重点介绍了他们如何训练新的大型语言模型(LLM)。
该法学硕士称为MM1,可以将文本和视觉信息整合为一。该论文于上周提交,对各种架构组件和数据选择的重要性进行了有趣的探讨。研究人员表示,他们能够“证明,对于大规模多模态预训练,使用图像标题、交错图像文本和纯文本数据的仔细组合对于实现最先进的效果至关重要(SOTA)与其他已发布的预训练结果相比,在多个基准测试中得到了很少的结果。”
此外,他们还表明,“图像编码器以及图像分辨率和图像标记计数具有重大影响,而视觉语言连接器设计的重要性相对可以忽略不计。”
Apple的MM1AI模型使用了一系列具有多达30B个参数的多模态模型,其中包括密集模型和专家混合(MoE)变体,这些模型在预训练指标中达到了SOTA,并在监督微调后实现了有竞争力的性能。一系列既定的多式联运基准。
苹果已经宣传其人工智能应用程序近一年了。在过去的两次财报电话会议中,该公司首席执行官表示,他们有许多功能需要宣布。更有趣的是,虽然苹果一直在发表论文并预告即将推出的人工智能功能,但彭博社的MarkGurman表示,苹果还在讨论在iOS18中使用GoogleGemini。
在此前考虑过OpenAI的ChatGPT后,苹果显然正在与谷歌就Gemini的授权进行谈判。
虽然尚不清楚苹果是否会与谷歌合作,但此举并不一定令人惊讶。Gemini已经为Pixel8和GalaxyS24上的生成式AI功能提供支持。后者在今年早些时候确实给人留下了深刻的印象。GalaxyS24的亮点之一来自于谷歌。
也就是说,人们对苹果有很多期待。BGR将确保让您了解公司即将推出的所有人工智能功能。