苹果推出AI大模型,竟然是被逼出来的?
作 者 | 大海
一直对人工智能无动于衷的苹果,终于有动作了。
ChatGPT突然爆红,一直被冠以“iPhone时刻”。因为科技界上一次引发这种热潮的事件,正是苹果突然发布了iPhone手机。人们希望ChatGPT像iPhone把人们带往移动互联网时代一样,成为新的AI大模型时代的钥匙。
虽然苹果也属于科技界的“扛把子”,步子迈的也越来越稳,但对“新潮玩意”似乎总是慢人半拍。近日,彭博社科技记者马克·古尔曼(Mark Gurman)爆料,苹果正在悄悄研发人工智能工具。苹果有多个团队参与该项目,包括展开解决潜在隐私问题的工作。
据彭博社报道,知情人士透露,苹果公司已打造了能创建大语言模型的自家框架,利用被称作Ajax的基础创建出一款被工程师称为“Apple GPT”的聊天机器人服务。这种基于人工智能的系统也是ChatGPT和谷歌Bard等产品的核心。
有接近苹果公司的内部人士对媒体称,苹果高层其实比任何时候都着急,特别是ChatGPT爆红几个月以来,人工智能几乎成为苹果公司每次开会都要提及的话题,几个技术团队甚至因为大模型项目合并在一起,此外,苹果技术团队也注意并尝试解决与该技术有关的潜在隐私问题。但是该信源并未透露苹果公司会如何训练自家的人工智能工具。
让苹果如此着急上火的原因是,微软依靠OpenAI的ChatGPT已经走在行业前列,而苹果手机的另一大对手谷歌安卓,已经开始尝试和AI进行融合。
01 “苹果GPT”到哪一步了?
据《华尔街日报》等媒体透露,苹果已经建立了自己的大语言模型框架“Ajax”,并已经将其应用在地图、siri等功能上,做人工智能改进。苹果还基于Ajax创建了一个聊天机器人服务,一些工程师称之为“苹果GPT”。
据业内人士分析,苹果目前在做的这些工作,仅仅处在人工智能的山脚下,需要攀登的山峰还很高。
事实确实如此,苹果在人工智能技术上一直是不冷不热的态度,距离上次苹果推出“人工智能”产品,已经过去了12年。
在2011年,苹果推出了可以算作人工智能初级产品的Siri,当时在科技界还掀起了一阵模仿的浪潮,比如国内的小米在此后迅速推出了语音助手“小爱同学”,但是小米也和苹果一样,目前对AI大模型一直是犹抱琵琶半遮面的态度。
虽然苹果入局“人工智能”时间很早,但遗憾的是,苹果自推出Siri后人工智能相关的业务就陷入了停滞状态。
在2018年的时候,苹果对人工智能业务好像又有所期待,开始在行业中到处挖人,当年,苹果就从谷歌挖走了人工智能方面的顶尖技术专家约翰·詹南德里亚,詹南德里亚在谷歌工作时领导了整个人工智能及产品的设计和开发工作,曾是Metaweb团队的一员。
关于苹果频频在行业内挖人,特斯拉的首席执行官埃隆·马斯克也在社交媒体上发文抱怨,称苹果公司“非常努力”的试图挖走特斯拉的AI工程师,并提供60%的加薪幅度和25万美元的奖金,目前至少挖走了46名技术工程师。
虽然詹南德里亚是人工智能的顶尖专家,但是苹果似乎将其用歪了地方,苹果仅将詹南德里亚放在Siri团队担任负责人,这说明苹果高价挖来的AI牛人,只是为了优化Siri的一些功能。
对于苹果“胸无大志”,詹南德里亚也颇感无奈。这一点在彭博社的报道中也可以得到印证,詹南德里亚对媒体称,在苹果团队中,他们没有在苹果内部形成统一的意见,只能采取更为保守的做法,观望其他企业的人工智能发展情况。
苹果对人工智能的态度直到2023年2月才开始有所转折,苹果当月举办了人工智能峰会,算是对外界频频问及人工智能计划的回应,但是令外界失望的是,在活动中苹果没有任何实质的计划披露,有媒体吐槽人工智能峰会更像是苹果公司的内部团建。
直到2023年6月,苹果CEO蒂姆·库克才对外表态,称人工智能技术是苹果正在密切关注的。但是6月的开发者大会WWDC,苹果再次掉了链子,对人工智能和大模型只字未提,只是提到了“机器学习”这个词语。
有业内人士分析认为,ChatGPT等AI大模型的诞生,就是为了颠覆人们的交流方式和人与机器的交互方式,而苹果目前十分依赖iPhone、iPad和Mac等硬件销售,这些硬件产品为苹果贡献了78%的营收,特别是iPhone的营收,几乎占到整个公司总营收的一半,苹果如果转型AI大模型等于革自己的命,这对目前硬件销售如日中天的苹果来说,是很难迈出的一步。从这个角度来看,苹果对人工智能态度冷淡也在情理之中。
02 被逼出来的一步
苹果与其说是自己后知后觉,不如说迈向人工智能是被逼出来的一步。
对手已经抢跑,包括和OpenAI深度合作推出了新Bing的微软,推出ChatGPT竞品Bard的谷歌,就连苹果在智能手机领域的最大对手三星,已经在测试移动浏览器中集成ChatGPT,苹果不着急是假的。
7月18日,Meta公司发布了首个开源人工智能模型Llama的商业版本Llama 2,这也是大型科技公司首个开源的商用大模型,将为初创企业和其他企业提供OpenAI和谷歌的替代方案。该模型也因此被称为GPT4的“最强平替”。
有业内人士指出,开源的人工智能模型才能担任“普及者”这一角色。比如安卓和GitHub能风靡全球,都和开源脱不了关系。此前PC的Linux系统也是开源的系统,至今仍长盛不衰。目前我们所用的路由器、交换机、智能洗衣机、智能电饭煲、交换机、服务器等等设备,几乎全部搭载了开源的Linux系统,可以说没有开源,就没有人工智能和物联网生存的土壤。
微软收购的OpenAI,对是否开源这一问题态度一直含糊不清。所以Meta公司发布开源大模型版本Llama 2之后,有媒体直接在新闻标题上写道——属于AI大语言模型的“安卓时刻”要来了。
苹果一向是封闭系统的坚定拥护者,在此前,开源的安卓系统就给苹果带来了巨大的压力,Meta公司发布开源大模型,无疑是再次给了苹果当头一棒。今年5月,谷歌一份泄露的内部备忘录就预测了开源系统将蚕食闭源系统的情形:“我们没有护城河,OpenAI也没有。”这份文件引起了科技界的广泛关注。
谷歌在人工智能领域没有护城河,苹果当然更没有。
而微软的步伐也不慢。微软在2023年开始围绕ChatGPT以及人工智能推出新产品和新服务,微软在最近的Inspire大会上宣布了新的Microsoft 365人工智能订阅服务的定价后,股价大涨超过4%创下历史新高,2023年以来微软股价累计已经暴涨约50%。
此前,微软对Bing搜索引擎和Edge浏览器进行了人工智能更新,为用户提供将搜索、浏览和聊天整合为统一的体验,并发布了Microsoft 365 Copilot将AI应用于Word、Excel、PowerPoint、Outlook、Teams等软件,这些服务都得到了来自GPT-4等大模型的支持。
虽然谷歌初次公布大模型Bard表现不尽如人意,但是谷歌正在快速修复问题,并再次推出了新的通用大语言模型PaLM 2。PaLM 2是Bard的模型的升级版,可以生成多种文本回应用户。谷歌称,它可以使用100种语言,擅长数学、软件开发、语言翻译推理和自然语言生成。
更让苹果揪心的是,PaLM 2有版本可用于移动端,目前谷歌已将AI作为安卓生态的重要一环来推进。
据谷歌官方介绍,目前AI已经结合到谷歌的一些产品中,比如利用生成式AI推出实现“帮我写”(Help Me Write)的功能,帮助用户写邮件。
比如有用户想获得航空公司的票务退款,再也不需要自己向航空公司写申请,AI能让生成的文本更长或更短,并且可以用之前的消息作为上下文,帮助AI编写内容。你只要对AI下达一个指令,输入你想要的提示词,点击创建,就会出现一个完整的文本。
此外,谷歌地图将提供名为“沉浸式视图”(Immersive View)的AI工具。该工具将获取空气质量和天气的信息,为谷歌地图用户选出一条路线,并将路线可视化。
谷歌的相册也将推出名为“神奇编辑”(Magic Editor)的功能,用生成式AI帮助用户重新构建照片,可以选择编辑照片的任何一部分,无论是画面的主角、天空还是背景,都可以编辑,可以抓取可以移除。
比如用户主要想拍的是瀑布,可以把瀑布边的人挪开些,拍照时人忘了取下背带,可以把拍到的背带抹去,可以把拍出的天空调得更明亮,这对苹果手机一直强调的算法拍照来说,几乎是一种颠覆式的创新。
谷歌还透露了其正在开发新的语言大模型Gemini。谷歌旗下DeepMind CEO戴密斯·哈萨比斯最近在采访中进一步透露了Gemini的细节:Gemini 会将AlphaGo与GPT-4等大模型的语言功能合并,目标是让系统具有新的能力,如规划或解决问题,比OpenAI的GPT-4能力更强。
当人工智能如洪流一般涌向整个科技行业时,苹果还能当沙下藏头的鸵鸟,可当人工智能可能危及到整个苹果的软硬件生态时,对人工智能一向冷淡的苹果真的坐不住了,“苹果GPT”是否能像初代iPhone手机那样震撼整个行业,时间会给我们答案。