又到谷歌 I/O 的“大秀”时间。毫无疑问,AI是备受瞩目的焦点。
美东时间周二,谷歌年度 I/O 开发者大会拉开帷幕。
继OpenAI抢先一步“上新”后,谷歌开启正面回击。从新的搜索和聊天功能到面向云客户的AI硬件,谷歌一口气推出了多款AI新品。
对此,谷歌CEO皮查伊表示,谷歌所有的工作都围绕生成式AI模型Gemini来做。
去年,谷歌的I/O大会带来了Gemini;今年的I/O大会几乎每一分钟都在讲 AI。
这是Gemini 统计出来的数字——在长达 110 分钟的主题演讲中,总共提了121 次 AI 。
会上,谷歌Gemini 家族大上新。
其中,包括了AI搜索引擎、Gemini 1.5 Pro 更新版、Gemini 1.5 Flash、Gemma 2以及全新的Project Astra、Google Veo、magen 3等模型。
AI搜索引擎“AI Overviews”
谷歌正式推出“AI Overviews”搜索体验。
据介绍,AI Overviews搜素引擎具备多步骤推理能力以及计划能力。此外,靠Gemini的多模态功能,谷歌可以做到利用声音搜歌曲,利用图片搜产品。
Gemini 1.5 Pro 更新
Gemini 1.5 Pro上下文窗口扩展支持200万token,号称“迄今为止所有基础模型中最长的上下文窗口”。
谷歌还通过数据和算法的改进增强了其代码生成、逻辑推理和规划、多轮对话以及音频和图像理解能力。
对于复杂指令,可遵循更复杂的指令,控制回复风格,设置系统指令。
谷歌称,今年夏季将扩展 Gemini 的多模态功能,包括增加用语音进行深入双向对话的能力,这一功能被称之为 Gemini Live。
目前,有超过 150 万的开发人员在使用 Gemini 模型,超过 20 亿的产品用户都用到了 Gemini。
新成员:Gemini 1.5 Flash 模型
Gemini 1.5 Flash,是谷歌追求速度和效率的轻量级模型,也是 Gemini 模型系列的最新成员。
它针对大规模、大批量、高频任务进行了优化,服务更具成本效益,并具有突破性的长上下文窗口(100 万 token )。
在应用场景上,它擅长总结、聊天、图像视频字幕、长文档数据提取等任务。Gemini 1.5 Flash通过从1.5 Pro模型中学习,继承了其核心能力。
AI助手:Project Astra
新的多模态AI项目Project Astra, 是谷歌人工智能助手的最新进展。
在演示中,AI助手可以通过视频和音频识别。例如,帮助用户记住他们把眼镜放在哪里、检查代码并回答有关某个部分的问题。
谷歌表示,一个真正有用的聊天机器人需要让用户“自然地与它交谈,没有滞后或延迟”。
皮查伊预计 Project Astra 将于今年晚些时候在 Gemini 启动。
新一代开源大模型 Gemma 2
谷歌开源大模型——Gemma 2 也来了。
据介绍,Gemma 2 采用全新架构,旨在实现突破性的性能和效率,新开源的模型参数为 27B。
视频大模型Google Veo、文生图像模型 Imagen 3
谷歌还发布了用于生成高清视频的最新模型“Veo”,以及最高质量的文本到图像模型 Imagen 3。
据悉,Veo 能够生成各种风格的高质量 1080p 分辨率视频,时长可以超过一分钟。它可以凭借对自然语言和视觉语义的深入理解,并在理解视频内容、渲染高清图像、模拟物理原理等方面都有所突破。
Imagen 3则在生成细节、光照、干扰等方面进行了优化升级,并且理解 prompt 的能力显著增强。
AI手机系统:Android 15操作系统
在 I/O 大会上,谷歌提到了即将推出的安卓新版本,即以 AI 为核心的 Android 15。
谷歌还宣布对其适用于 Android 设备的 Gemini AI 聊天机器人进行一些改进:Gemini 正在“成为 Android 上新的人工智能助手”。
这也意味着大模型现已成为 Android 操作系统的一部分,使其能够以更全面的方式集成。
AI芯片:第六代TPU芯片Trillium
谷歌第六代TPU芯片Trillium,是迄今为止性能最强大、能效最高的 TPU,将于 2024 年底正式上线。
与 TPU v5e 相比,Trillium TPU 的每芯片峰值计算性能提高了 4.7 倍,同时它还把高带宽内存(HBM)以及芯片间互连(ICI)带宽加倍。
皮查伊表示,将于 2024 年底正式上线。
“25 年来,我们投资建设了世界一流的技术基础设施。从支持搜索的尖端硬件,到支持人工智能进步的定制张量处理单元。我们将于 2024 年末向我们的云客户提供 Trillium。”
从模型到应用,再到芯片……此次谷歌年度 I/O 开发者大会让人应接不暇。
顶着Open AI压力的谷歌,这一次正面硬刚的表现还是非常出色的。
此前一天,OpenAI抢先一步发布了GPT-4 型号的最新版本——GPT-4o,似乎是有意狙击谷歌一般。
GPT-4o不仅在听、说、看 方面更“丝滑”,并且将向所有用户免费开放。
这也让市场为谷歌的“大上新”捏了一把汗。
但从现在来看,随着全家桶AI能力升级,谷歌靠着多维度反击,这一战双方势均力敌。
因为从创新方向来看,OpenAI注重AI技术的突破和飞跃,谷歌则注重生态系统的深化与整合,二者均各有所长。
当下,人工智能战场上的“厮杀”激烈。
在这场科技巨头的较量中,谷歌与OpenAI的再次交锋,也势必将人工智能的创新推向高潮。
各方科技巨头不停革新着自家的“大杀器”,也预示着AI的新一轮变革。而谷歌和Open AI的对决,远未止步于此。