全球数字财富领导者

谷歌推出史上最强大AI模型Gemini,挑战OpenAI旗舰模型GPT-4o

2024-05-15 08:03:44
金融界
金融界
关注
0
0
获赞
粉丝
喜欢 0 0收藏举报
— 分享 —
摘要:在年度Google I/O开发者大会上,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新。此举标志着谷歌在人工智能领域的又一重要突破,同时也是对OpenAI新发布的旗舰模型GPT-4o的有力回应。Pichai表示,谷歌的全部工作重心都已转向Gemini,他们希望通过这个强

在年度Google I/O开发者大会上,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新。此举标志着谷歌在人工智能领域的又一重要突破,同时也是对OpenAI新发布的旗舰模型GPT-4o的有力回应。

Pichai表示,谷歌的全部工作重心都已转向Gemini,他们希望通过这个强大的AI模型,让每个人都能从中受益。为了实现这一目标,谷歌率先将AI技术应用于搜索领域,推出了全新的AI搜索功能。

在美国,AI生成摘要的功能——AI Overviews,已率先上线谷歌搜索,并计划在全球范围内推广。该功能利用Gemini的多步推理能力,能够代替用户进行研究,提供更精准的搜索结果。例如,通过汇总用户一整天的膳食和食谱,Gemini可以帮助规划饮食,甚至推荐购买所需餐食的地方。

此外,借助Gemini的力量,谷歌搜索的结果页面也将发生变革。用户可以获取更加个性化的推荐,如寻找有现场音乐的餐厅时,Gemini可以根据季节等因素提供智能推荐。

在谷歌相册Google Photos中,Gemini同样展示了其强大的搜索能力。新推出的Ask Photos with Gemini功能允许用户通过上下文搜索找到特定的照片,如车牌照号等。同时,谷歌的云计算生产力和协作平台Google Workspace也将与Gemini紧密结合,提升工作效率。

值得一提的是,Gemini还可用于搜索手机内容,如查找收据或安排取货时间等。对于计划旅行的用户来说,Gemini还能搜索有趣的活动,使旅行更加丰富多彩。

在AI模型的更新方面,谷歌推出了Gemini 1.5 Pro,拥有全球消费类聊天机器人中最长的上下文窗口,起始窗口就高达100万个token。此外,新模型还支持超过35种语言,并向150多个国家和地区的Gemini Advanced订阅者提供。

除了文本交互外,谷歌还计划在今年夏季扩展Gemini的多模态功能,包括增加语音进行深入双向对话的能力。这一功能被称为Live,它将使用户能够与Gemini进行更自然的交流。

与此同时,谷歌还宣布了将在Gemini Advanced中添加新的旅行规划功能和数据分析功能。这些新功能将进一步提升Gemini的实用性,使其能够更好地满足用户的个性化需求。

此外,谷歌还推出了名为Gem的Gemini定制版本。用户可以根据自己的需要创建个性化的Gemini,如健身伙伴、主厨帮手等。这将为用户带来更加个性化的AI体验。

在移动端方面,谷歌推出了新的多模态AI项目Project Astra,它可以为用户解释智能手机拍到的东西。同时,谷歌还计划为安卓端侧的Gemini增加多模态功能,使手机能够通过多种方式理解世界。

总的来说,谷歌通过这一系列更新和升级,进一步巩固了其在搜索和AI领域的领先地位。同时,这些创新举措也展示了谷歌对未来科技的深刻洞察和坚定投入。

敬告读者:本文为转载发布,不代表本网站赞同其观点和对其真实性负责。FX168财经仅提供信息发布平台,文章或有细微删改。
go