OpenAI推出实时视频和视觉功能,ChatGPT迎来重大更新
实时视频功能上线
根据TodayUSstock.com报道,OpenAI终于推出了其七个月前展示的实时视频功能,现已为ChatGPT增加了视觉功能。用户可以通过手机对准物体,ChatGPT将实时做出回应,增加了视觉理解能力。
带视觉的语音模式介绍
带视觉的先进语音模式是OpenAI新推出的一项功能,它不仅可以处理语音输入,还能理解图像和视频中的信息。用户通过该模式可以获得更为直观的交互体验。
应用场景与展示
在直播演示中,OpenAI展示了带视觉的语音模式如何理解用户手机屏幕上的内容,甚至可以帮助解决数学问题或者指导设备的设置。用户可通过点击语音图标和视频图标来启动该功能。
竞争对手与市场动态
Google和Meta等竞争对手也在开发类似的功能。Google本周推出了其实时视频分析功能“Project Astra”,并向安卓用户中的“受信任测试员”开放。
编辑总结
OpenAI推出的带视觉的先进语音模式标志着ChatGPT在交互性上的重大进步,虽然该功能尚存在一定的误差,但其潜力巨大。预计随着更多用户体验和技术的完善,该功能会在未来得到进一步优化。
名词解释
实时视频功能:指通过视频流处理和理解视觉信息,允许AI在观看视频或实时图像的基础上进行交互。
带视觉的先进语音模式:OpenAI推出的新增功能,结合语音和视觉,增强了ChatGPT的理解和互动能力。
Project Astra:Google开发的实时视频分析AI功能,目前在安卓平台向部分用户开放。
今年相关大事件
2024年12月:OpenAI正式推出带视觉的先进语音模式,用户可以通过手机视频或屏幕共享与ChatGPT进行互动。
2024年11月:Google发布Project Astra的测试版本,开始在安卓平台进行有限测试。
来源:今日美股网