OpenAI发布GPT-4o，人机交互重大跨越，聊聊我们的最新体验感受

北京时间5月14日凌晨，OpenAI 发布了最新旗舰AI模型 GPT-4o，将在未来几周内集成至产品中，并免费提供（应该有限额）。OpenAI宣布，与GPT-4相比，GPT-4o的智能水平类似，但与人类的交互能力发生了重大跨越。

微信截图_20240514115324.png GPT-4o 在文本、图像、视觉和语音处理方面进行了提升，运行速度更快，语音交互更流畅，可以实时反馈和打断，还能调整说话语气和唱歌，通过视觉识别能力，GPT-4o能够理解和分析图片中的内容，支持用户通过图片与ChatGPT进行交互，GPT-4o还能理解屏幕上的代码，并提供相关的帮助和反馈。

OpenAI表示，GPT-4o的多语言功能得到了增强，在50种不同的语言中表现更佳。在OpenAI的API中，GPT-4o的处理速度是GPT-4(特别是 GPT-4 Turbo)的两倍，价格则是GPT-4 Turbo的一半，同时拥有更高的速率限制。

从即日起，GPT-4o将在ChatGPT的免费版本中提供，而OpenAI的高级版本ChatGPT Plus和Team用户则可享有“五倍消息限制”的优势，企业选项也将“即将推出”(当用户达到使用阈值时，系统将自动转为使用 GPT-3.5)。

微信截图_20240514115512.png

OpenAI表示，计划在下月左右为Plus用户推出改良后的GPT-4o语音体验。用户只需发出简单的“嘿，ChatGPT”语音提示，即可获得代理的口语回应。然后，用户可以用口语提交查询，并在必要时附上文字、音频或视觉效果——后者可包括照片、手机摄像头的实时画面或代理能“看到”的任何其他内容。在音频输入方面，人工智能的平均响应时间为320毫秒，与人类的对话响应时间类似。

目前，GPT-4o的应用程序接口中尚未为所有客户提供语音功能。鉴于滥用风险，OpenAI计划在未来几周内首先向“一小部分可信赖的合作伙伴”推出对GPT-4o新音频功能的支持。

其他方面，OpenAI将在网络上发布全新的ChatGPT UI，新的主屏幕和消息布局“更具对话性”，同时还将发布桌面版的ChatGPT for Mac，用户可以通过键盘快捷键向ChatGPT提问，也可以通过打字或说话截图并进行讨论(从今天开始，Plus用户将首先获得访问权限，Windows版本的应用程序将于今年晚些时候推出)。此外，ChatGPT的免费用户现在还可以访问GPT Store(OpenAI 基于其人工智能模型构建的第三方聊天机器人库)。

GPT-4o的文本和图像功能已经开始向付费的ChatGPT Plus和Team用户推出，企业用户也即将推出。免费用户也将开始使用，但有使用限制。

语音版GPT-4o将“在未来几周内”开始提供。开发人员将能够使用GPT-4o的文本和视觉模式，并在未来几周内向“一小部分值得信赖的合作伙伴”提供音频和视频功能。

付费用户享有五倍调用额度。同时，OpenAI 发布了桌面版ChatGPT和新界面，旨在提供更自然、轻松的交互体验。

新闻出来后，第一电动第一时间尝试体验了GPT-4o，但却发现GPT-4o，当前并不是对所有GPT用户开放。一些账号登陆后能够试用GPT-4o，而一些账号登录后，系统不显示GPT-4o。

一位体验过GPT-4o的朋友称：GPT-4o就是增加了上传附件的入口，此功能原来的GPT4一直都有，只是一直收费。识别个图片功能，系统显示需要更新到付费版本ChatGPT4后才能试用。此外，语音功能，目前只有APP版本。她猜测：估计也是对免费的用户有限制，有可能还得升级到付费版本才能使用。

我们的体验还在继续，之后如果有更多发现，也会继续与大家分享。

来源：第一电动网

作者：陈静

本文地址：