OpenAI发布GPT-4o：更快、更强、更免费，桌面版震撼登场

Table of Contents

GPT-4o：AI工具的全新体验

距离GPT-4发布仅一年，OpenAI于5月13日再次发布了其最新力作——GPT-4o。作为新一代旗舰模型，GPT-4o在速度、功能和易用性方面都有了显著提升，并首次推出了桌面版，为用户带来了更加便捷、高效的AI体验。

“O”是包罗万象的O

更强大：原生多模态，实时对话

GPT-4o最大的亮点之一是其原生多模态能力。这意味着它可以同时处理来自文本、音频和图像的信息，并以无缝衔接的方式输出多种形式的结果。例如，用户可以向GPT-4o描述一个想法，并附上相关图片，GPT-4o会根据这些信息生成对应的文本、音频或视频。

此外，GPT-4o的对话速度也得到了大幅提升。得益于端到端的训练，GPT-4o的平均响应时间仅为320毫秒，几乎与人类对话的速度一致。这意味着用户可以与GPT-4o进行更加自然流畅的交流。

更易用：免费开放，桌面版登场

OpenAI宣布，GPT-4o将完全免费向用户开放。这意味着任何人都可以无门槛地体验GPT-4o带来的强大功能。此外，OpenAI还推出了GPT-4o的桌面版，用户可以将其嵌入到任何工作流程中，随时随地与GPT-4o进行互动。

更人性化：即时反馈，情感识别

GPT-4o还拥有了更加人性化的功能。它可以识别用户的情绪和意图，并根据上下文进行相应的调整。例如，如果用户感到焦虑，GPT-4o会提供一些舒缓情绪的建议。此外，GPT-4o还可以理解用户的打断，并在用户提出要求时及时做出调整。

连呼吸都能辨别

发布会的最后一个环节是实机演示。OpenAI麾下的大牛研究员Marc Chen和Barret Zoph一起展示了新模型的强大之处。

在第一段对话里，Chen对GPT说，自己有点紧张，然后开始急促地呼吸。GPT识别到了他呼吸的声音，说，别紧张，你喘得像个吸尘器，深呼吸，再吐气。接着GPT开始指导Chen怎么深吸慢呼平复心情。

这个demo设置得很妙，它展示出了两个重要的新能力：听环境音和即时反馈。

GPT不再需要一轮一轮地进行对话，它可以同时听人喘气和进行呼吸指导，输入和输出在同时发生。

第二个demo里，Chen让GPT给Zoph讲个睡前故事哄他入睡，Chen反复打断GPT的讲述，问它能不能讲得更刺激点，最后，GPT跟迪士尼公主似的把故事用歌唱了出来。

有时候GPT给人感觉话太多了，在新版本里，你要是不想听可以立刻打断或者提出意见，就像在真实生活里的交流一样。

后面的几个demo里，GPT教Zoph做了数学题（“你能不直接告诉我答案，而是启发我一步一步解完嘛？”），给大家解释了代码，读了图表，给Zoph看了面相（“你很开心，又有点激动。”），最后还当了Chen和穆拉蒂之间的同声传译。

以下是一些需要注意的细节：

GPT-4o的免费版本具有一定的使用限制，付费用户可以享受更高的使用容量。
GPT-4o目前支持50多种语言，包括中文。
OpenAI还发布了GPT-4o的API，开发者可以将其集成到自己的应用程序中。

以下是一些可能的未来发展方向：

GPT-4o可能会更加智能化，能够更好地理解和处理复杂的信息。
GPT-4o可能会更加个性化，能够根据每个用户的需求提供定制化的服务。
GPT-4o可能会更加普及，被应用于更广泛的领域。

Glairty 已经支持了GPT-4o。欢迎大家来体验。

OpenAI发布GPT-4o：更快、更强、更免费，桌面版震撼登场

GPT-4o：AI工具的全新体验

“O”是包罗万象的O

更强大：原生多模态，实时对话

更易用：免费开放，桌面版登场

更人性化：即时反馈，情感识别

连呼吸都能辨别

投稿者 Charels shiro

関連投稿

コメントを残すコメントをキャンセル

最新news

医療から教育まで！AI翻訳が広げる新しい可能性

What to Do When You Need to Visit a Hospital During Overseas Travel Due to Illness or Injury and Don’t Speak the Language?

在海外旅行中生病或受伤，去医院时语言不通怎么办？

韓国語翻訳をもっと自由に！進化するニーズとおすすめツール

GPT-4o：AI工具的全新体验

“O”是包罗万象的O

更强大：原生多模态，实时对话

更易用：免费开放，桌面版登场

更人性化：即时反馈，情感识别

连呼吸都能辨别

投稿者 Charels shiro

関連投稿

コメントを残す コメントをキャンセル

最新news

コメントを残すコメントをキャンセル