重磅：OpenAI发布GPT-4o

几个小时前，OpenAI 春季发布会！

Open AI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o，（“o”代表“omni”），

这一多模态 AI 突破使得 OpenAI 的ChatGPT能够无缝理解和生成文本、音频、图像甚至视频。

它的速度快得惊人，并且可以执行实时音频讨论。

用户可无延迟地打断它，模型可以听到，并用自己的情绪来响应用户的情绪和呼吸，可怕不？！

GPT-4o 分析和思考的速度有多快，实在是太令人震惊了。

速度快得令人难以置信。

响应几乎是即时的。

并且，现在，它可以理解声音和图片！

语音对话可以理解任何语言，并用您想要的语言响应你。

GPT-4o 模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。

最让人惊喜的是，根据Open AI，GPT-4o 将免费提供给所有用户使用。

人工智能史上正在发生一场革命！

OpenAI 推出 GPT-4o，一款改变游戏规则的多模态 AI 助手！

增强的速度、准确性和多语言功能可实现自然语音对话和视觉分析。

看完发布会视频，自留地君感受最为深刻的有7点：

1、GPT-4o 是一个集合了图像、文本、语音和视频的全能模型；

2、全新的UI，模型功能越来越强大，界面越来越简洁，实在是太赞了！

3、语音识别和自然语言生成：用户现在可以与 ChatGPT 交谈并接收自然 AI 语音的语音响应，该语音可以调整其语气、方言，甚至根据命令唱歌。

这种具有 GPT-4o 增强音频/视频功能的新语音模式的 alpha 版本将在未来几周内推出，ChatGPT Plus 订阅者可以在更广泛的推广之前提前使用。

4、多语言人工智能：GPT-4o 支持 50 多种语言，并且可以在它们之间完美翻译，使其成为宝贵的多语言助手。

同样，几乎无需等待，丝滑完美无缝对接。

5、利用 AI 进行视觉分析：实时视觉能力，现在，你可以和 GPT-4o 打视频电话啦！让它通过设想头直接解答的所有问题。

只需通过相机向 GPT-4o 展示图像、视频、文档或物体，它就可以非常详细地分析和讨论其感知到的内容。

6、增强的速度和准确性：GPT-4o 的速度是其前身 GPT-4 的两倍，而运行成本仅为其一半。这可以实现类似于人类对话的近乎实时的响应。

实时聊天，能听懂用户情绪，你可以随时打断它。丝滑程度超乎想象，完全没有思考（计算）加载的时间。

7、Open AI宣称这一切都是免费的！

展望未来，GPT-4o 将实现更自然的实时语音对话以及通过实时视频源进行对话的能力。

AI助手的全新时代开始了！

设想一下，如果任何人都可以免费使用 GPT-4o，以及之前发布的 Sora，

如果SORA的视频和GPT——4o的对话可以同时使用，

我们所处的世界，将会是个完全不同的世界。

渭水悠悠 Photo by Johnnie Walker