重磅:OpenAI发布GPT-4o

几个小时前,OpenAI 春季发布会!

Open AI 宣布推出其最新旗舰生成式 AI 模型 GPT-4o,(“o”代表“omni”),

这一多模态 AI 突破使得 OpenAI 的ChatGPT能够无缝理解和生成文本、音频、图像甚至视频。 

它的速度快得惊人,并且可以执行实时音频讨论。

用户可无延迟地打断它,模型可以听到,并用自己的情绪来响应用户的情绪和呼吸,可怕不?!

GPT-4o 分析和思考的速度有多快,实在是太令人震惊了。

速度快得令人难以置信。

响应几乎是即时的。

并且,现在,它可以理解声音和图片!

语音对话可以理解任何语言,并用您想要的语言响应你。

GPT-4o 模型将在未来几周内分阶段集成至 OpenAI 的各个产品之中。

最让人惊喜的是,根据Open AI,GPT-4o 将免费提供给所有用户使用。

人工智能史上正在发生一场革命!

OpenAI 推出 GPT-4o,一款改变游戏规则的多模态 AI 助手!

增强的速度、准确性和多语言功能可实现自然语音对话和视觉分析。

看完发布会视频,自留地君感受最为深刻的有7点:

1、GPT-4o 是一个集合了图像、文本、语音和视频的全能模型;

2、全新的UI,模型功能越来越强大,界面越来越简洁,实在是太赞了!

3、语音识别和自然语言生成:用户现在可以与 ChatGPT 交谈并接收自然 AI 语音的语音响应,该语音可以调整其语气、方言,甚至根据命令唱歌。

这种具有 GPT-4o 增强音频/视频功能的新语音模式的 alpha 版本将在未来几周内推出,ChatGPT Plus 订阅者可以在更广泛的推广之前提前使用。

4、多语言人工智能:GPT-4o 支持 50 多种语言,并且可以在它们之间完美翻译,使其成为宝贵的多语言助手。

同样,几乎无需等待,丝滑完美无缝对接。

5、利用 AI 进行视觉分析:实时视觉能力,现在,你可以和 GPT-4o 打视频电话啦!让它通过设想头直接解答的所有问题。

只需通过相机向 GPT-4o 展示图像、视频、文档或物体,它就可以非常详细地分析和讨论其感知到的内容。

6、增强的速度和准确性:GPT-4o 的速度是其前身 GPT-4 的两倍,而运行成本仅为其一半。这可以实现类似于人类对话的近乎实时的响应。

实时聊天,能听懂用户情绪,你可以随时打断它。丝滑程度超乎想象,完全没有思考(计算)加载的时间。

7、Open AI宣称这一切都是免费的!

展望未来,GPT-4o 将实现更自然的实时语音对话以及通过实时视频源进行对话的能力。

AI助手的全新时代开始了!

设想一下,如果任何人都可以免费使用 GPT-4o,以及之前发布的 Sora,

如果SORA的视频和GPT——4o的对话可以同时使用,

我们所处的世界,将会是个完全不同的世界。

渭水悠悠 Photo by Johnnie Walker