ChatGPT既会说话又能上网了

生成式人工智能飞速发展，OpenAI 动作不断。

9月25日，OpenAI在其官网宣布，目前正在推出ChatGPT的新版本，ChatGPT现在可以“看”“听”和“说”了。

之前，要与ChatGPT进行语音对话和交流，必须安装插件，比如，Voice Control for ChatGPT， Talk-to-ChatGPT ChassistantGPT，方能做到这一点。

据有关媒体介绍，现在，在语音方面，ChatGPT：

第一，允许用户进行语音对话；

第二，支持在iOS和Android移动应用上使用；

第三，提供5种不同的语音选择；

第四，通过新型文本转语音模型和语音识别系统实现。

在图像方面，ChatGPT：

第一，允许用户上传图像与ChatGPT进行交互；

第二，支持多张图像；

第三，提供移动应用上的绘图工具；

第四，使用多模态GPT模型（Generative Pre-Trained Transformer，生成式预训练Transformer模型）理解图像。

国内的讯飞星火认知大模型，在推出的时候，就自带了语音交互的能力，用户点击右下方麦克风，直接语音输入文字，在星火认知大模型识别后，其生成的结果，又自带了文字转语音输出。

在图像方面，百度文心一言通过其8月16日发布的“说图解画”实现用户用图像和大模型展开交互，而讯飞星火认知大模型提供的三种用户输入模式中，就有图片上传、语音输入和文字输入。

看起来，在让大语言模型“能说会道”及“识图解画”上，百度和讯飞比ChatGPT似乎更早一些实现了这个功能。

当地时间周三（9 月 27 日），OpenAI 在 X 上宣布了又一项重磅消息，其聊天机器人产品 ChatGPT 可以通过微软的必应搜索引擎进行网络搜索，将不再局限于 2021 年 9 月之前的数据。

这意味着，此前 ChatGPT 已经正式通网。

早些时候，OpenAI 就测试了相关功能，允许Plus用户通过必应搜索访问最新信息，但是后来，由于担心用户绕过付费墙，于是就禁用了这项功能。

在上网和直接使用最新网络资讯这一点上，百度文心一言也早已经实现了这个功能。

在这美好的日子里

By Johnnie Walker via 文心一格