ChatGPT既会说话又能上网了

生成式人工智能飞速发展,OpenAI 动作不断。

9月25日,OpenAI在其官网宣布,目前正在推出ChatGPT的新版本,ChatGPT现在可以“看”“听”和“说”了。

之前,要与ChatGPT进行语音对话和交流,必须安装插件,比如,Voice Control for ChatGPT, Talk-to-ChatGPT ChassistantGPT,方能做到这一点。

https://openai.com/blog/chatgpt-can-now-see-hear-and-speak

据有关媒体介绍,现在,在语音方面,ChatGPT:

第一,允许用户进行语音对话;

第二,支持在iOS和Android移动应用上使用;

第三,提供5种不同的语音选择;

第四,通过新型文本转语音模型和语音识别系统实现。

在图像方面,ChatGPT:

第一,允许用户上传图像与ChatGPT进行交互;

第二,支持多张图像;

第三,提供移动应用上的绘图工具;

第四,使用多模态GPT模型(Generative Pre-Trained Transformer,生成式预训练Transformer模型)理解图像。

国内的讯飞星火认知大模型,在推出的时候,就自带了语音交互的能力,用户点击右下方麦克风,直接语音输入文字,在星火认知大模型识别后,其生成的结果,又自带了文字转语音输出。

在图像方面,百度文心一言通过其8月16日发布的“说图解画”实现用户用图像和大模型展开交互,而讯飞星火认知大模型提供的三种用户输入模式中,就有图片上传、语音输入和文字输入。

看起来,在让大语言模型“能说会道”及“识图解画”上,百度和讯飞比ChatGPT似乎更早一些实现了这个功能。

当地时间周三(9 月 27 日),OpenAI 在 X 上宣布了又一项重磅消息,其聊天机器人产品 ChatGPT 可以通过微软的必应搜索引擎进行网络搜索,将不再局限于 2021 年 9 月之前的数据。

这意味着,此前 ChatGPT 已经正式通网。

早些时候,OpenAI 就测试了相关功能,允许Plus用户通过必应搜索访问最新信息,但是后来,由于担心用户绕过付费墙,于是就禁用了这项功能。

在上网和直接使用最新网络资讯这一点上,百度文心一言也早已经实现了这个功能。

在这美好的日子里

让我用最真挚的祝福伴您度过

祝福您

幸福美满、安康快乐

By Johnnie Walker via 文心一格