生成式人工智能飞速发展,OpenAI 动作不断。
9月25日,OpenAI在其官网宣布,目前正在推出ChatGPT的新版本,ChatGPT现在可以“看”“听”和“说”了。
之前,要与ChatGPT进行语音对话和交流,必须安装插件,比如,Voice Control for ChatGPT, Talk-to-ChatGPT ChassistantGPT,方能做到这一点。
据有关媒体介绍,现在,在语音方面,ChatGPT:
第一,允许用户进行语音对话;
第二,支持在iOS和Android移动应用上使用;
第三,提供5种不同的语音选择;
第四,通过新型文本转语音模型和语音识别系统实现。
在图像方面,ChatGPT:
第一,允许用户上传图像与ChatGPT进行交互;
第二,支持多张图像;
第三,提供移动应用上的绘图工具;
第四,使用多模态GPT模型(Generative Pre-Trained Transformer,生成式预训练Transformer模型)理解图像。
国内的讯飞星火认知大模型,在推出的时候,就自带了语音交互的能力,用户点击右下方麦克风,直接语音输入文字,在星火认知大模型识别后,其生成的结果,又自带了文字转语音输出。
在图像方面,百度文心一言通过其8月16日发布的“说图解画”实现用户用图像和大模型展开交互,而讯飞星火认知大模型提供的三种用户输入模式中,就有图片上传、语音输入和文字输入。
看起来,在让大语言模型“能说会道”及“识图解画”上,百度和讯飞比ChatGPT似乎更早一些实现了这个功能。
当地时间周三(9 月 27 日),OpenAI 在 X 上宣布了又一项重磅消息,其聊天机器人产品 ChatGPT 可以通过微软的必应搜索引擎进行网络搜索,将不再局限于 2021 年 9 月之前的数据。
这意味着,此前 ChatGPT 已经正式通网。
早些时候,OpenAI 就测试了相关功能,允许Plus用户通过必应搜索访问最新信息,但是后来,由于担心用户绕过付费墙,于是就禁用了这项功能。
在上网和直接使用最新网络资讯这一点上,百度文心一言也早已经实现了这个功能。
在这美好的日子里
让我用最真挚的祝福伴您度过
祝福您
幸福美满、安康快乐
By Johnnie Walker via 文心一格