D-ID:用你自己的照片生成视频

​人工智能技术日新月异  🛫️

这不,早上就看到消息,搜索引擎 Perplexity AI 发布了它的手机应用,它是一种不仅提供出处,而且还提供语音搜索的应用程序,更重要的是它还是完全免费的!

Perplexity.AI 是一种试图将大型语言模型(Large Language Model,LLM)和搜索引擎结合来进行的新型服务。

Perplexity AI成立于2022年,其定位为AI搜索引擎公司,和ChatGPT一样,它将利用AI对谷歌发起挑战。

Perplexity.AI发布的推广语是 LLM powered products for search。 

该引擎由大规模语言模型驱动,通过对话形式提供用户需要的答案。

Perplexity AI 所倡导的以对话交互作为检索形式的新方法,或将逐渐成为主流。

还没有时间测试Perplexity.AI新发布的手机应用程序我们是否可以享用。

我们还是说会人工智能教育教学应用,尤其是生成性人工智能,对于教师的教学和科研将会产生重大影响。

从备课、教学设计、课后练习题的准备、视频制作、甚至演示文稿,基础性的工作将由人工智能来完成,让教师可以从一些常规型的、繁重的工作和任务重摆脱出来。

其中,微课类的视频制作和演示文稿制作,就是最让老师感到烦恼的事情。

今天,我们就专门聊用人工智能加持视频制作。

D-ID是2017年成立的一家以色列公司,

D-ID 是一家提供人工智能仿真人视频产品服务和开发的公司。

用户只需上传人像照片,输入要说的内容(台词),D-ID 就能利用 AI 语音机器人自动将用户输入的文字转换成音频,用户甚至还能直接上传录音文件,快速获得一部让照片动起来的、非常逼真的、合成视频。

D-ID 可被用于用户本人照片、虚拟讲师、主持人、AI 机器人或视频特效、专题视频、广告等场景,应用于教育或各种服务场合都非常适合。

https://mp.weixin.qq.com/cgi-bin/readtemplate?t=tmpl/video_tmpl&vid=wxv_2857248050296373251

利用最新的人工智能技术,结合自然语言处理和相关音频处理技术,快速生成视频实际上早已不是什么独门秘籍了!

然而,结合动画和仿真视频技术,让静态的照片中的人像动起来,还能够替照片加上录音档或文字稿内容,进行人像照片与声音的结合,让静态人物也会自动开口说话,在目前来看,似乎还是不多见的!

D-ID 的服务支持中文和英文语音,功能相当强大且易于使用。

目前,D-ID 提供了两种基础版本:

一种是使用单张静止图片制作的“单人像”,这种版本的头部是动画,其他部分是静止的。这个模式下只对照片中的现有背景有效。 

另一种更高级的选项,需要先按照指导说明,提交所请求人物的 10 分钟的视频用于训练。

这个高级模式能够适用于自定义、可交互的背景,并为人物的身体和手部提供一些预设动画选项。

用户只要上传一张照片,或者一段视频,给D-ID 文字,D-ID 就可以帮助你生成视频。

从生成结果来看,视频中由静态图片带来的动画动作还有点生硬,但是,这确实是一个未来的趋势。

D-ID 的生成式 AI 技术为营销、学习和开发以及 CX 领域的专业人士以及各种内容创作者提升了视频内容。

使用户能够从文本中生成逼真的数字人物,从而显着降低大规模视频制作的成本和麻烦。

到目前为止,人们已经使用D-ID 的技术创建了超过 1.1 亿个视频。 

从其官网上可以看到,D-ID 的客户包括财富 500 强公司、营销机构、制作公司、社交媒体平台、领先的电子学习平台和各种内容创作者,包括 Warner Brothers Pictures、Publicis、Mondelez、Skilldora 和 MyHeritage等等,它们使用 D-ID 的平台创造了非凡的体验。

Photo by Brandon Frie on Unsplash