生成式 AI 运用各种方法在现有内容的基础上创建新内容。 生成对抗网络 (GAN) 是其中一种方法。 GAN 由生成器和鉴别器组成,鉴别器创建新数据并确保它是真实的。 基于 GAN 的方法允许您经过超分辨率 GAN 创建图像的高分辨率版本。 此方法可用于生成高质量版本的档案材料和/或以高分辨率格式保存不经济的医学材料。 另一个用例是监视目的。
5、视频预测
基于 GAN 的视频预测系统可以:
了解视频的工夫和空间元素根据该知识生成下一个序列区分能够序列和非能够序列基于 GAN 的视频预测可以协助检测安全和监控等广泛范畴所需的异常状况。
(, 下载次数: 0)
上传
点击文件名下载附件
上图中,C 列中描画了视频预测的示例。来源:“FutureGAN 回顾”。
6、3D 外形生成
在这个范畴,研讨仍在停止中,以创建高质量的 3D 版本的对象。 运用基于 GAN 的外形生成,可以根据与原始来源的相似性获得更好的外形。 此外,可以生成和操作详细的外形以创建所需的外形。
(, 下载次数: 0)
上传
点击文件名下载附件
上图为GAN 生成和操作的 3D 外形示例。 材料来源:“SP-GAN:球面引导的 3D 外形生成和操作”。
7、文字转语音生成器
GAN 允许生成逼真的语音音频。 为了获得理想的结果,鉴别器充当训练者,对声响停止强调、调整和/或调制。
TTS一代有多种商业运用,如教育、营销、播客、广告等。例如,教育工作者可以将他们的讲义转换成音频材料,使其更具吸引力,异样的方法也可以协助制造教育材料 对于视障人士。 除了免除配音师和设备的费用外,TTS 还为公司提供了言语和声乐曲目方面的多种选择。
8、语音到语音转换
生成式 AI 的音频相关运用触及运用现有语音源生成语音。 经过 STS 转换,可以轻松疾速地创建配音,这对游戏和电影等行业来说是有利的。 运用这些工具,可以在不延聘配音师的状况下为纪录片、广告或游戏生成配音。
9、音乐生成
研讨人员呼吁 GAN 为最先进的 ML 算法的缺陷提供替代方案。 虽然 GAN 最后用于视觉目的,但目前正在接受培训以使其在文本生成中也很有用。 经过生成式 AI 创建对话、标题或广告通常用于营销、游戏和通讯行业。 这些工具可用于实时聊天框,以便与客户停止实时对话或创建产品描画、文章和社交媒体内容。
11、代码生成