Riffusion 是一个免费开源的具有稳定扩散的实时音乐和音频生成库,用户只需输入音乐描述,AI便可以生成对应风格的音乐。该开源项目由Seth Forsgren 和 Hayk Martiros推出,Riffusion的背后原理是基于Stable Diffusion(文本生成图像模型)微调频谱图,频谱图是音频的视觉表示,显示不同频率随时间的振幅,而后再将高保真度的频谱图图像转换为音频。

免责声明:本网对于转载或分享其他网站或网络来源的内容,只是出于传递信息技术等,内容仅供参考,同时对其观点保持中立。版权归原作者所有,若有侵权,请及时联系我们1743542898@qq.com删除,谢谢!

类似网站