风险提示:理性看待区块链,提高风险意识!
文本直接生成20多种背景音乐,免费版Stable Audio来了!
首页 > 业界 > 区块链 2023-09-14 10:38:13
币界网报道:

来源:AIGC开放社区

9月14日,著名开源平台Stability AI在官网发布了,音频生成式AI产品Stable Audio。(免费使用地址:https://www.stableaudio.com/generate)

用户通过文本提示就能直接生成摇滚、爵士、电子、嘻哈、重金属、民谣、流行、朋克、乡村等20多种类型背景音乐。

例如,输入迪斯科、鼓机、合成器、贝司、钢琴、吉他、欢快、115 BPM等关键词,就能生成背景音乐。

目前,Stable Audio有免费和付费两个版本:免费版,每月可生成20个音乐,最大时长45秒,不能用于商业;付费版,每月11.99美元(约87元),可生成500个音乐,最大时长90秒,可用于商业。

如果你不想付费可以多注册几个账号,可以通过AU(一种音频编辑器)或PR将生成的音乐拼接起来可达到同样效果。


Stable Audio简单介绍


在过去几年,扩散模型在图像、视频、音频等领域获得了飞速发展,可显著提升训练和推理效率。但音频领域的扩散模型存在一个问题,通常会生成固定大小的内容。

例如,音频扩散模型可能在30秒的音频片段上进行训练,并且只能生成30秒的音频片段。为了打破这个技术瓶颈Stable Audio使用了一种更先进的模型。

这是一种基于文本元数据以及音频文件持续时间,和开始时间调整的音频潜在扩散模型,允许对生成音频的内容和长度进行控制。这种额外的时间条件使用户能够生成指定长度的音频。

与原始音频相比,使用大幅度下采样的音频潜在表示可以实现更快的推理效率。通过最新稳定音频模型,Stable Audio能在不到一秒的时间内,使用NVIDIA A100 GPU渲染出95秒的立体声音频,采样率为44.1 kHz。

训练数据方面,Stable Audio使用了一个超过80万个音频文件组成的数据集,包含音乐、音效以及各种乐器。

该数据集总计超过1.95万小时的音频,同时与音乐服务商AudioSparx进行合作,所以,生成的音乐可以用于商业化。


潜在扩散模型


Stable Audio所使用的潜在扩散模型(Latent Diffusion Models)是一种基于扩散的生成模型,主要在预训练的自动编码器的潜在编码空间中使用。这是一种结合了自动编码器和扩散模型的方法。

自动编码器首先被用来学习输入数据(例如图像或音频)的低维潜在表示。这个潜在表示捕捉了输入数据的重要特征,并且可以被用来重构原始数据。

然后,扩散模型在这个潜在空间中进行训练,逐步改变潜在变量,从而生成新的数据。

这种方法的主要优点是可以显著提高扩散模型的训练和推理速度。因为扩散过程在一个相对较小的潜在空间中进行,而不是在原始数据空间中进行,因此可以更高效地生成新的数据。

此外,通过在潜在空间中进行操作,这种模型还可以提供对生成数据的更好控制。例如,可以通过操纵潜在变量来改变生成数据的某些特性,或者通过对潜在变量施加约束来引导数据生成过程。


Stable Audio使用和案例展示


「AIGC开放社区」体验了一下免费版Stable Audio,使用方法与ChatGPT差不多直接输入文本提示即可。提示内容包括细节、心态、乐器和节拍四大类。

需要注意的是,如果想生成的音乐更细腻、有律动性和节奏,输入的文本也需要更细化。也就是说,你输入的文本提示越多,那么生成的效果就约好。

Stable Audio使用界面

以下是生成音频案例展示。

恍惚、岛屿、海滩、太阳、凌晨4点、渐进、合成器、909、戏剧和弦、合唱、欢快、怀旧、动态。

柔软的拥抱,舒适,低合成,闪烁,风和树叶,环境,和平,放松,水。

流行电子、大混响合成器、控鼓机、大气、穆迪、怀旧、酷、流行乐器、100 BPM。

3/4,3拍,吉他,鼓,明亮,快乐,拍手

本文素材来源Stability AI官网,如有侵权请联系删除

END

上一篇: 90% 的欧洲议会议员支持更严格的 Crypto 资产税收框架
下一篇: 私钥自托管平台Safeheron携手Web3安全机构CertiK 推动私钥管理透明化
推荐专栏
Boss Wallet Web3 Econom Pass
专注币圈最新资讯
通俗浅显地聊透Web3大事小情
读懂区块链生态与未来,尽在币界网!
热门币种
更多
币种
美元价格
24H涨跌幅
BTC比特币
59,308.43 USDT
¥423,290.19
+1.37%
ETH以太坊
3,007.98 USDT
¥21,468.25
+1.05%
BNB币安币
563.24 USDT
¥4,019.90
+0.75%
USDT泰达币
1.02 USDT
¥7.29
+0.18%
SOL
140.96 USDT
¥1,006.04
+4.23%
XRP瑞波币
0.52140 USDT
¥3.72
-0.99%
USDC
1.00 USDT
¥7.14
-0.17%
DOGE狗狗币
0.13340 USDT
¥0.95200
+3.33%
TON
5.20 USDT
¥37.11
+6.66%
ADA艾达币
0.45850 USDT
¥3.27
+1.75%
热搜币种
更多
币种
美元价格
24H涨跌幅
比特币
59326.5 USDT
¥429,494.20
+2.12%
Filecoin
6.0036 USDT
¥43.46
+5.67%
Solana
140.21 USDT
¥1,015.05
+4.8%
狗狗币
0.1337 USDT
¥0.97
+3.48%
Arweave
35.5981 USDT
¥257.71
+22.66%
字节元
0.015783 USDT
¥0.11
-3.26%
Yield Guild Games
0.7949 USDT
¥5.75
+3.95%
以太经典
25.8763 USDT
¥187.33
+2.09%
Conflux
0.2266 USDT
¥1.64
+4.38%
币安币
563.02 USDT
¥4,075.98
+0.87%
柚子
0.8281 USDT
¥6.00
+6.32%
dYdX
2.1329 USDT
¥15.44
+4.25%
最新快讯
更多
JackDorsey的Block公司计划购买更多比特币
2024-05-03 06:06:47
资深分析师就Cardano(ADA)发表演讲——ADA价格能反弹吗“趋势逆转”
2024-05-03 06:04:43
Block,股份有限公司第一季度业绩超出预期,股价盘后大幅上涨
2024-05-03 06:04:00
比特币(BTC)受到审查:加密专家质疑司法部对“比特币耶稣”的指控
2024-05-03 06:03:36
专家分析师预测Cardano(ADA)的潜在反弹——关注ADA价格的趋势逆转
2024-05-03 06:03:06
比特币价格最终形成局部底部:何时何地?
2024-05-03 06:00:39
Jito(Jito)凭借10亿美元的锁定资产引领SolanaDeFi协议
2024-05-03 06:00:03
下载币界网APP