MUSICGEN:简单可控的音乐生成
文章目录
- 摘要
- 1、简介
- 2、方法
- 2.1、音频词元化
- 2.2、码本交错模式(见图1)
- 2.3、模型调节
- 2.4、模型架构
- 3、实验设置
- 3.1、模型和超参数
- 3.2、数据集
- 3.3、评价
- 4、结果
- 4.1、与基线的比较
- 4.2、旋律评价
- 4.3、消融
- 5、相关工作
- 6、讨论
摘要
论文连接:https://arxiv.org/pdf/2306.05284v1.pdf
我们解决了条件音乐生成的任务。我们引入MUSICGEN,这是一个单一的语言模型(LM),它可以在几个压缩的离散音乐表示流(即token)上操作。与之前的工作不同,MUSICGEN由单级变压器LM和有效的Token交错模式组成,这消除了层叠多个
MUSICGEN:简单可控的音乐生成相关推荐
- 机器学习笔记 - 使用TensorFlow进行音乐生成
一.概述 这里我们将探索构建用于音乐生成的循环神经网络 (RNN).我们将训练一个模型来学习 [ABC记谱法] 中原始乐谱中的模式,然后使用该模型生成新音乐. 1.关于ABC记谱法 关于ABC记谱法的 ...
- 机器学习之语音生成音乐生成
简介 WaveNet利用神经网络系统对原始音频波形(Raw SoundWave)建模该网络.基于WaveNet生成的音频质量优于目前所有的文本转语音(Text-to-Speech,TTS)系统,将计算 ...
- 《Deep Learning Techniques for Music Generation – A Survey》深度学习用于音乐生成——书籍阅读笔记(一)Chapter 1
<Deep Learning Techniques for Music Generation – A Survey>深度学习用于音乐生成--书籍阅读笔记(一)Chapter 1 关于这本书 ...
- 【DL】第 7 章 :用于音乐生成的Transformers和 MuseGAN
除了视觉艺术和创意写作一样,音乐创作是我们认为人类独有的另一种核心创造力行为. 为了让机器创作出悦耳的音乐,它必须克服我们在上一章中看到的与文本相关的许多技术挑战.特别是,我们的模型必须能够学习并重新 ...
- 最简单的分形图像生成算法
本文将提供一段完整地生成一幅分形图像文件的C语言代码,并且极为简单.我相信这应该是最简单的分形图像生成算法.大部分的分形图像代码也都很短,但一有递归迭代就难以理解了.而这段代码则很好懂,并且其生成的图 ...
- animation基础练习源码_用vue简单写一个音乐播放组件「附源码」
作者:vipbic 转发链接:https://segmentfault.com/a/1190000022980992 前言 上次小编也分享一个关于Vue 开发过音乐播放对项目: 基于 electron ...
- python爬取网易云音乐生成王力宏歌曲词云
python爬取网易云音乐生成王力宏歌曲词云 # -*- coding:utf-8 -*- # 网易云音乐,通过歌手id生成词云 import requests import sys,re,os fr ...
- 四步快速配置一个简单高效的文本生成图像基准模型 T2I baseline
本文将介绍一个简单高效的文本生成图像基准模型,该基准模型是DF-GAN20版代码,清楚简单,实用性高,本基准模型代码在他的基础上经过少量简化和处理,虚拟环境也进行了打包,非常适合作为一个基线模型,然后 ...
- SOLIDWORKS如何简单高效地自动生成模型视图和标注
模型视图是零件或装配体的工程图视图,当我们设计完成后,需要下发到生产车间进行生产时,往往就需要有一份详细且直观的工程图来指导生产加工. 你在工作中是否会经常思考这些问题? 1.激活模型视图后,为什么要 ...
最新文章
- 计算机一级考模拟试题,计算机一级MSOffice考前模拟试题「附答案」
- hdu 5066 小球碰撞(物理题)
- 基于VUE的前端crypto-js aes加密与解密
- 委托到Lambda的进化: ()= {} 这个lambda表达式就是一个无参数的委托及具体方法的组合体。...
- Hadoop伪分布安装详解(一)
- C++面向对象编程之类的使用(基础案例学习)
- 如何给一家公司做定性研究?
- 无用小知识-递归的使用
- 133 MySQL视图、事务、索引(都很重要)
- Web前端JSP面试题
- 中国31省R&D经费支出、R&D投入强度数据(2000-2018年)
- python爬网易新闻_爬虫入门:如何用python爬取网易新闻?
- 读书笔记之《阿里传:这是阿里巴巴的世界》
- 前端学习--PS移动和选区工具
- 形而上学 “形而上者谓之道,形而下者谓之器”
- 百度地图标注公司那家好
- 爱加密Android APk 原理解析
- HTML+5.2+新特性,HTML 5中的新特性
- 2021年全球高级相变材料(PCM)收入大约1513.7百万美元,预计2028年达到3220.4百万美元
- 长坡难滚“雪球”,零跑汽车上市只是一个 “开端”
热门文章
- iOS 底层原理之 类的原理分析(上)
- Microsoft Edge打不开了怎么办
- win10无法连接wifi_WiFi无法连接?解决macOS Big Sur / Mojave / Catalina上的Wi-Fi问题
- live常见问题:如何降低Ableton Live Suite的CPU负载?
- 手机首次充电方法及关于锂电池充电的正确知识
- 写一个设备的分配与调度简单方案_第八章:I/O设备管理
- VoIP通话之DTMF信号开发指南
- js使用document获取class元素
- html js 循环提示框,纯js超酷消息提示框插件notice.js
- 手机误删的通话记录要怎么恢复