One-shot Text-aligned Virtual Instrument Generation Utilizing Diffusion Transformer

Published in Audio Imagination: NeurIPS 2024 Workshop on AI-Driven Speech, Music, and Sound Generation, 2024

Qihui Yang, Jiahe Lei, Qiuqiang Kong