Meta의 Musicgen 사용 후기

0
Meta MusicGen Logo

최근에 GitHub에서 제공하는 코드를 통하여, 생성형 AI 도구인  Meta의 MusicGen을 이용해 음악파일을 생성해봤습니다.  위의 미디어는 각각 MusicGen의 Large, Small, Medium 모델을 이용해 생성한 결과물입니다.

 

프롬프트 및 설정

위 결과물을 생성하기 위해 적용했던 프롬프트는 “Create a lo-fi, calm piece of music suitable for studying. It should be slow and quiet, ideally incorporating the sound of rain.” 였습니다. (= 공부하기 좋은 로파이, 차분한 음악을 만들어 달라. 느리고 조용하며, 되도록이면 비 소리가 들어가 있었으면 한다.)

 

결과 및 한계

Musicgen은 직접 설치하고  사용하는 등의 새로운 경험을 주긴 했지만 다소 아쉬운점이 많았습니다.

  • 지속 시간 제약: MusicGen은 음악 길이를 10초 단위로만 조정할 수 있습니다.
  • 시간 제한: 지원하는 최대 음악 길이는 2분입니다. 헌데 진정한 문제는, 2분내에 음악이 깔끔하게 완료되는게 아니라, 2분이 되는 순간 진행되던 음악이 갑자기 뚝 끊깁니다.
  • 음질: 오디오 품질이 다소 낮게 느껴집니다.

 

성능 및 실용성

혹시 내가 사용을 잘못한건 아닐까 싶어 다양한 테스트를 더 해보고, 직접 코드를 수정해보기도 할까 싶었지만, 이 또한 아래와 같은 문제가 있었습니다.

  • 매우 느린 생성 속도: Google Colab에서 T4 GPU로 2분짜리 트랙을 생성하는 데 대략 10분이 걸렸습니다. 이 부분은 어차피 개선이 불가능할 것 같기도하고, 다른 부분을 개선해보기 위한 테스트 시간 또한 매우 오래 잡아먹게 될 것 입니다.
  • 비용 문제: 오픈 소스 도구라 비용을 절약할 수 있을줄 알았지만, 긴 음원 생성 시간으로 인해 결국 더 높은 컴퓨팅 사용 요금이 발생하게 됩니다.

따라서 적극적으로 후속 테스트를 더 진행할 의미를 잃어버리고 말았습니다.

 

결론

이러한 문제들을 감안할 때 MusicGen은 더 개선된 차기 버전 업데이트를 기다리는 것이 최선이라는 생각이 들었습니다. 현재 버전도 뭔가 결과물을 만들어내주긴 하지만, 지속적으로 사용하기는 아쉬움이 많았습니다.

Leave a Reply

Your email address will not be published. Required fields are marked *