Google 및 Meta와 같은 거대 기술 회사를 포함하여 시장에는 수십 개의 인공 지능 음악 도구가 있지만 Suno는 항상 군중 속에서 두각을 나타냈습니다.
작년 12월 스텔스 모드에서 출시된 이 제품은 Copilot 챗봇 내에서 액세스할 수 있게 만든 Microsoft와의 파트너십 덕분에 처음으로 헤드라인을 장식했습니다.
무엇이 만드는가 스노 Google의 MusicFX나 Meta의 AudioGen과 다른 점은 가사와 보컬도 생성한다는 점입니다. Suno의 공동 창립자인 Keenan Freyberg는 Jugo Mobile에 이렇게 말했습니다. 이것은 의도적인 선택이었고 모델 훈련을 훨씬 더 복잡하게 만들었습니다.
“우리는 누구나 즐겁게 음악을 만들 수 있도록 하고 싶습니다. 보컬은 그 재미의 큰 부분입니다.”라고 그는 말했고, 현재 더욱 널리 보급된 버전 3은 라디오 수준의 사운드를 믹스에 추가했습니다.
WOW 순간 만들기
Suno AI를 사용하여 처음으로 트랙을 만들었을 때 전체 노래가 얼마나 잘 생성되는지 보고 충격을 받았습니다.
완벽하지는 않습니다. 표현에 여전히 문제가 있고 프롬프트의 장르를 항상 정확하게 따르지는 않지만 제가 직접 할 수 있는 것보다 훨씬 낫습니다.
나는 기타, 드럼, 피아노를 연주하고 Garage Band에도 손을 대었지만 작곡가나 작곡가 측면에서 음악가는 아닙니다.
그러나 나는 가사 쓰기를 좋아하며 이를 위한 한 가지 잠재적인 용도는 작사가가 나중에 녹음하기 위해 상상에서 노래의 “대략적인 부분”을 얻는 방법입니다.
우리는 누구나 즐겁게 음악을 만들 수 있도록 하고 싶은데 보컬은 그 재미의 큰 부분을 차지합니다.
키난 프레이버그, 수노
Freyberg는 “우리는 음악을 더 좋게, 더 빠르게, 더 저렴하게 만들려고 노력하는 것이 아닙니다. “더 나은 것”이 무엇을 의미하든 간에 말입니다.”라고 말했습니다.
“우리는 항상 음악을 경험하고 참여할 수 있는 완전히 새로운 방법, 즉 AI를 통해 고유하게 할 수 있는 작업을 탐색하려고 노력하고 있습니다.”라고 그는 덧붙였습니다.
또한 전용 도구 지원도 추가했습니다. 나는 이것을 사용하여 Pika Labs를 사용하여 만든 댄서의 비디오에 대한 잊혀지지 않는 피아노 왈츠를 만들었습니다. 프롬프트를 완벽하게 포착했습니다.
Suno는 어떻게 작동하나요?
Suno AI에는 두 가지 주요 모드가 있습니다. 악기로 만들 수 있는 옵션이 있는 기본적인 전통적인 AI 스타일 텍스트 프롬프트와 자신의 가사를 사용하고 장르를 설정하고 제목을 지정할 수 있는 사용자 정의 모드입니다.
“Suno는 노래를 처음부터 끝까지 생성합니다. 보컬, 악기 등 각 노래가 한꺼번에 생성됩니다.”라고 Freyberg는 설명했습니다.
“이것은 기술적인 관점에서 볼 때 더 어려울 수 있지만 보컬, 악기 등을 별도로 생성한 다음 함께 부수는 일종의 역방향 스템 분리 접근 방식보다 더 높은 품질의 음악을 생성한다는 것을 발견했습니다.”
본질적으로 모든 것을 생성한 다음 읽을 가사와 노래를 설명하는 그림을 제공하는 것을 포함하여 들을 수 있는 완전한 트랙을 제공합니다.
Suno의 다음 단계는 무엇입니까?
그렇다고 그들이 일을 강화할 생각이 없다는 의미는 아닙니다. 버전 3은 이미 버전 1의 경우보다 더 자연스러운 사운드와 덜 자동 조정 스타일의 보컬을 포함하여 제작된 곡의 품질에 있어서 단계적인 변화입니다.
Freyberg는 “우리는 이제 세밀한 제어가 흥미로워지는 지점에 도달하고 있습니다”라고 Freyberg는 말했습니다. 앞으로는 “좋아하는 노래의 부분을 잠그고” 재생성하는 등의 새로운 기능이 있을 것입니다. 예상대로 작동하지 않는 부분.
“저는 이러한 컨트롤을 통해 사람들이 밈부터 걸작까지의 스펙트럼을 따라 더 많은 지점에서 음악에 참여할 수 있게 될 것이라고 생각합니다. 이는 정말 기대됩니다.”라고 그는 말했습니다. 창의적인 프로세스에 대해 해당 수준의 제어를 추가하면 잠재적으로 사용자가 해당 프로세스를 복사할 수 있게 됩니다.
Suno에서는 어떤 장르가 가장 잘 작동하나요?
Freyberg에 따르면 이는 기본적으로 “상상에 맡기는” 경우입니다. 당신이 그것을 생각할 수 있다면 그것을 만들 수 있습니다. 이를 테스트하기 위해 클로드 3에게 50가지 장르와 50가지 단선 스토리 아이디어를 제안해 달라고 요청했습니다. 그런 다음 나는 파이썬 스크립트 해당 100개 항목에서 무작위 프롬프트를 생성합니다.
첫 번째 제안은 감정 표현이 불법인 사회에 대한 뉴에이지 탱고 트랙이었습니다. 그것은 “법화된 감정, 숨겨진 욕망, 그러나 표면 아래에는 우리의 영혼이 드러난다”와 같은 가사를 제공했습니다. 음악은 무엇보다 탱고에 가까웠지만 정말 훌륭하게 들렸습니다.
“저희 아버지는 취미로 음악 민족지학자이십니다. 나는 믿을 수 없을 정도로 다양한 CD 컬렉션을 갖춘 집에서 자라는 행운을 누렸기 때문에 내 취향은 여기저기서 맴돌았습니다.”라고 Freyberg는 말했습니다.
“저는 장르 x 장르, 장르 x 언어 교차가 많다는 사실에 놀랐습니다. Suno를 통해 고유하게 탐색할 수 있는 스타일입니다. 트랩 시타르… 우르두 재즈웨이브… 차이니즈 블루그래스… 놀랍도록 잘 어울리는 이상한 동료들. 흔한 용의자를 탐색하는 것도 재미있지만, 미지의 영역을 탐색하는 것은 전혀 다른 경험입니다.”
Suno에서 가사와 음악 조정
다른 AI 도구와 마찬가지로 Suno는 유명한 아티스트를 모방한 노래나 의심스러운 가사가 있는 노래를 만들고 싶어하는 사람들을 포함하여 오용될 가능성이 있습니다.
이 도구는 다른 아티스트의 노래에 대한 가사가 포함된 프롬프트를 차단하고 ‘스타일로’ 트랙을 요청하도록 지정하는 프롬프트를 차단합니다. [artist]”. Freyberg가 나에게 말했듯이 “우리는 더 나은 가짜 드레이크를 만들기 위해 여기에 있는 것이 아닙니다.”
“저희는 저작권 조정에 있어서 다소 절대주의적이지만, 전통적인 콘텐츠 조정은 어떤 면에서는 더 어렵습니다.”라고 그는 말했습니다.
유해한 가사나 위험한 콘텐츠를 찾기 위해 제3자 콘텐츠 조정을 사용하지만 이는 해결하기 쉬운 문제가 아닙니다. Freyberg는 “우리는 보다 미묘한 접근 방식을 취할 수 있는 옵션을 적극적으로 탐색하고 있습니다”라고 말했습니다.
“21세기를 절제해서 표현하자면, 콘텐츠 조정은 어렵습니다. 이는 시가총액 1조 달러 규모의 기업들이 일상적으로 겪는 도전이며, 우리는 12명으로 구성된 소규모 팀으로서 최선을 다해 나아가려고 노력하고 있습니다.”
v3는 어떻게 비교되나요?

버전 3의 속도를 높이기 위해 Slack의 동료들에게 장르와 주제를 무작위로 혼합해 제안해 달라고 요청했습니다.
우리는 우주 트럭부터 컨트리 웨스턴 블루스, 냉장고를 열어 두는 것에 대한 이모 폴카에 이르기까지 모든 것을 갖추고 있었습니다. 매우 펑크처럼 들렸습니다.
또한 클립에서 계속해서 약 4분 분량의 전체 트랙을 생성하는 기능을 테스트했는데, 이로 인해 내 가사 순서가 놀라울 정도로 변경되었지만 음악을 깨기보다는 음악에 맞추는 것이 더 좋았습니다.
버전 3의 음질은 눈에 띄게 개선되었으며 프롬프트를 더 느슨하게 따르고 일부 보컬(특히 컨트리 트랙)은 여전히 인위적으로 들리지만 버전 2에 비해 크게 개선되었습니다.
- Microsoft Copilot AI를 사용하면 이제 자신만의 음악을 만들 수 있습니다.
- AI를 이용해 러브송과 뮤직비디오를 만들었어요
- 피아노가 필요하신 분! 이제 Adobe를 통해 AI로 음악을 만들 수 있습니다