Musikzimmer Blog Post: Adam Neely: Suno, AI Music, and the Bad Future

Willkommen im Musikzimmer! Dies sind die empfohlenen Inhalte, Neuerscheinungen und Veranstaltungsankündigungen.

Adam Neely: Suno, AI Music, and the Bad Future

AI generierte Musik ist schlecht, so die These, die Neely hier gegen die Tech-Industrie vertritt, die uns generative Musikproduktion als Chance für eine Zukunft der Musik verspricht: sie soll uns engagieren, sie soll wie ein Computergame funktionieren. Der Gedanke scheint verführerisch.
Adam Neely machte eine Umfrage, freilich nicht repräsentativ. Die Fragen lauteten:

  1. Was ermöglichen dir generative KI-Tools wie Suno, was mit DAW oder traditionellen Musikinstrumenten nicht möglich ist?
  2. Hast du das Gefühl, deiner Musik eine eigene Stimme zu verleihen, wenn du sie mit Suno erstellst?
  3. Welche KI-Musiker haben dich beeinflusst und was inspiriert dich an ihnen?
Zeit sparen
Die häufigste Antwort auf die erste Frage lautet: «Ich gewinne Zeit.» Ein Resultat ist schneller da als mit herkömmlichen Workflows: Instrument lernen, einen Song schreiben, Instrumente und Gesang aufnehmen, arrangieren und abmischen.
Die andere Antwort lautet: Es ist leichter.
Beide Antworten sind Argumente aus dem Produktdesign. Es ist zweifellos ein Vorteil, wenn man ein Produkt schnell an neue Wünsche von Nutzer:innen anpassen kann. Wer seine Produktideen schneller auf den Markt zu bringen vermag, hat zweifellos einen Wettbewerbsvorteil. Aber funktioniert das so bei Musik? Wenn jemand Musik schneller produziert, produziert sie oder er dann mehr Musik – 100 Stücke statt 10? Oder gleich viel wie vorher in kürzerer Zeit, womit mehr Zeit bleibt, für den Workout oder den Hund gassi zu führen? [Und wie verhält es sich mit der Rezeption? Wenn ein Künstler mehr Werke produziert, kann das Publikum diesen Output dann besser wertschätzen? Oder verhält es sich gerade umgekehrt? Muchness vermag zeitweise zu beeindrucken (Prince, Aphex Twin). Doch Künstlerinnen, die sich rar machen (Kate Bush) können auch erstaunlich viel Wert generieren! Produktion macht nur in einer Menge Sinn, die das Publikum, das Künstlerinnen oder Künstler haben, verdauen kann.]
Suno wirbt mit Werten wie: «Fun», «Aesthetics» und «Impatience» (siehe Webseite). Neely zeigt im Video, dass «Impatience» keine Tugend ist. Gerechtigkeit, Weisheit, Mässigung und Mut sind die klassisch-griechischen Tugenden der Philosophie. Die Ungeduld arbeitet gerade gegen die Tugenden erklärt Dr. Mariana Noé von der University of Arizona. Sie steht vor allem der Mässigung entgegen, bei der es darum geht, Bedürfnisse aufschieben zu können. Die Technologiebranche will uns das Gegenteil weis machen und nährt damit die schlechteste Seite in uns.
Eine weitere Antwort auf Frage eins lautet: Ich kann Geld sparen. Musiklektionen kosten Geld, Instrumente, ein Studio, Software, ein professioneller Mixer. Allerdings gibt es Software, die gratis ist, auf Youtube findet man Musikkurse. So teuer war es vor Suno ohnehin nicht mehr, Musik zu produzieren.
Wenn Profis gefragt werden, welchen konkreten Mehrwert Suno für sie hat, sagen viele sinngemäss: «Ich habe jetzt so etwas wie einen musikalischen Assistenten oder Co-Produzenten an meiner Seite. Ich kann Ideen blitzschnell ausprobieren und hören, wie sie klingen – etwas, das vorher für mich kaum möglich war, weil ich weder in einer festen Band spiele noch regelmässig mit anderen Menschen zusammen produziere.» Gleichzeitig gibt es aber eine Gefahr: Die KI neigt dazu, einem immer zu schmeicheln und fast alles gut zu finden. Dr. Noé verweist in dem Zusammenhang auf Aristoteles (die «Nikomachische Ethik»): Ein großer Teil des Buches dreht sich eigentlich um Freundschaft. Und genau dort macht Aristoteles einen wichtigen Punkt: Schmeichler sind keine echten Freunde. Echte Freunde sagen dir nicht permanent, dass alles toll ist. Echte Freunde fordern dich heraus, sie widersprechen dir auch mal, sie helfen dir, besser zu werden.
Eine Stimme sein
Die meisten Benutzer von Suno haben nicht den Eindruck, dass sie etwas Eigenes, Einzigartiges erzeugen. Das kommt daher, dass KI nur bestehende Musik neu zusammenmischt.
Suno wurde mit der Musik trainiert, die im Internet zur Verfügung stand, was eine Copyright-Verletzung im ganz grossen Stil darstellt. Die Technologiefirmen behaupten indes, Training sei fair use. Neely sagt von sich, dass er kein Jurist sei und empfiehlt Miss Krystal.
Suno tut, was wir Menschen tun, nur schneller, effizienter (siehe Frage 1). Es nimmt Werke der Vergangenheit, erkennt Muster darin und remixt es zu etwas Neuem. Der Diebstahl von geistigem Eigentum ist weit über dem, was ein einzelner Mensch im Leben tun könnte. Die Erfindung eines Menschen, fordert zuweilen den Status quo heraus, was KI vermutlich nicht könne. Wäre Jazz nicht bereits von Menschen erfunden worden, Suno könnte ihn niemals erfinden!
Me, me, me
Niemand scheint Vorbilder zu haben, die oder der mit Suno Musik generiert. Es hört auch niemand Tracks, die von anderen Nutzer:innen generiert worden sind. «When everyone can make their own music to his own taste, there are no reasons to listen to other people's music other than to get ideas and prompts for our own music.»
AI schwächt uns. Wenn wir Entscheidungen, sprachliche oder musikalische Äusserungen an eine Maschine delegieren, dann werden wir dümmer, inkompetenter. Man nennt das english «deskilling». Abbau von Skills. [Als die Musikindustrie von Napster überrascht wurde, hatte sie die Distribution längst ausgelagert. Das war der Grund, weshalb die Branche verletzt werden konnte.]
Mikey Shulman, Evangelist von Suno, bringt das, was uns die Plattform bietet, ähnlich auf den Punkt wie der Produzent Rick Rubin. Rubin hat einmal gesagt: «Ich habe keine technischen Fähigkeiten und ich weiss nichts über Musik. Aber ich kann Geschmacksurteile fällen.» Genau das sieht Shulman als den grossen Gewinn durch KI: Plötzlich kann jeder ohne musikalische Ausbildung oder technische Skills zum «Arbiter of Taste» werden, zum Entscheider über den guten Geschmack. Du brauchst kein Instrument spielen, kein Mixing beherrschen, keine Theorie kennen – du sagst einfach: «Das gefällt mir» oder «Das klingt falsch», und die KI macht den Rest. [Der Typ Mensch, der von Musik eigentlich keine Ahnung hat, aber einen sicheren, starken Geschmack besitzt, ist ein ganz bestimmter Musikfan-Typ. Man findet ihn auch unter Musikjournalisten und – wie das Beispiel Rubins zeigt – als Produzenten. Man könnte ihn als «stilistischen Tastemaker» oder «stilistischen Trendsetter» bezeichnen. Zuweilen beeinflussen solche stilistischen Trendsetter im Pop die Meinung und den Geschmack der Konsument:innen und damit sogar die Entwicklung der Musik. Es sind zum Beispiel die Leute, die Musik aufgrund von stilistischen Nebensächlichkeiten beurteilen – Nebensächlichkeiten aus denen sie freilich meist eine Religion machen. Sie sagen zum Beispiel: «Punk ist kurz und hat keine ausufernden Gitarrensolos.» Sie schreiben diese Solos dem verhassten Progrock zu. Wie auch immer sich Geschmack und Kenntnis zueinander verhalten: Entscheidend ist am Ende vielleicht gar nicht mal welches von beiden gegen das andere siegt («Taste over Skills» oder umgekehrt), sondern dass jemand es schafft, sich ein Publikum und damit öffentliche Aufmerksamkeit zu erarbeiten – ob durch überragenden Geschmack, durch musikalisches Können oder durch beides.]
Arthur C. Clarke
Man kennt Arthur C. Clarke als Autor von «2001: A Space Odyssey». Clark schrieb auch spekulative Sci-Fi Kurzgeschichten unter dem Titel «Tales from the White Hart». Darin gibt es die Kurzgeschichte «The Ultimate Melody», in der ein Forscher nach einer Melodie sucht, die perfekt zu den Schwingungen des menschlichen Gehirns passen. Dazu baut er eine Maschine, die er mit hunderten von Stücken der klassischen und populären Musik speist. Clarke sah hier die generative Musik-KI voraus! [siehe dazu auch den Zürcher Literaturwissenschaftler Philipp Theisohn im Buch «Einführung in die ausserirdische Literatur. Lesen und Schreiben im All» (Berlin, 2022): Bei der Entdeckung des Weltraums ging die spekulative Sci-Fi-Literatur den Entdeckungen voraus. Kepler beschrieb in «Somnium» eine Reise zum Mond, lange bevor Teleskope Details zeigten. Er nutzte die Fiktion, um die kopernikanische Wende (die Erde bewegt sich um die Sonne) anschaulich zu machen. Er musste erst träumen, um astronomisch beweisen zu können. Bei den Erfindungen der Techbranche scheint es nicht anders zu sein. Die Literatur hat das Feld mental vorbereitet, in dem Suno et al. entstehen konnte.]
Technologischer Determinismus
Technologie wird oft und sowieso in Kreisen der Wagniskapitalisten als eine «force of nature» präsentiert, die nicht kontrolliert und nicht gestoppt werden kann und erst recht nicht reguliert werden darf. Das ist technologischer Determinismus auf gesellschaftlicher Ebene. Doch tatsächlich stecken hinter jeder neuen Technologie Wirtschaftsinteressen. [Historisch betrachtet agieren Recht und Politik gegenüber technologischen Innovationen meist reaktiv. In der initialen Phase der Regulierungslücke (in diesem teilweise «rechtsfreien Raum») etablieren neue Technologien ökonomische Fakten, die häufig zu oligopolistischen Marktstrukturen führen. Während der ungehemmte Wettbewerb in der Frühphase zur Konsolidierung zwingt, verbleiben nach dem Verdrängungsprozess oft nur wenige dominante Akteure. Erst ex post greift der Staat mit wettbewerbsrechtlichen Instrumenten ein, wobei die Massnahmen von strenger Regulierung bis hin zur funktionalen Entflechtung reichen können.]
Guter und nützlicher Gebrauch von Suno
Als nützlich präsentiert Neely drei Gebrauchsarten von Suno et al.:
– Musiktherapie, z.B. bei Demenzpatient:innen, wo man biografische Informationen zu Liedern macht, wozu sie tanzen und mitsingen können.
– Erinnerung: Musik als Informationsmaschine: Griots, Rhapsoden, Troubadouren, Rapper haben Musik auf diese Weise gebraucht. Suno kann dabei helfen, Ohrwürmer zu schaffen, um Information zu speichern. [Das hesisst vor allem, es wird Werbung damit gemacht, Jingles, Signete, ...]
– Demokratisierung von Musik: Es geht bei genrativen Plattformen nicht so sehr darum, ein günstiges Mittel zum Musikmachen zur Verfügung zu stellen, als darum den User:innen die «emotionale Erlaubnis», Musik zu machen, zu geben. Die monetäre Schwelle fürs Musikmachen ist gar nicht so gross, wie Neely vorher schon festgestellt hat. Ausserdem gehört die generierte Musik Suno. Falls die Plattform eingeht, verlieren die Benutzer:innen die Musik, die sie generiert haben, es sei denn, sie haben sie vorher heruntergeladen.
Die Techbranche ist gut darin, gesellschaftliche Probleme festzustellen, wenn sie die Lösung für dieses Problem verkaufen kann und sie verkauft es auch, wenn es eigentlich bessere Lösungen dafür gäbe. Mikey Shulman spricht von den gesellschaftlichen Problemen auch nicht mit den Betroffenen oder den bestehenden zuständigen Institutionen, sondern mit Investoren. Seine Logik ist, Kapital für seine Firma zu erhalten, Investoren zu finden, statt die Welt besser zu machen. [An der Stelle lässt sich vielleicht sagen, das Video von Neely ist wie oft bei ihm sehr gut recherchiert und befasst sich breiter und tiefer mit dem Gegenstand als die meisten Youtube Freatures. Ich frage mich indes, ob er sich mit Mikey Shulman nicht einen leichten Gegner ausgesucht hat. Ein Evangelist eines neuen Produktes hat nicht die Aufgabe, die Welt zu verbessern.]
Futurismus und Techno-Optimismus
Marc Andreessen steht mit seinem «Techno-Optimist Manifesto» in der Traditionslinie des italienischen Futurismus. Vom Futurismus führte eine direkte Linie weiter zum Faschismus. Die heutigen Techno-Optimisten stellen sich in eine Reihe mit Donald Trump. Sie tun alles, um die technologische Zukunft aus ihrer Vision schneller Wirklichkeit werden zu lassen. Sie schaffen Gegenöffentlichkeiten, indem sie Plattformen bauen (X, Truth Social, Oboe etc.). Das Bauen von solchen Plattformen soll an legislativen, demokratischen und politischen Prozessen vorbei führen.
Drei Wege für Musiker
Die einen folgen dem Druck nach Adaptation. AI wird adaptiert wie früher MIDI oder DAWs. Man will nicht stehen bleiben und arbeitet damit. Die andern arbeiten nicht damit. Weit interessanter ist ein dritter Weg: Die Werte der Tech-Overlords zu verdrehen: Statt «Music, Impatience, Aesthetic, Fun» schlägt Neely andere Werte vor: Dienst an einer Gemeinschaft, Geduld, Handwerk und Schönheit.

Link zum Inhalt: [M]