Es ist eine gute Sache, wenn ein von Künstlicher Intelligenz gesteuerter Roboter minimal-invasiv, also ohne größere Verletzungen und wesentlich genauer als ein Mensch, diagnostische oder therapeutische Operationen ausführen kann.
Auch ist es schön, wenn man sich in kalter Nacht an einem Lagerfeuer wärmt statt zu (er)frieren. Wird die gleiche chemische Reaktion jedoch benutzt, um ein Asylantenheim samt der sich darin befindenden Menschen anzuzünden, ist es das, jedenfalls in meinem Weltbild, nicht.
Genauso wenig erfreut es mein Herz, dass die münchner Firma Helsing, die KI-gestützte Waffensysteme und (unter anderem) Kamikaze-Drohnen herstellt, gerade zum wertvollsten deutschen Startup aller Zeiten avanciert ist und ausgerechnet Spotify-CEO Daniel Ek sich dort als führender Investor mit hohen dreistelligen Millionenbeträgen eingekauft hat.
Das rückt die 1000-Streams-pro-Jahr-Schwelle, ab der sich ein Song bei Spotify überhaupt erst für eine Auszahlung von dann sage und schreibe 0,003 Cent pro Stream qualifiziert, und wegen der ich damals umgehend mein Spotify-Abo gekündigt habe, für mich in ein noch abscheulicheres Licht.
Von Seiten der Firma Helsing wird alles dafür getan, dass ich die Herstellung ihrer Tötungsmaschinen für einen Dienst an der Menschheit halte.
Beim ersten Satz, den ich auf ihrer Homepage geradezu aufgedrängt bekomme, hat man dem Wort “Schutz” sogar ein altmodisches “E” angehängt, so dass die vermeintliche Helsing-Mission maximales Gewicht ausstrahlt.
Sie soll staatstragend und historisch relevant daher kommen.
Vor meinem geistigen Auge erscheint auch sofort und ungefragt Alt- und Erst-Kanzler Konrad Adenauer im Nachkriegs-Parlament und 4:3 TV-Format.
In schwarz-weiß und mit dem Bundesadler auf der Schulter spricht er in staatsmännischem Duktus unter Applaus aller Fraktionen zu uns die Worte:
„ZUM SCHUTZE UNSERER DEMOKRATIEN.”
So steht es Anfang September 2025, wo ich diesen Artikel schreibe, tatsächlich auf der Helsing-Homepage. Als Claim. In Großbuchstaben, und also über allem.
In Untermenüs gibt es für Suchende dann noch verdächtig ausführliches, dabei maximal unkonkretes und schwammiges Ethik-Geschwafel.
Wahrscheinlich von der KI generiert…
Aber es hilft alles nichts: Euphemistische Verheißungen wie “Landkampf – KI-beschleunigt” oder “Durch den Einsatz von KI ermöglicht Altra eine skalierte Zielerfassung und koordinierte Präzisionseffekte” gruseln mich.
Suggerieren sie doch, dass es möglich sei, ohne Kollateralschäden von Ramstein aus einem Taliban in Kabul den Salafisten-Bart zu stutzen.
Da komme ich ins Grübeln und denke: Könnte es nicht doch sein, dass das Geschäftsmodell von Helsing und Konsorten in letzter Konsequenz einfach auf schnödem Töten beruht?
Natürlich werden, gemäß der Mission, ausschließlich Nicht-Demokraten und die auch ausnahmslos zur Verteidigung zur Strecke gebracht.
Puh, dann scheint es sich um ethisch unbedenkliches, “gutes” Töten zu handeln, na, so ein Glück! Wer jetzt noch Bedenken hat, dem schleudere man ein entschiedenes „PUTIN!“ entgegen.
Aber, ach, schon lese ich im Internet bei InvestmentWeek:
Brisant: Helsing beschäftigt sich nicht nur mit dem Erkennen von Bedrohungen, sondern auch mit deren automatisierter Ausschaltung – ein ethisches Minenfeld, das Experten und NGOs gleichermaßen alarmiert.
Und mich gleich noch dazu.
Denn „automatisierte Ausschaltung“ meint nichts anderes als autonomes maschinelles Töten. Die KI erledigt alles und Alle, ohne dass sich ein Mensch die Finger schmutzig machen und sein Gewissen übermäßig belasten muss.
Allen Aktionärinnen und Aktionären, ganz besonders Daniel Ek, viel Spaß mit den Kursgewinnen und schönen Gruß an die Kinder…
Verantwortung, irgendjemand?
Mit anderen Worten: Ich könnte kotzen.
Tu ich aber nicht. Erst noch ein paar Gedanken zum Thema KI und Musik.
Das macht vielen meiner Kolleginnen und Kollegen Angst. Und tatsächlich dürfen wir uns wohl abermals auf den Verlust einiger potentieller Einnahmequellen einstellen.
Ich denke dabei etwa an die Komposition und Produktion von Werbe-Jingles, Klingeltönen, Musik für Daily Soaps, GEMA-freier Musik für Musikbibliotheken, Supermärkte, Fahrstühle und andere Gebrauchsmusik; später vielleicht auch Theatermusik, Fernsehserien und Kinofilme.
Es könnte gut sein, dass man in diesen Bereichen bald nur noch jemanden braucht, der genaue und das gewünschte Ergebnis präzise beschreibende Prompts generiert.
Das ist zu beklagen, sicher.
Andererseits: The times, they are a-changing (Binsenweisheit courtesy of Bob Dylan).
Daher ist es normal, dass sich im Laufe der Jahre Berufsbilder ändern oder Berufe ganz verschwinden.
Als Postkutscher, mittelalterlicher Kettenschmied, Wollkämmer, Siebmacher, Leinweber, Pfannen- und Sensenschmied, Scherenschleifer, Flößer, Schweinehirt, Laternenanzünder, Pulvermacher, Bremser bei der Eisenbahn, Lumpensammler, Folterknecht oder Telefonistin (und das ist nur eine winzige Auswahl) war es ab einem gewissen Zeitpunkt zunächst immer schwieriger, schließlich unmöglich mit seinem Fachwissen Geld zu verdienen.
Sie alle – besonders die Folterknechte, nehme ich an – dürften daran zu knabbern gehabt haben.
Der Lauf der Welt hat sie überfüssig gemacht.
(Wobei böse Zungen behaupten, der Beruf des Folterknechts hätte in einem winzigen Biotop mitten in Bayern mit dem Decknamen “Raum 7” im Gebäude der BFS für Musik München, wo ich Harmonielehre unterrichte, überlebt…)
Ich bin Jahrgang 1963. Auch ich habe schon Berufe verschwinden oder sich radikal verändern sehen:
Schriftsetzer und Siebdrucker durften sich in Richtung Desktop Publishing umorientieren.
Ich vermisse die Tankwarte meiner Kindheit, die das Auto der Kunden nicht nur eigenhändig betankt, sondern stets, als zusätzliche Serviceleistung, die Frontscheibe geputzt haben (die es damals, als es noch Insekten gab, auch immer dringend nötig hatte).
Richtiggehend leid tun mir alle arbeitslosen Rohrpostmechaniker, die ihre Ersparnisse zusammengekratzt haben, um eine Videothek zu eröffnen…
Ein “Copyist” war jemand, der die Einzelstimmen aus einer Partitur extrahierte und kunstvoll, unter Kenntnis einer Fülle von Regeln und Techniken, die alle einer optimalen Vom-Blatt-Lesbarkeit dienten, in schönster Handschrift aufbereitete. Er oder sie war plötzlich mit Computer-Notensatz-Programmen konfrontiert und musste sich wohl oder übel darauf einlassen.
Bei den ausübenden Musikern traf es als erstes die Studiomusiker, und hier vor allem die Schlagzeuger.
Sie erlebten einen herben Einbruch ihrer Buchungen, nachdem Anfang der 1980er Jahre die MIDI-Schnittstelle erfunden wurde, das Musical Instruments Digital Interface.
Es war das Jahrzehnt der Synth-Bässe, Synth-Hornsections und digitalen Keyboard-Sounds (Hauch, Glitzer, Waber…). Vor allem aber war es das Jahrzehnt der Drum-Computer!
Pop-Alben konnten jetzt im Extremfall, der gar nicht mal so selten war, von nur einer einzigen Person arrangiert und komplett eingespielt werden.
Das hatte Mike Oldfield zwar schon (analog natürlich!) 1973 mit seinem Album Tubular Bells auf ikonische Weise vorgemacht, aber ab den 1980er Jahren brauchte man dafür keine Lagerhalle an Instrumenten mehr zu bedienen.
Jeder, der wollte (und ein bisschen Geld gespart hatte), konnte das auch – vielleicht nicht ganz so ikonisch wie Mike Oldfield, aber immerhin.
Denn MIDI machte es möglich, mehrere elektronische Klangerzeuger zu vernetzen und musikalische Passagen über ein Keyboard in “Sequenzer-Programme” (den Vorläufern moderner Digital Audio Workstations wie Logic oder Cubase) einzuspielen und dort zu arrangieren.
Bei sogenannten multitimbralen Synthesizern oder Sound-Modulen (= nur die Tonerzeugung ohne Klaviertasten), konnte man sogar mehrere Klänge (engl. Timbre = Klangfarbe) gleichzeitig ansteuern.
Für mich mit Anfang 20 war das damals der absolute Ober-Hammer und ein krasser Motivationsschub!
Gerade ertappe ich mich, wie ich beim Gedanken an diese Gründerjahre der digitalen Musikproduktion versonnen in meine Teetasse schmunzle, denn Technik, die einmal der heiße Scheiß war, hat in der Rückschau ja auch immer etwas Rührendes.
Mein erstes, multitimbrales Soundmodul war jedenfalls 1987 das damals unglaubliche Roland MT-32: Es war sensationeller Weise in der Lage, eine Auswahl aus acht (aus heutiger Sicht völlig indiskutablen) Sounds aus seiner Klangbibliothek gleichzeitig wiederzugeben, plus Drums!
Plötzlich war ich die Band – the sky was the limit!
Mit dem MT-32 sowie seinen Kollegen und Nachfolgern, die im Laufe der Jahre bei mir einzogen, habe ich auf Teufel komm raus komponiert, arrangiert, experimentiert und viel über die verschiedenen Spielweisen sowie das Zusammenspiel von Instrumenten gelernt.
Learning by doing (and sometimes by failing miserably). Eine grundlegende und spannende Zeit.
Ich habe das Schatz-Kästchen immer noch im Schrank im Keller. Es bleibt bei mir bis zum Ende. Seinem oder meinem. Selbst im Seniorenheim wird sich ein Plätzchen dafür finden lassen…
Auch später habe ich mich am Puls der Zeit immer sehr wohl gefühlt. Doch vor lauter Staunen und Machen, ist mir nicht aufgefallen, dass mit der Digitalisierung unbemerkt ein schleichender Prozess begonnen hatte, der konsequent und notwendigerweise zwar zur Demokratisierung der Musikproduktion, aber als deren Kehrseite auch zur Entwertung musikalischer Arbeit geführt hat.
Sowohl ganz konkret in monetärer Hinsicht als auch im allgemeinen Bewusstsein.
Dass wir in letzter Konsequenz aber (in bestimmten Stilistiken) auf die Möglichkeit einer kompletten “Entmenschlichung” der Musikproduktion zusteuern, hätte ich mir niemals träumen lassen!
Dabei ist es eine folgerichtige Entwicklung:
Musste man einen Drumcomputer ursprünglich noch mehr oder weniger fachkundig programmieren, gab es schon bald Drum-Loops, die einem diese Arbeit abnahmen.
Sampling kam auf und mit ihm Urheberrechts-Verletzungen, -Klagen und -Prozesse.
Die Sounds der Klangbibliotheken wurden immer authentischer und Samples von Instrumenten näherten sich dank der schnell steigenden Speicherkapazität von Mikrochips in Riesenschritten dem Originalklang.
Schon bald danach waren vorgefertigte Licks oder Phrasen erhältlich, die, jeweils in verschiedenen Tonarten eingespielt, auf “Sampling CDs” erschienen.
Dann wurden die Phrasen zu ganzen Passagen.
Ich erinnere mich, dass mein Ego und ich das erste Mal irritiert waren, als plötzlich komplette Akkordverbindungen, also etwas Kompositorisches (!), von Keyboard-Ikonen wie z. B. George Duke stiltypisch und genial eingespielt, verkauft wurden.
Meine Heros möchte ich anhimmeln und bewundern; sie sollen mich inspirieren, aber ich möchte nicht mit ihnen konkurrieren müssen ;))!
Die Faszination wich daher relativ schnell so etwas wie: “Böh, wenn jetzt jeder so einen geilen Keyboard-Part für kleines Geld in seinem Song haben kann, ohne ihn selbst zu erfinden und einzuspielen oder jemanden darum zu bitten (zum Beispiel mich), wo soll das hinführen?”
Nun, heute wissen wir es.
Denn es ging noch weiter: Seit nicht allzu langer Zeit ist das Arrangieren ganzer Song-Abläufe mit Intro, Vers, Pre-Chorus, Bridge etc. ein Kinderspiel.
Die Herstellung eines kompletten Drum-Tracks inklusive Feintuning wie “Mehr Tamburin und Hand Claps im Chorus”, “Weniger Drum-Fills während des Intros”, aber auch “Halftime Bass auf einem Fender Jazzbass im Vers” oder “Spiele eine Pop-Balladen Klavierbegleitung zu folgenden Akkorden” erledigt man mit wenigen Mausklicks und ohne eine einzige Note zu spielen oder einzugeben.
Ja, ja, schlimm, schlimm… oder warte, doch nicht?
So macht es doch im Grunde jeder Musik-Produzent: Er formt einen Song nach seiner Vision, indem er im Studio Musiker und den Toningenieur coacht und aus Angeboten auswählt.
Eben, und genau da ist der Unterschied: Während einer Studio-Session kommuniziert man mit anderen Menschen und es findet ein kreativer Austausch im Team statt. Man ist Teil eines sozialen Gefüges und hockt nicht allein vor einem Bildschirm und trifft einsame Entscheidungen.
War Musik nicht irgendwann mal Kommunikation?
Noch eine Stufe abstrakter wird es, wenn man “arrangiert”, indem man auf einer schachbrett-artigen Matrix vorgefertigte, schon ab Werk perfekt aufeinander abgestimmte Groove- und Sound-“Kacheln” aktiviert oder stumm schaltet. Die kreative Leistung erschöpft sich hierbei darin, eine Dramaturgie für diese An-/Aus-Vorgänge zu finden.
Auch mir macht es großen Spaß, damit herum zu spielen, keine Frage. Aber ein damit produzierter Track wäre in meiner Welt niemals mein Song. Da ist mir die Schöpfungshöhe zu gering. Etwas anderes wäre es, wenn ich den musikalischen Inhalt der “Kacheln” selbst erstellt hätte.
Nun ist der Bedroom Producer aber nicht nur der Feind aller Studiomusiker, sondern auch aller Studiobesitzer. Viele Tonstudios wurden unrentabel und mussten aufgeben. Auch Mastering-Ingenieure sehen sich inzwischen einer Fülle von Online-Portalen gegenüber, die vollautomatisiert klanglich sehr konkurrenzfähige Master zu Dumping-Preisen anbieten. Das ist nicht schön und ich wünschte, es wäre anders, aber siehe hierzu weiter oben unter “Laternenanzünder”, “Kettenschmied” oder “Videothek”.
Die gute Nachricht ist: Bei was und wie weit wir uns als Musikerinnen und Musiker von Technologie unterstützen, inspirieren und helfen lassen möchten, und ab wo der kreative Prozess zu korrumpiert und nicht mehr erfüllend ist, darf jeder für sich selbst entscheiden.
Allen dürfte aber klar sein, dass wir es (auch) in der Musikbranche mit einer Zeitenwende zu tun haben.
Das erste Mal in der Musikgeschichte sind wir in bestimmten Genres an einem Punkt, wo man zwar noch eine Klang-Vorstellung haben muss, aber außer der Eingabe eines möglichst klaren und präzisen Prompts keinerlei Fachkenntnis in irgend einem Teilbereich der Musikprodukion nötig ist, um Ergebnisse zu erzielen, die nicht mehr zu unterscheiden sind von jenen, die durch Expertise zustande gekommen sind.
Man könnte etwas provokant zusammenfassen:
Alle wissen, was sie wollen
Doch keiner mehr, wie man es macht
Oha, das sind ja schon zwei Zeilen aus einem Songtext zum Thema. Das wollen wir gleich mal in Chat GPT eingeben… ;))
Mach es gern und schick mir das Ergebnis :))
Die Songwriterin und KI-Expertin Jovanka von Wilsdorf sagt im Online-Portal der Zeit (auf zeit.de) etwas Schönes dazu:
Wenn ich Pizza bestelle und mir aussuche, ob da Mozzarella oder Sardellen draufliegen, macht mich das noch nicht zum Bäcker.
Klar ist es doof und tut weh, wenn jedes dahergelaufene, unmusikalische Sackgesicht sich mühelos Vergleichbares, wenn nicht sogar Besseres, “zusammenprompten” kann, als wir es mit all unserer Begeisterung und nach lebenslangem Commitment jemals erschaffen könnten.
Wenn das Sackgesicht dann auch noch behauptet, er oder sie hätte diese Musik “gemacht” oder jenen Songtext “geschrieben”, sich also zum Urheber hochstilisiert, muss man einschreiten und ein paar Dinge klarstellen.
Denn jeder Wahrscheinlichkeits-Berechnung einer Künstlichen “Intelligenz” liegt die Arbeit von Fachleuten zugrunde.
Fachleute, die nicht selten Jahre, wenn nicht sogar Jahrzehnte ihres Lebens mit dem Erlernen und der Verfeinerung ihrer Fähigkeiten zugebracht haben.
Sie und niemand sonst sind die Urheber!
Ihre Leistung und Kreativität wird bei der Verwendung von KI allerdings in keiner Weise honoriert. Nicht durch Bezahlung, nicht einmal durch Erwähnung.
Die Menschen in den KI-Tech-Firmen benutzen somit wertvolle, schöpferische und nicht-schöpferische Arbeit ohne Gegenleistung.
Sie beuten Menschen aus!
Das muss aktiv gestoppt werden, von selber werden sie es nicht tun (denn es kann gut sein, dass sie am Ende alle selber Sackgesichter sind)!
Die KI-Technologie wird nicht wieder verschwinden, das anzustreben wäre illusorisch.
Sie schadlos und verantwortungsvoll zu nutzen, müssen wir lernen; sie zu regulieren, müssen wir uns trauen!
Das Schlusswort soll noch einmal Jovanka von Wilsdorf haben:
Musizieren ist dem Menschen ein Urbedürfnis. Eine Mutter singt für ihr Baby, ein Kind trommelt auf dem Tisch oder zupft am Eierschneider, weil da Töne rauskommen. Das Musizieren werden sich die Menschen nicht nehmen lassen. Warum auch?
Das hat etwas Tröstliches, nicht wahr?
Bernd Kirsch
Sep. 21, 2025
Versuch einer Dystopie
Nach einer gewissen Anpassungszeit, nachdem die letzten Instrumente und Stimme Beherrschenden ausgestorben sind, spaltet sich das Musikgeschehen in low level Aktivitäten wie singende Babymütter, topfschlagende Radaumacher, Eierschneider zupfende Kinder, summende Bienen sowie Lerchen und Nachtigallen auf der einen Seite und gigantische stromfressende KI-Blackboxen, die nach einer kurzen Prompting-Einführung jeden Laien jedes nur denkbare Musikstück erzeugen lassen, Stück für 1 €, auf der anderen Seite.
Volker Giesek
Sep. 21, 2025
Danke für dein Feedback, Bernd!
Das ist eine wahrhaft düstere Dystopoie, die du beschreibst.
Wobei: Dass jeder Laie, (noch) in bestimmten Genregrenzen, irritierend authentische Musik errechnen lassen kann, ist schon jetzt Realität! Neulich hat mir ein Schüler seinen gar nicht mal so üblen Smooth-Jazz-KI-Versuch gezeigt. Das Ergebnis klang mindestens durchschnittlich gut – und das reicht ja auch im analogen Leben oft schon für Viele und Vieles… ;))
Ich bin mir aber ziemlich sicher, dass das *Erleben des Musizierens* – passiv wie aktiv – eine enorme Wertsteigerung erfahren wird, je mehr durch Ki generierte Musik übernimmt.