Über der Einsatz von KI zur Musikkomposition: Der nächste Tsch(AI)kowski?

Autor: Hendrik Kuck

 


Komponieren mithilfe von Künstlicher Intelligenz? Zukunftsmusik oder bereits Alltag in der Musikbranche? Wie funktioniert so etwas? Und wer profitiert davon? Mögliche Antworten liefert der folgende Artikel zum Thema “Künstliche Intelligenz in der Musikkomposition”.

Inhaltsverzeichnis

KI in der heutigen Musikproduktion

Künstliche Intelligenz nimmt in unserer Gesellschaft eine immer zentralere Rolle ein. Sie ist aus Wirtschaft, Medien und Technik nicht mehr wegzudenken und wird in Deutschland u.a. von der Bundesregierung gefördert.1 Auch die Musikbranche wird nachhaltig von KI geprägt und Künstliche Intelligenz befindet sich besonders in der Musikkomposition auf dem Vormarsch.2 Besonders die Komposition von Hintergrundmusik für Social Media, Werbung und Gaming wird in Zukunft von ihr dominiert.3 Aber wie funktioniert das Komponieren von Musik mithilfe von KI eigentlich? Wer arbeitet mit ihr? Steht sie in einem ethischen Konflikt mit menschlichen Musikern und Komponisten und kann sie überhaupt wirkliche Kunst erschaffen? Diesen Fragen widmet sich der folgende Artikel.

Wie funktioniert Komponieren per KI?

Damit eine KI Musik komponieren kann, muss sie zunächst für diesen Einsatzzweck trainiert werden. Sogenannte “Neuronale Netzwerke” lernen anhand großer Datenmengen (Big Data) die Struktur und Elemente vorhandener Musik. Durch ständige Analyse wird sie immer besser darin, Muster im Songaufbau zu erkennen und ist zu beachtlichen analytischen Leistungen in der Lage.4 Allerdings ist die derart entstandene Musik ohne menschliche Bearbeitung eher Mittelmaß. Das Verfassen von Songtexten und Einspielen der Instrumente sollte daher durch menschliche Hand erfolgen. 5 Künstliche Intelligenz ist deshalb eher als Werkzeug, welches die kompositorische Arbeit erleichtert, zu betrachten.6

Klicken Sie auf die folgende Abbildung, um selbst mit dem Komponieren loszulegen und kreieren Sie mithilfe der KI von Soundraw eigene Songs.

Roboter spielt Klavier. Verlinkung zu Musikgenerator. Künstliche Intelligenz Musikkomposition.
Laremenko Sergii/Shutterstock.com Musikgenerator per AI von Soundraw

In der Praxis

Die Umsetzung computergenerierter Kompositionen ist bereits Realität. Beispielsweise erschuf der Wissenschaftler David Cope mithilfe von KI Werke klassischer Musik, welche Vivaldi, Bach oder Chopin ähneln. Die Aufführung mit einem echten Orchester konnte sogar Fachpublikum täuschen.7 Weiterhin konnten Forscher ein neuronales Netzwerk mithilfe von 45 Songs der Beatles so lange trainieren, bis es ein eigenes Stück entwarf, welches auffällig stark dem Ursprungsmaterial ähnelte. Lediglich der Text zu dem Song “Daddy’s Car” musste von Menschen geschrieben werden.8

Auch private Nutzer können KI zur Musikkomposition nutzen. So bietet das Berliner Unternehmen “Loudly” auf ihrer Homepage eine eigens mit ca. zehn Millionen Songs trainierte KI an. Nutzer können somit schnell eigene Lieder generieren lassen. Sie wählen lediglich Genre, Songlänge und Instrumente aus, den Rest übernimmt die KI.9 Auch professionelle Künstler haben sich bereits auf die Zusammenarbeit mit Künstlicher Intelligenz beim Kreieren von Songs spezialisiert. Die Berlinerin Holly Herndon hat auf diese Weise bereits mehrere Alben veröffentlicht.10

https://open.spotify.com/artist/2c9yn5DJQd5es7YMY92ikZ?autoplay=true
Songbeispiele der Musikerin Holly Herndon

Mensch vs. KI

Mit der zunehmenden Verbreitung von Künstlicher Intelligenz in der Musikbranche treten auch vermehrt ethische Fragen auf. Verdrängt die Maschine den Menschen? Ist computergenerierte Musik überhaupt Kunst?

Dr. Ralf Weigand, Vizepräsident des Deutschen Komponistenverbandes und Vorsitzender des Aufsichtsrats der GEMA, sieht KI in der Musik mit potenziellen Nachteilen verbunden. Besonders im Bereich der Gebrauchsmusik (Hintergrundmusik für Film, Fernsehen, Social Media etc.) könne KI eine Gefahr für die Jobs der Musikschaffenden bedeuten. Zudem sorge eine Überflutung des Musikmarkts mit computergenerierter Musik eventuell dafür, dass Menschen diese Musik nicht mehr von menschengemachter unterscheiden könnten.11

Rory Kenny, Gründer des eingangs erwähnten Unternehmens “Loudly”, hält dagegen. KI schaffe bereits neue Jobs wie Softwareentwickler oder Informationsspezialisten in der Musikbranche. Weiterhin ermögliche sie auch Menschen ohne Know-how die einfache und zugängliche Produktion von Musik.12

“Das wird eine sehr interessante weitere Demokratisierung des Musikschaffens.”

Rory Kenny13

 

Auch professionelle Kunstschaffende könnten Vorteile aus der Kooperation mit KI ziehen und Gefallen daran finden.14 Ein Beispiel hierfür ist die bereits erwähnte Holly Herndon.

Kann KI Kunst?

Auch ob Künstliche Intelligenz wahrhaftige Kunst erschaffen kann, ist umstritten. Der Neurowissenschaftler Matthias Bethge sieht KI zwar eher als Werkzeug, spricht ihr allerdings alle Merkmale menschlicher Kreativität zu. Genau wie der Mensch würde sie zunächst Erfahrungen sammeln und Strukturen analysieren, um dann auf dieser Basis etwas Neues zu schaffen. Hans-Christian Ziupa, Gewinner des KI-Musik-Wettbewerbs “Beats & Bits”, sieht jedoch einen zentralen Unterschied zwischen Mensch und KI. Zuhörer würden von Musikern erwarten, dass sie bei der Schöpfung von etwas Neuem mit sich gerungen und dabei eine gewisse emotionale Radikalität entwickelt hätten. Dies sei einer KI nicht möglich.15

Rory Kenny glaubt ebenfalls nicht an den Ersatz menschlicher Musiker durch Maschinen. Musik sei im Kern Storytelling, KI sei jedoch nicht in der Lage Geschichten zu erzählen.16 Goetz Richter, Musiker und Professor der Universität Sydney, sieht KI zudem als abhängig von Menschen und ihren Anweisungen. Es sei komplett verschieden, ob aus bereits bestehenden Werken Eigenschaften abstrahiert, oder schöpferische Werke erschaffen würden. Zu Letzterem sei KI nicht in der Lage. Musik sei kein Ergebnis reiner Analytik, sondern erfordere Neugier, Sinnfindung, Bewusstsein, gelebte Erfahrung, Aufmerksamkeit und Empathie. Dies seien alles Eigenschaften, welche Computern fehlen würden.17 Renate Buschmann, Professorin für digitale Künste der Universität Witten/Herdecke, sieht dies ähnlich. KI habe ihre Stärke im Analysieren von Mustern und dem Kopieren. Kunst sei aber eben das Brechen von Regeln und dem Erschaffen von Unberechenbarkeit.18

Eine weitere komplexe Frage in diesem Kontext ist die, nach der rechtlichen Urheberschaft künstlich komponierter digitaler Produktionen. Sowohl Nutzer der KI (Wahl der Schlagworte bei der Generierung), Künstler (Rahmen und Konzept auf welches KI zugreift), Programmierer (Entwicklung der Software) als auch die Maschine selbst (Komposition des Werkes) kommen als mögliche Urheber infrage.19 Nicht nur diese, sondern auch die oben angesprochenen Themen, werden die Musikbranche in Zukunft mit Sicherheit prägen und beschäftigen.


1 vgl. Die Bundesregierung 2020

2 vgl. Bora 2021

3 vgl. Die Bundesregierung 2020

4 vgl. Bora 2021, Die Bundesregierung 2020 und Richter

5 vgl. Die Bundesregierung 2020

6 vgl. Bora 2021

7 vgl. Richter

8 vgl. Die Bundesregierung 2020

9 vgl. Bora 2021

10 vgl. Die Bundesregierung 2020

11 vgl. Bora 2021

12 vgl. Bora 2021

13 Bora 2021

14 vgl. Buschmann 2022, S.165

15 vgl. Die Bundesregierung 2020

16 vgl. Bora 2021

17 vgl. Richter

18 vgl. Buschmann 2022, S.164-165

19 vgl. Buschmann 2022, S.169

Quellen

Bora, Tereza (2021): Kreative KI. Künstliche Intelligenz verändert die Musikbranche. Online unter https://www.br.de/nachrichten/wirtschaft/kreative-ki-kuenstliche-intelligenz-veraendert-die-musikbranche,Spb43xK [Abruf am 23.11.2022]

Buschmann, Renate (2022): Kann aus KI Kunst werden?. Dialogische Beziehungen mit Künstlicher Intelligenz. In: Schnell, Martin W.; Nehlsen, Lukas (Hg.): Begegnungen mit Künstlicher Intelligenz. Intersubjektivität, Technik, Lebenswelt. Weilerswist: Velbrück Wissenschaft, S. 164-173. Online unter: doi.org/10.5771/9783748934493

Die Bundesregierung (2020): KI spielt die Musik. Online unter https://www.bundesregierung.de/breg-de/suche/ki-in-der-kultur-1720970 [Abruf am 23.11.2022]

Richter, Goetz (o.J.): Die scheinbare Originalität von KI-Musik. Online unter https://www.goethe.de/prj/k40/de/mus/aim.html [Abruf am 23.11.2022]

Der Autor Hendrik Kuck arbeitet an der Universitätsbibliothek Osnabrück und studiert zurzeit berufsbegleitend Informationsmanagement an der Hochschule Hannover

Text-zu-Bildysnthese: Ist das nächste Kunstwerk nur noch einen Prompt entfernt?

Autorin: Annika Bleich


Ein Prompt ist eine Texteingabe bestehend aus wenigen Stichworten. Sie dient der KI eines Bildgenerators als Grundlage für das Erzeugen von Bildern und ermöglicht es jeder Person, auch dir, die eigenen kreativen Ideen in Bildern umzusetzen. Aber können einzelne Stichworte wirklich das Potenzial eines Kunstwerks innehaben?

Inhalt

Einführung

Zur Definition von Kunst schreibt Brockhaus: „die Gesamtheit des vom Menschen Hervorgebrachten […] zu dessen Voraussetzungen die Verbindung von hervorragendem Können und großem geistigem Vermögen gehören.“[1] Eine KI benötigt nur ein paar Stichworte, sogenannte Prompts, und wenige Sekunden, um ein Bild zu generieren und liefert zusätzlich verschiedene Varianten.[2] Das Ergebnis kann von unzufrieden bis überragend präzise reichen. Dies steht in Abhängigkeit zum Prompt und der jeweiligen KI.[3]

Sei PromptkünstlerIn

Am Anfang steht nur eine Zeile und in diese gibst du ein paar Stichworte ein. Die Zeile gehört zu einer der zahlreichen meist offen zugänglichen Bildgeneratoren. Darunter zählen unter anderem Midjourney, Dall-E und Stable Diffusion. Wie sie im Einzelnen funktionieren, kann der jeweiligen Webseite entnommen werden. Was alle gemeinsam haben:

  • Du entscheidest über den Prompt. Deine Fantasie ist Voraussetzung für den Bildinhalt.
  • Nach wenigen Sekunden erhältst du in Anlehnung an deinen Prompt ein Bild. Meistens in mehreren Variationen.

Jetzt hast du ein Bild, an dem die Urheberrechte alleine dir gehören. Aber wie ist es zustande gekommen?

Wie funktioniert Text-zu-Bildsynthese?

Zunächst wird eine Trainingsdatenbank mit Millionen von Bildern mit Bildbeschreibungen benötigt.[4] Die Bildbeschreibungen stammen unter anderem aus dem „alt“ Text, wie man ihn bei Html verwendet, um Bildinhalte zu beschreiben.[5] Der KI wird diese Datenbank zur Verfügung gestellt, um mittels Deep Learning, einem Lernverfahren, ihr neuronales Netz zu trainieren. Das neuronale Netz stellt, in Anlehnung an die im menschlichen Gehirn befindlichen Neuronen, eine Struktur aus miteinander vernetzten Informationen dar.[6] Es ergibt sich eine für die KI logische Verbindung zwischen Text und Bildinhalt.[7]

Die KI nutzt einen Prozess namens „Diffusion“. Ein Muster aus zufälligen Pixeln wird soweit modifiziert, bis sich daraus ein sinnvolles Bild ergibt.[8] Da es sich um einen zufälligen Prozess handelt, wird bei gleichbleibendem Prompt niemals dasselbe Bild entstehen.[9]

Dall-E und die Welt der Kunst

Unter anderem befinden sich in der Trainingsdatenbank die Bilder bekannter KünstlerInnen. Du hast also die Möglichkeit, einen Prompt dazu zu verwenden, deren Technik zu imitieren. Die UrheberInnen wurden allerdings nicht gefragt, ob sie mit der Verwendung ihrer Werke in der Datenbank und dem daraus resultierenden Nachahmen ihrer Kunst, einverstanden sind. [10]

Einerseits wird es dir und jedem anderen ermöglicht, eure künstlerischen Ideen mit wenigen Einschränkungen zu verwirklichen, ohne zuvor jahrelang benötigte handwerkliche Erfahrung sammeln zu müssen. Andererseits gefährdet dies die Arbeit unzähliger freischaffender KünstlerInnen, deren Einkommen darauf beruht, Grafiken, Illustrationen, Fotografien, Konzepte und dergleichen zu schaffen.[11]  Das synthetische Werk von Jason Allen, der damit einen Kunstwettbewerb gewann, führte erst kürzlich zu regen Diskussionen.

Prompkunst und ihre Grenzen

Auch wenn dich nun das Promptfieber gepackt hat, im Universum der synthetischen Bilder unterliegt deine Fantasie gewissen Einschränkungen. Grundsätzlich unzulässig ist die Erstellung von illegalem, gewalttätigem, sexuell explizitem oder anderweitig unangemessenem Inhalt.[12] Dies soll eine missbräuchliche Nutzung der KI und das Verbreiten problematischen Bildmaterials verhindern.[13]

Die Entwickler versuchen solche Bilder unter anderem durch Wortfilter bei der Prompteingabe und durch das Filtern unangemessener Inhalte in der Trainingsdatenbank zu verhindern.[14] Hierfür muss zunächst, beruhend auf individuellem Empfinden, definiert werden, welche Inhalte unangemessen sind.[15] Das Filtern hat unter anderem zur Folge, dass sich, wie im Fall von Dall-E, bei den Ergebnissen eine deutlichere Tendenz zu Genderstereotypen, wie beispielsweise nur noch Bilder von männlichen Geschäftsführern, abzeichnet. [16]

Einen genauen Grund konnten die Entwickler für diese Tendenz nicht nennen. Unter anderem stellten sie am Beispiel des männlichen Geschäftsführers die Hypothese auf, dass, auch wenn Männer und Frauen in der ursprünglichen Trainingsdatenbank in etwa gleichmäßig repräsentiert sind, Frauen häufiger in einem sexuellen Kontext dargestellt und somit gefiltert werden. Dem so entstehenden Ungleichgewicht der Geschlechter kann unter anderem dadurch entgegen gewirkt werden, indem die gefilterte Datenbank nun mit mehr Bildern von weiblichen Geschäftsführerinnen angereichert wird.[17]

Neben Filtern arbeiten die Entwickler der Bildgeneratoren auch an weiteren Schwierigkeiten. Dazu gehören unter anderem ein fehlendes Textverständnis der KI gegenüber bestimmten Prompts oder die teils unrealistische Abbildung von Personen oder Tieren in synthetischen Bildern.[18] 

Ein Blick in die Zukunft

our mission of creating AI that benefits humanity“

OpenAI

OpenAI, die Entwickler von Dall-E, formulieren auf ihrer Webseite diesen ambitionierten Wunsch. Unrealistisch ist dieser Anspruch nicht. Irgendwann soll die Leistung von KIs menschenähnliches Niveau erreichen, was in vielen wichtigen Bereichen wie zum Beispiel der Landwirtschaft, Automobilindustrie oder Pflege enorm hilfreich sein wird. [19]

Neben Bildern kann eine KI wie NUWA-Infinity mittlerweile sogar kurze Videoclips generieren. Zwar sind diese noch lange nicht perfekt, betrachtet man jedoch allein die rasante Entwicklung in den letzten Wochen, stellt sich die Frage, ob KIs irgendwann sogar in der Lage sind, ganze Filme synthetisch zu erstellen. Eine weitere Open Source KI von OpenAi namens ChatGPT, veröffentlicht im November 2022, ist bereits dazu in der Lage, wissenschaftliche Texte auf Grundlage von Texteingaben zu formulieren. [20]

Der Beginn einer neuen Kunstepoche?

Bislang reicht noch längst nicht jeder Prompt für ein Kunstwerk aus. Jason Allen investierte bereits mehrere Tage Arbeit mit Unterstützung eines Bildbearbeitungsprogramms, um sein beim Kunstwettbewerb eingereichtes Bild zu kreieren.[21] Die Gefährdung von KünstlerInnen durch Bildgeneratoren scheint zunächst zwar greifbar, aber wann die Arbeit von KIs tatsächlich menschenähnliches Niveau erreicht, bleibt vorerst eine Frage der Zeit.[22]

Ein Blick in die Vergangenheit hilft, um zu sehen, dass zumindest eine Definition von Kunst schon immer anpassungsfähig war. Auch die Entwicklung der Fotografie wurde lange Zeit nicht als Kunst anerkannt.[23] Und vielleicht wird eines Tages das Generieren synthetischer Bilder zu den Kunstmaßstäben einer zukünftigen Epoche gehören.

“Die Einschätzung von Kunst hängt von den Maßstäben einer Epoche und von der individuellen Sicht ab.”

Brockhaus Enzyklopädie Online

Literaturquellen

AI IMPACTS (2022): Will Superhuman AI be created? Online unter https://aiimpacts.org/argument-for-likelihood-of-superhuman-ai/ [Abruf am 10.01.2023]➝[19]

Brockhaus Enzyklopädie Online (o.J.): neuronale Netze (künstliche Intelligenz). Online unter https://brockhaus.de/ecs/enzy/article/neuronale-netze-kunstliche-intelligenz [Abruf am 10.01.2023]➝[1]➝[7]

Ford, Martin (2019): Die Intelligenz der Maschinen. Frechen: mitp Verlags GmbH & Co (mitp Professionals). Online unter https://content-select.com/de/portal/media/view/5e4ba26b-d1d4-49a1-93de-6b1fb0dd2d03 [Abruf am 10.01.2023] S. 9 ➝[6] ; S. 525 – 526 ➝[22]

Jäger, Jens (2009): Fotografie und Geschichte. Frankfurt am Main: Campus Verlag (Historische Einführungen). Online unter https://content-select.com/de/portal/media/view/519cc341-67b0-479d-9047-290f5dbbeaba [Abruf am 10.01.2023] S. 56➝[23]

Midjourney (2022): Content and Moderation. Online unter https://midjourney.gitbook.io/docs/content-and-moderation-policy [Abruf am 10.01.2023]➝[12] ➝[13] ➝[14]

Nichol, Alex (2022): Dall-E 2 Pre-Training Mitigations. Online unter https://openai.com/blog/dall-e-2-pre-training-mitigations/?itid=lk_inline_enhanced-template [Abruf am 10.01.2023]➝[16] ➝[17]

OpenAI (o.J.): Dall-E 2. Online unter https://openai.com/dall-e-2/ [Abruf am 10.01.2023]➝[8]

Rentjes, Thomas (2022): Foto-Synthese mit KI. Die Revolution der künstlichen Bilder. Online unter https://www.deutschlandfunkkultur.de/ki-technologie-revolution-kuenstliche-bilder-100.html [Abruf am 10.01.2023]➝[2] ➝[3] ➝[4] ➝[11] ➝[14] ➝[15] ➝[18] ➝[20]

Tiku, Nitasha (2022): AI can nox create any image in seconds, bringing wonder and danger. In: The Washington Post vom 22.09.2022. Online unter https://www.washingtonpost.com/technology/interactive/2022/artificial-intelligence-images-dall-e/ [Abruf am 10.01.2023]➝[10] ➝[21]

Vox (2022): The text-to-image revolution, explained. Video publiziert am 01.06.2022 auf YouTube. Online unter https://www.youtube.com/watch?v=SVcsDDABEkM [Abruf am 10.01.2023] (06:09)➝[5]; (09:35) ➝[9]

Bildquellen

Alle verwendeten Bilder stehen unter dem Copyright der Autorin © Annika Bleich (cc by-nc)

Videoquelle

tagesschau (2023): Software ChatGPT: Möglichkeiten und Grenzen künstlicher Intelligenz. Video publiziert am 12.01.2023 auf YouTube. Online unter https://www.youtube.com/watch?v=_ab6L50HlcI [Abruf am 29.01.2023]

Innovation in Bibliotheken: Deichman Bibliothek Oslo

Beitragsbild Innovation in Bibliotheken

Autorin: Merle Stegemeyer


“Wir leben in einer postdigitalen Situation. Die Leute wollen sich wieder real begegnen, öffentliche Räume werden wieder wichtiger.”[4]

– Reinert Mithassel, Leiter der Biblio Tøyen

Reinert Mithassel, Leiter der Biblio Tøyen in Oslo, spricht damit wohl nicht nur die andauernde Corona Pandemie an, sondern äußert den Wunsch vieler Menschen ihrer Umgebung und ihren Mitmenschen wieder näher zu kommen. Auch wenn die Corona Pandemie uns sicherlich in Hinblick auf Digitalisierung in (Hoch-) Schulen und am Arbeitsplatz große Schritte nach vorn gebracht hat, vermissen und beklagen wir doch, wie sehr uns die sozialen Kontakte fehlen.

Wie aber kann öffentlicher Raum so gestaltet werden, dass Menschen hier Zeit verbringen wollen? Es sind dabei insbesondere die Biblio Tøyen und die 2020 neu eröffnete Bjørvika Bibliothek zu nennen. Sie zeigen uns zwei zukunftsweisende Wege wie das Bibliothekswesen aussehen kann.

Deichman Biblio Tøyen

Die eigentlich in einem Problemviertel liegende Jugendbibliothek Biblio Tøyen steht dem Neubau im entstehenden neuen Kulturhafen Oslos in nichts nach. In Zusammenarbeit mit jungen Osloern und dem niederländischen Architekten/Creative Guide Aat Vos wurde die Bibliothek neu eingerichtet und umgestaltet.[11] Die Idee hinter der Umgestaltung bestand darin, ein Kulturhaus zu schaffen, das Jugendlichen ihren Bezug zur Realität nicht verlieren lässt. Denn durch die immer schneller werdenden Modernisierungen und die rasante Entwicklung der Gesellschaft kann ein solcher öffentlicher Rückzugsort für Jugendliche einen Ankerplatz bieten.[11]

So entstanden in alten, ausrangierten Kleinlastern und Seilbahnkabinen kleine Oasen der Ruhe und Orte zum Lesen. Ebenso Nester aus Kissen oder umfunktionierte Schubkarren dienen als Plätze zum Entspannen oder zum Lesen. Des Weiteren verleihen die vielen schwebende Elemente diesem Ort eine unglaubliche Leichtigkeit.[8][11]

Eltern und Erwachsenen ist der Zugang ausdrücklich nicht erlaubt, sodass die 10- bis 15-Jährigen hier ihre ganz eigenen Erfahrungen mit ihrer Freiheit, Umgebung und eben den Büchern machen können. Diese dadurch entstehende Wohnzimmeratmosphäre dient der Inspiration und lässt seine jugendlichen Besucher viel Freiraum. Dies wird zudem dadurch unterstützt, dass die Räumlichkeiten der Biblio Tøyen auch ohne Bibliothekspersonal zugänglich sind. [8]

Begib Dich auf einen kleinen Rundgang durch die Biblio Tøyen.[6]