BestOf – WebLab

20. September 202320. September 2023

X-Ploration: Data Mining und Sentimentanalyse mit Hugging Face

Autor: Oguzhan-Burak Bozkurt

Durch den kontinuierlichen und raschen Fortschritt in jüngster Zeit auf den Gebieten von Big Data und KI-Technologien sind heutzutage insbesondere Teilbereiche des Informationsmanagements gefragter als je zuvor. Die Rolle des Informationsmanagers und Data Scientists besteht darin, Methoden zur Erfassung und Verarbeitung von Informationen aus unterschiedlichen Datenquellen anzuwenden. Zudem ist er befähigt, Entscheidungen darüber zu treffen, welche Verarbeitungsprozesse zur gezielten Knowledge Discovery aus umfangreichen Datensätzen geeignet sind. Hierbei kommt Data Mining ins Spiel, eine Methode, die die systematische Extraktion relevanter Informationen und Erkenntnisse aus großen Datenmengen umfasst.

In diesem Blogbeitrag werden wir tiefer in das Thema eintauchen und uns einem von vielen Verfahren des Data Mining, genauer der Sentimentanalyse im Text Mining, praxisnah annähern. Dabei bin ich der Ansicht, dass ein tieferes Verständnis erreicht wird, wenn das theoretisch Gelernte eigenständig umgesetzt werden kann, anstatt lediglich neue Buzzwörter kennenzulernen. Ziel ist eine Sentimentanalyse zu Beiträgen auf der Social Media Plattform X (ehemals Twitter) mit Verfahren aus dem Machine Learning bzw. einem passenden Modell aus Hugging Face umzusetzen.

Ihr könnt euch in die Hintergründe einlesen oder direkt zum Coden überspringen.

Einführung: Data Mining ⛏️

ML-Based Text Mining 🤖

In my feelings mit Hugging Face 🤗

Let’s build! Sentimentanalyse mit Python 🐍

Einführung: Data Mining ⛏️

Data Mining umfasst die Extraktion von relevanten Informationen und Erkenntnissen aus umfangreichen Datensammlungen. Ähnlich wird auch der Begriff “Knowledge Discovery in Databases” (KDD) verwendet. Die Hauptaufgabe besteht darin, Verhaltensmuster und Prognosen aus den Daten zu identifizieren, um darauf basierend Trends zu erkennen und angemessen darauf zu reagieren. Dieser analytische Prozess des Data Mining erfolgt mithilfe von computergestützten Methoden, deren Wurzeln in den Bereichen Mathematik, Informatik und insbesondere Statistik liegen. Data Mining kann als Teilprozess innerhalb des umfassenden Datenanalyseprozesses verstanden werden, der folgendermaßen strukturiert ist:

Datenbereinigung (Exkludierung von irrelevanten Daten)

Datenintegration (Zusammenführen mehrerer Datenquellen)

Datenselektion (Auswahl relevanter Daten aus einer Datenbank)

Datentransformation (Aufbereitung/Konsolidierung der Daten in eine für das Data Mining passende Form)

Data Mining (Prozess gestützt von intelligenten Methoden zum Extrahieren von Daten-/Verhaltensmustern)

Pattern Evaluation (Identifikation interessanter Muster und Messwerte)

Knowledge Presentation (Präsentieren von mined knowledge durch Visualisierung und andere Repräsenationstechniken)

Data Mining als Teilprozess der Knowledge Discovery / Jiawei Han, Data Mining: Concepts and Techniques (2006)

Die Data Mining Verfahren dienen dazu, den Datenbestand zu beschreiben und zukünftige Entwicklungen vorherzusagen. Hierbei kommen Klassifikations- und Regressionsmethoden aus dem statistischen Bereich zum Einsatz. Zuvor ist es jedoch notwendig, die Zielvariable festzulegen, die Daten aufzubereiten und Modelle zu erstellen. Die gebräuchlichen Methoden ermöglichen die Analyse spezifischer Kriterien wie Ausreißer- und Clusteranalyse, die Verallgemeinerung von Datensätzen, die Klassifizierung von Daten und die Untersuchung von Datenabhängigkeiten.

Zusätzlich zu den herkömmlichen statistischen Methoden können auch Deep Learning-Algorithmen verwendet werden. Hierbei werden Modelle aus dem Bereich des Machine Learning unter Anwendung von überwachtem (bei gelabelten Daten) oder unüberwachtem (bei nicht gelabelten Daten) Lernen eingesetzt, um die Zielvariablen möglichst präzise vorherzusagen. Eine wesentliche Voraussetzung für das Vorhersagemodell ist ein Trainingsdatensatz mit bereits definierten Zielvariablen, auf den das Modell anschließend trainiert wird.

ML-Based Text Mining 🤖

Ein Teilbereich des Data Mining, der auch maßgeblich maschinelles Lernen einbezieht, ist das Text Mining. Hierbei zielt das Text Mining darauf ab, unstrukturierte Daten aus Texten, wie beispielsweise in sozialen Netzwerken veröffentlichte Inhalte, Kundenbewertungen auf Online-Marktplätzen oder lokal gespeicherte Textdateien, in strukturierte Daten umzuwandeln. Für das Text Mining dienen oft Datenquellen, die nicht direkt zugänglich sind, weshalb Daten über APIs oder Web-Scraping beschafft werden. Im darauf folgenden Schritt werden Merkmale (Features) gebildet und die Daten vorverarbeitet. Hierbei erfolgt die Analyse der Texte mithilfe von natürlicher Sprachverarbeitung (Natural Language Processing – NLP) unter Berücksichtigung von Eigenschaften wie Wortfrequenz, Satzlänge und Sprache.

Maschinelles Lernen für Datenvorverarbeitung

Die Vorverarbeitung der Daten wird durch Techniken des maschinellen Lernens ermöglicht, zu denen Folgendes gehört:

Tokenisierung: Hierbei werden die Texte in kleinere Einheiten wie Wörter oder Satzteile, sogenannte Tokens, aufgespalten. Das erleichtert die spätere Analyse und Verarbeitung.

Stoppwortentfernung: Häufige Wörter wie “und”, “oder” oder “aber”, die wenig spezifische Informationen liefern, werden entfernt, um die Datenmenge zu reduzieren und die Analyse effizienter zu gestalten.

Wortstamm- oder Lemmatisierung: Die Formen von Wörtern werden auf ihre Grundformen zurückgeführt, um verschiedene Variationen eines Wortes zu einer einzigen Form zu konsolidieren. Zum Beispiel werden “läuft”, “lief” und “gelaufen” auf “laufen” reduziert.

Entfernen von Sonderzeichen und Zahlen: Nicht-textuelle Zeichen wie Satzzeichen, Symbole und Zahlen können entfernt werden, um die Texte auf die reinen sprachlichen Elemente zu fokussieren.

Niedrige Frequenzfilterung: Seltene Wörter, die in vielen Texten nur selten vorkommen, können entfernt werden, um Rauschen zu reduzieren und die Analyse zu verbessern.

Wortvektorenbildung: Durch Techniken wie Word Embeddings können Wörter in numerische Vektoren umgewandelt werden, wodurch maschinelles Lernen und Analyseverfahren angewendet werden können.

Named Entity Recognition (NER): Diese Technik identifiziert in Texten genannte Entitäten wie Personen, Orte und Organisationen, was zur Identifizierung wichtiger Informationen beiträgt.

Sentimentanalyse: Diese Methode bewertet den emotionalen Ton eines Textes, indem sie versucht, positive, negative oder neutrale Stimmungen zu erkennen.

Textklassifikation: Mithilfe von Trainingsdaten werden Algorithmen trainiert, um Texte automatisch in vordefinierte Kategorien oder Klassen einzuteilen.

Topic Modeling: Diese Methode extrahiert automatisch Themen aus Texten, indem sie gemeinsame Wörter und Konzepte gruppiert.

Insgesamt kann der Text Mining-Prozess als Teil einer breiteren Datenanalyse oder Wissensentdeckung verstanden werden, bei dem die vorverarbeiteten Textdaten als Ausgangspunkt für weitere Schritte dienen.

The effort of using machines to mimic the human mind has always struck me as rather silly. I would rather use them to mimic something better.
Edsger Wybe Dijkstra

In unserem nächsten Abschnitt werden wir auf die Sentimentanalyse eingehen und schrittweise demonstrieren, wie sie mit Hilfe von Modellen auf Hugging Face für Beiträge auf der Plattform X (ehemalig Twitter) durchgeführt werden kann.

In my feelings mit Hugging Face 🤗

Das 2016 gegründete Unternehmen Hugging Face mit Sitz in New York City ist eine Data Science und Machine Learning Plattform. Ähnlich wie GitHub ist Hugging Face gleichzeitig ein Open Source Hub für AI-Experten und -Enthusiasten. Der Einsatz von Huggin Face ist es, KI-Modelle durch Open Source Infrastruktur und Repositories für die breite Maße zugänglicher zu machen. Populär ist die Plattform unter anderem für seine hauseigene Open Source Bibliothek Transformers, die auf ML-Frameworks wie PyTorch, TensorFlow und JAX aufbauend verschiedene vortrainierte Modelle aus den Bereichen NLP, Computer Vision, Audio und Multimodale anhand von APIs zur Verfügung stellt.

Für die Sentimentanalyse stehen uns über 200 Modelle auf der Plattform zur Verfügung. Wir werden im folgenden eine einfache Sentimentanalyse unter Verwendung von Transformers und Python durchführen. Unsere KI soll am Ende Ton, Gefühl und Stimmung eines Social Media Posts erkennen können.

Viel Spaß beim Bauen! 🦾

Let’s build! Sentimentanalyse mit Python 🐍

Zunächst brauchen wir Daten aus X/Twitter. Da im Anschluss auf die neuen Richtlinien die Twitter API jedoch extrem eingeschränkt wurde (rate limits, kostenspielige read Berechtigung) und es nun auch viele Scraping-Methoden getroffen hat, werden wir bereits vorhandene Daten aus Kaggle verwenden.

Elon Musk übernimmt Twitter und ändert den Namen um zu “X”

1. Datenbereitstellung: Kaggle

Wir entscheiden uns für einen Datensatz, der sich für eine Sentimentanalyse eignet. Da wir mit einem Text-Mining Modell in Transformers arbeiten werden, welches NLP verwendet um das Sentiment eines Textes zuordnen zu können, sollten wir uns für einen Datensatz entscheiden, in dem sich Texte für unsere Zielvariable (das Sentiment) befinden.

Hier kann ein Datensatz aus Kaggle verwendet werden, in dem über 80 Tausend englische Tweets über das Thema “Crypto” in dem Zeitraum vom 28.08.2022 – 29.08.2022 gesammelt wurde: 🐦 🪙 💸 Crypto Tweets | 80k in English | Aug 2022 🐦 🪙 💸

Wir laden das Archiv herunter und entpacken die crypto-query-tweets.csv in unseren Projektordner.

2. Zielsetzung und Datenvorverarbeitung: Python + Pandas

Wir wollen in einer überschaubaren Anzahl an Tweets das jeweilige Sentiment zuordnen. Dazu schauen wir uns den Datensatz aus der CSV Datei genauer an. Uns interessieren dabei besonders Tweets von verifizierten Usern. Mit der Pandas Bibliothekt läss sich der Datensatz in Dataframes laden und nach bestimmten kriterien filtern.

wir installieren zunächst per pip-install die gewünschte Bibliothek und importieren diese in unsere Codebase.

pip install pandas

Anschließends lesen wir die CSV-Datei ein und filtern entsprechend unseren Wünschen den Datensatz und geben diesen als Dataframe aus.

import pandas as pd

# CSV Datei lesen
csv_file_path = "crypto-query-tweets.csv"
df = pd.read_csv(csv_file_path, usecols=['date_time', 'username', 'verified', 'tweet_text'])

# Filter anwenden um nur verifizierte User zu erhalten
filtered_df = df[df['verified'] == True]

# Printe Dataframe
print(filtered_df)

Wir erhalten folgende Ausgabe von 695 Zeilen und 4 Spalten:

       date_time                     username        verified    tweet_text
19     2022-08-29 11:44:47+00:00     RR2Capital      True  #Ethereum (ETH)\n\nEthereum is currently the s...24     2022-08-29 11:44:45+00:00     RR2Capital      True  #Bitcoin (BTC)\n\nThe world’s first and larges...
25     2022-08-29 11:44:43+00:00     RR2Capital      True  TOP 10 TRENDING CRYPTO COINS FOR 2023\n \nWe h...
146    2022-08-29 11:42:39+00:00   ELLEmagazine      True  A Weekend in the Woods With Crypto’s Cool Kids...
155    2022-08-29 11:42:32+00:00     sofizamolo      True          Shill me your favorite #crypto project👇🏻🤩
...                          ...            ...       ...                                                ...
79383  2022-08-28 12:36:34+00:00  hernanlafalce      True  @VerseOort My proposal is as good as your proj...
79813  2022-08-28 12:30:15+00:00   NEARProtocol      True  💫NEARCON Speaker Announcement💫\n\nWe're bringi...
79846  2022-08-28 12:30:00+00:00            lcx      True  🚀@LCX enables project teams to focus on produc...
79919  2022-08-28 12:28:56+00:00    iSocialFanz      True  Friday.. Heading to Columbus Ohio for a Web 3....
79995  2022-08-28 12:27:46+00:00  BloombergAsia      True  Bitcoin appeared stuck around $20,000 on Sunda...

[695 rows x 4 columns]

3. Twitter-roBERTa-base for Sentiment Analysis + TweetEval

Nun können wir mit Hugging Face Transformers eine vortrainiertes Modell verwenden, um allen Tweets entsprechende Sentiment Scores zuzuweisen. Wir nehmen hierfür das Modell Twitter-roBERTa-base for Sentiment Analysis, welches mit über 50 Millionen Tweets trainiert wurde und auf das TweetEval Benchmark für Tweet-Klassifizierung aufbaut. Weitere Infos unter dieser BibTex entry:

@inproceedings{barbieri-etal-2020-tweeteval,
    title = "{T}weet{E}val: Unified Benchmark and Comparative Evaluation for Tweet Classification",
    author = "Barbieri, Francesco  and
      Camacho-Collados, Jose  and
      Espinosa Anke, Luis  and
      Neves, Leonardo",
    booktitle = "Findings of the Association for Computational Linguistics: EMNLP 2020",
    month = nov,
    year = "2020",
    address = "Online",
    publisher = "Association for Computational Linguistics",
    url = "https://aclanthology.org/2020.findings-emnlp.148",
    doi = "10.18653/v1/2020.findings-emnlp.148",
    pages = "1644--1650"
}

Wir installieren alle für den weiteren Verlauf benötigten Bibliotheken.

pip install transformers numpy scipy

Die Transformers Bibliothekt erlaubt uns den Zugriff auf das benötigte Modell für die Sentimentanalyse. Mit scipy softmax und numpy werden wir die Sentiment Scores ausgeben mit Werten zwischen 0.0 und 1.0, die folgendermaßen für alle 3 Labels ausgegeben werden:

Labels: 0 -> Negative; 1 -> Neutral; 2 -> Positive

Importieren der Bibliotheken:

from transformers import AutoModelForSequenceClassification
from transformers import AutoTokenizer
import numpy as np
from scipy.special import softmax
import csv
import urllib.request

Wir schreiben eine Methode zum vorverarbeiten des Texts. Hier sollen später Usernamen und Links aussortiert werden. Außerdem vergeben wir das gewünschte Modell mit dem gewünschten Task (‘sentiment’) in eine vorgesehene Variable und laden einen AutoTokenizer ein, um später eine einfach Eingabe-Enkodierung zu generieren.

# Vorverarbeitung des texts 
def preprocess(text):
    new_text = []
 
 
    for t in text.split(" "):
        t = '@user' if t.startswith('@') and len(t) > 1 else t
        t = 'http' if t.startswith('http') else t
        new_text.append(t)
    return " ".join(new_text)


task='sentiment'
MODEL = f"cardiffnlp/twitter-roberta-base-{task}"

tokenizer = AutoTokenizer.from_pretrained(MODEL)

Als nächstes laden wir das Label Mapping aus TweetEval für das zugeordnete Task ‘sentiment’ herunter. Das Modell für die Sequenzklassifizierung kann nun gespeichert und in der ‘model’ Variable hinterlegt werden.

# download label mapping
labels=[]
mapping_link = f"https://raw.githubusercontent.com/cardiffnlp/tweeteval/main/datasets/{task}/mapping.txt"
with urllib.request.urlopen(mapping_link) as f:
    html = f.read().decode('utf-8').split("\n")
    csvreader = csv.reader(html, delimiter='\t')
labels = [row[1] for row in csvreader if len(row) > 1]

# Modell laden
model = AutoModelForSequenceClassification.from_pretrained(MODEL)
model.save_pretrained(MODEL)

Im nächsten Schritt schreiben wir zwei Methoden, die dabei helfen sollen zeilenweise Tweet-Texte zu enkodieren und ein Sentiment Score zu vergeben. In einem Array sentiment_results legen wir alle Labels und entsprechende Scores ab.

# Sentiment Scores für alle Tweets erhalten
def get_sentiment(text):
    text = preprocess(text)
    encoded_input = tokenizer(text, return_tensors='pt')
    output = model(**encoded_input)
    scores = output.logits[0].detach().numpy()
    scores = softmax(scores)
    return scores

# Sentimentanalyse für jede Zeile im Datensatz anwenden
def analyze_sentiment(row):
    scores = get_sentiment(row['tweet_text'])
    ranking = np.argsort(scores)
    ranking = ranking[::-1]
    sentiment_results = []
    for i in range(scores.shape[0]):
        l = labels[ranking[i]]
        s = scores[ranking[i]]
        sentiment_results.append((l, np.round(float(s), 4)))
    return sentiment_results

Zum Schluss wir das Dataframe um unser Ergebnis erweitert. Hierzu erstellen wir eine neue Spalte ‘sentiment’ und fügen mit der apply-Funktion die Ergebnisse aus unserer vorherigen Methode analyze_sentiement hinzu. Am Ende geben wir unser neues Dataframe in der Konsole aus.

# Ergebnisse in neue Spalte "sentiment" speichern
filtered_df['sentiment'] = filtered_df.apply(analyze_sentiment, axis=1)

# Ausgabe des neuen DataFrames
print(filtered_df)

Wir erhalten ein neues Dataframe mit einer weiteren Spalte in der das Label und die Sentiment-Scores festgehalten werden! 🤗🚀

Den gesamten Code könnt ihr euch auch auf meinem GitHub Profil ansehen oder klonen.

GitHub Repository

Referenzen

Han, Jiawei (2006). Data Mining: Concepts and Techniques, Simon Fraser University.

Barbieri, F., Camacho-Collados, J., Espinosa Anke, L., & Neves, L. (2020). Tweet Eval: Unified Benchmark and Comparative Evaluation for Tweet Classification. In Findings of the Association for Computational Linguistics: EMNLP 2020, S. 1644-1650. https://aclanthology.org/2020.findings-emnlp.148.

Hugging Face Transformers: https://huggingface.co/docs/transformers/index. Zuletzt aktualisiert am 27.08.2023.

Kaggle Dataset: Leonel do Nascimento, Tiago; “Crypto Tweets | 80k in ENG | Aug 2022 “: https://www.kaggle.com/datasets/tleonel/crypto-tweets-80k-in-eng-aug-2022. (CC0 Public Domain Lizens), zuletzt aktualisiert am 27.08.2023.

Wartena, Christian & Koraljka Golub (2021). Evaluierung von Verschlagwortung im Kontext des Information Retrievals. In Qualität in der Inhaltserschließung, 70:325–48. Bibliotheks- und Informationspraxis. De Gruyter, 2021. https://doi.org/10.1515/9783110691597.

14. Juli 202326. Juni 2023

Die KI DeepNash meistert Stratego

Autor*innen: Jessica Arnold und Jan Heinemeyer

DeepNash ist die neue KI der Firma Deepmind, die erstmals in der Lage ist das Brettspiel Stratego trotz unvollständiger Informationen zu meistern.

Darstellung des Brettspiels Stratego ^[3
]

Die neue KI DeepNash

Während die künstliche Intelligenz „AlphaZero“ Schach und „MuZero“ als Nachfolger verschiedene Spiele der Spielkonsole Atari meisterte, veröffentlichte die Firma Deepmind die nächste Entwicklungsstufe. Diese KI trägt den Namen DeepNash. AlphaZero meisterte Brettspiele mit klaren Regeln über ein modell-basiertes Training und MuZero, die schwer in Regeln auszudrückenden Atari-Spiele durch ein modell-freies Training. DeepNash hingegen legt sowohl die Spielregeln wie auch das Modell eines Spiels für die Planung fest. Die Besonderheit ist hierbei, dass von der gängigen Methode der Monte-Carlo-Baumsuche abgewichen wird. In der nachfolgenden Tabelle wird die unterschiedliche Komplexität von Brettspielen nochmals deutlich. ^[1][6]

	Schach	Poker	Go 19*19	Stratego
durchschnittliche Züge je Spiel	60	15	300	1000
mögliche Startaufstellungen	1	10⁶	1	10⁶⁶
Komplexität des Spielbaums	10¹²³	10¹⁷	10³⁶⁰	10⁵³⁵

Übersicht der Komplexität unterschiedlicher Brettspiele ^[3]

Die Nash-Spieltheorie

Das Besondere an DeepNash ist, dass es in den Spielen versucht ein Nash-Gleichgewicht zu erreichen. Hierdurch verläuft das Spiel stabil. Das Nash-Gleichgewicht ist nach dem Spieltheorie-Mathematiker Jon Forbes Nash benannt. Die Theorie folgt der Annahme, dass ein Abweichen der Strategie zu einem schlechteren Ergebnis führt. DeepNash und das Nash-Gleichgewicht folgen also konstant einer Strategie. Infolgedessen hat DeepNash mindestens eine 50%ige Chance zu gewinnen. ^[1][3]

Die KI DeepNash spielt Stratego

Youtube-Kanal Deepmind: Die erste Stratego Partie von DeepNash gegen einen menschlichen Gegner^[2]

Die KI DeepNash nahm als Trainingsgrundlage das Brettspiel Stratego. Das Brettspiel hat im Schnitt 381 Spielzüge und die besondere Schwierigkeit, dass nicht alle Informationen von Beginn an gegeben sind, da mit verdeckten Figuren gespielt wird und der Gegner mit Hilfe von Bluffs i.d.R. seine Taktik verschleiert. Optimale Spielabläufe gibt es nicht, da die Züge inkonsequent sind, das heißt jederzeit ist das Spielergebnis offen. Es wird daher anders als beim Schach nicht in Zügen, sondern in Spielen gedacht. ^[1][3]

Die optimale Strategie in Stratego erreicht die KI nach 5,5 Milliarden simulierten Partien. ^[1] DeepNash besiegte damit 97% der derzeitigen Computersysteme und erreichte eine Siegesquote von 84% gegen menschliche Spieler auf der Online-Stratego-Plattform Gravon. DeepNash gelangte damit in die Top 3 der dortigen Bestenliste. Eine weitere Besonderheit der KI stellte die Anwendung menschlicher Spielstrategien dar. So zeigte DeepNash das Bluffen oder auch das Opfern von Figuren als Taktik. Der Algorithmus „Regularised Nash Dynamics“ (R-NaD) wird außerdem für Forschende als OpenSource Download auf Github zur Verfügung gestellt. ^[1][4][5]

Ausschnitt aus der OpenSource Publikation zu DeepNash^[7]

Zukünftige KI Anwendungsfelder

DeepNash ist die nächste Weiterentwicklung, um Menschen in Brettspielen zu übertrumpfen und wird künftig als Grundlage für alltägliche Herausforderungen genutzt werden können. Insbesondere mit unvollständigen Informationen zu arbeiten stellt einen weiteren Meilenstein dar, der in der Lage ist bei komplexen Problemen wie der Optimierung des Verkehrssystems oder auch im Bereich des autonomen Fahrens – wie auch MuZero zuvor – einen Beitrag leisten zu können. ^[3][4][6]

Quiz

Teste nun dein Wissen über DeepNash in einem kleinen Quiz.

Über die Autoren

Die Autorin Jessica Arnold arbeitet derzeit in der Hochschulbibliothek Emden und studiert berufsbegleitend Informationsmanagement an der Hochschule Hannover.

Der Autor Jan Heinemeyer arbeitet derzeit in der Stadtbücherei Penzberg und studiert berufsbegleitend Informationsmanagement an der Hochschule Hannover.

Beide Autoren eint das private Interesse an Informatik, Gaming, KI und Brettspielen.

Quellen:

Fußnoten:

1: Bastian, Matthias (2022)

2: DeepMind (2023)

3: Perolat, Julien u.a. (2023)

4: Meier, Christian J. (2022)

5: Menge-Sonnentag, Rainald (2022)

6: Schreiner, Maximilian (2020)

7: Perolat, Julien u.a. (2022)

Literaturverzeichnis:

Bastian, Matthias (2022): Deepminds neue Spiele-KI soll ein Game-Changer in der echten Welt werden. . In: THE-DECODER.de, Ausgabe vom 04.12.2020. Online verfügbar unter https://the-decoder.de/deepminds-neue-spiele-ki-soll-ein-game-changer-in-der-echten-welt-werden/, zuletzt geprüft am 05.01.2023.

DeepMind (2023): DeepNash Stratego game 1. Online verfügbar unter https://www.youtube.com/watch?v=HaUdWoSMjSY, zuletzt aktualisiert am 05.01.2023, zuletzt geprüft am 05.01.2023.

Meier, Christian J. (2022): Künstliche Intelligenz spielt Stratego und besiegt Menschen: ein Durchbruch. In: Süddeutsche Zeitung, 02.12.2022. Online verfügbar unter https://www.sueddeutsche.de/wissen/kuenstliche-intelligenz-stratego-brettspiel-durchbruch-menschen-1.5707877, zuletzt geprüft am 05.01.2023.

Menge-Sonnentag, Rainald (2022): KI meistert nächstes komplexes Brettspiel: DeepNash siegt in Stratego. In: heise online, 05.12.2022. Online verfügbar unter https://www.heise.de/news/KI-meistert-naechstes-komplexes-Brettspiel-DeepNash-siegt-in-Stratego-7365933.html, zuletzt geprüft am 05.01.2023.

Perolat, Julien u.a. (2022): Mastering the Game of Stratego with Model-Free Multiagent Reinforcement Learning. Online unter https://arxiv.org/pdf/2206.15378.pdf [Abruf am 07.01.2023]

Perolat, Julien u.a. (2023): Mastering Stratego, the classic game of imperfect information. Online verfügbar unter https://www.deepmind.com/blog/mastering-stratego-the-classic-game-of-imperfect-information, zuletzt aktualisiert am 05.01.2023, zuletzt geprüft am 05.01.2023.

Schreiner, Maximilian (2020): Deepmind MuZero: Auf dem Weg zum Universalalgorithmus. In: THE-DECODER.de, Ausgabe vom 24.12.2020. Online unter https://the-decoder.de/deepmind-muzero-auf-dem-weg-zum-universalalgorithmus/#top, zuletzt geprüft am 05.01.2023.

13. Juli 202326. Juni 2023

Methoden zur Verbesserung der User Experience am Beispiel des Kano-Modells

Autorinnen: Jennifer Tews und Katharina Trommer

Die Kundschaft ist König – doch was erwartet sie eigentlich? Was erwarten Kund:innen von einem Produkt oder einer Dienstleistung und womit lassen sie sich begeistern? Für Unternehmen oder Dienstleister ist es wichtig, die Bedürfnisse seiner Kund:innen sowie deren Ansprüche und Wünsche zu kennen und im besten Fall zu erfüllen. Denn nur so können eine erhöhte Nachfrage und ein dementsprechendes Angebot gewährleistet werden. Eine Einführung in diese Thematik sowie das Kano-Modell als Methode, die Zufriedenheit der Kund:innen festzustellen, erhalten Sie in diesem Beitrag.

Inhalt

Wie Zufriedenheit in der Kundschaft entsteht
Das Kano-Modell – Kund:innenzufriedenheit sichtbar machen
Bessere User Experience dank Kano-Modell
Aufgepasst? Testen Sie sich selbst!
Quellen

Wie Zufriedenheit in der Kundschaft entsteht

Ob Parkautomat oder Selbstbedienungskasse im Supermarkt – unser Alltag ist von interaktiven Produkten und Anwendungen geprägt. Dabei kommt es vor, dass wir mit einigen Systemen mühelos zurechtkommen und uns mit anderen schwertun. Dementsprechend hinterlassen Produkte oder Anwendungen einen positiven, geradezu großartigen Eindruck oder einen negativen und unbefriedigenden. Diese Erfahrung lässt sich in einem einfachen Begriff beschreiben: User Experience (kurz UX).^[1]

Die User Experience beschreibt die Wahrnehmungen und Reaktionen einer Person auf die Nutzung eines Systems, Produktes oder einer Dienstleistung.^[2] Sie rückt das subjektive Empfinden sowie die Bedürfnisbefriedigung der Nutzenden ins Zentrum, wobei emotionale Faktoren handlungsleitend sind. Ein positiv in Erinnerung gebliebenes Nutzungserlebnis kann dafür sorgen, dass Kund:innen ein Produkt weiterempfehlen oder noch einmal kaufen. Insbesondere die Ästhetik und intuitive Anwendbarkeit wirken dabei überzeugend.^[3]

“Wenn sie ein großartiges Erlebnis schaffen, werden sich die Kund:innen gegenseitig davon erzählen. Sie müssen immer fantastisch sein.”
Jeff Bezos, Amazon

Einfach gesagt entscheiden sich Kund:innen beim Kauf für das Angebot, welches ihren Anforderungen und Wünschen am meisten entspricht. Für Unternehmen ist es daher sinnvoll, die Aspekte der User Experience zu berücksichtigen, um die Nutzungszufriedenheit zu steigern und eine positive Wahrnehmung des Produktes zu bewirken. Dies erfordert mitunter, sich von etablierten Praktiken bei der Produktentwicklung zu lösen und neue Wege einzuschlagen, um Produkte und Anwendungen noch besser an die Bedürfnisse der Nutzer:innen anzupassen.

Damit landen wir wieder bei unserer Einstiegsfrage, was Kund:innen erwarten? Um herauszufinden, womit Produkte und Dienstleistungen positive Eindrücke hinterlassen, ist die Analyse der Zufriedenheit der Kundschaft notwendig.

Das Kano-Modell – Kund:innenzufriedenheit sichtbar machen

Das Kano-Modell ist eine Methode, um die Zusammenhänge zwischen dem Erreichen bestimmter Produkt-oder Dienstleistungseigenschaften und der erwarteten Kund:innenenzufriedenheit darzustellen. Der Schöpfer dieses Modells, Noriaki Kano, bezieht sich bei seinem Modell auf die Theorie von Frederick Herzberg. Diese besagt, dass nicht notwendigerweise ein linearer Zusammenhang zwischen der Erfüllung eines Bedürfnisses und der daraus resultierenden Zufriedenheit bzw. Unzufriedenheit bestehen muss.^[4]

Das Kano-Modell und seine Bestandteile

Innerhalb des Kano-Modells wird zwischen verschiedenen Anforderungskategorien, auch Merkmale oder Faktoren genannt, unterschieden. Es gibt Basis-, Leistungs- und Begeisterungsfaktoren. In einigen Darstellungen wird das Modell durch Questionable, Indifferente Merkmale und Reverse Merkmale ergänzt. Alle Kategorien unterscheiden sich in ihrem Einfluss auf die Kund:innenzufriedenheit und werden im Vorfeld häufig mittels Interviewverfahren bestimmt. Um im Anschluss die Produkt- oder Dienstleistungsanforderungen den einzelnen Kategorien zuordnen zu können, werden Kund:innenenreaktionen bewertet. Dabei wird ein Fragetechnik angewendet, welches auf der Beantwortung zweier Fragen beruht – der funktionalen und der dysfunktionalen Frage.^[4]

Die funktionale Frage

Die funktionale Frage ist positiv formuliert und bezieht sich auf die Reaktion der Kund:innen, wenn ein Produkt die jeweils abgefragte Eigenschaft besitzt.

Zum Beispiel:
Was würden Sie sagen, wenn das Produkt bzw. die Dienstleistung über das Merkmal XY verfügen würde?

Die dysfunktionale Frage

Die dysfunktionale Frage ist negativ formuliert und bezieht sich auf die Reaktion der Kund:innen, wenn diese Eigenschaft nicht vorhanden ist.

Zum Beispiel:
Was würden Sie sagen, wenn das Produkt bzw. die Dienstleistung NICHT über das Merkmal XY verfügen würde?

Basisfaktoren umfassen Eigenschaften, die von der Kundschaft als Muss für das Produkt vorausgesetzt, aber nicht explizit gefordert werden. Aus diesem Grund werden sie als „Basic“ oder „Must-Be“ bezeichnet. Da diese Faktoren als selbstverständlich erachtet werden, wirkt sich ihr Vorhandensein nicht positiv auf die Kund:innenzufriedenheit aus. Umgekehrt führt ihr Fehlen zu starker Unzufriedenheit.

Ein Beispiel dafür wären die Räder eines Fahrzeugs.

Anders verhält es sich mit den Leistungsfaktoren. Die Zufriedenheit der Kundschaft wächst proportional zum Erfüllungsgrad dieser Anforderungen. Je mehr ein Leistungsattribut erfüllt ist, desto positiver wirkt es sich auf die Kund:innenzufriedenheit aus und umgekehrt. Leistungsfaktoren fungieren häufig als Vergleichskriterium unterschiedlicher Produkte, Angebote oder Dienstleistungen und werden explizit von Kund:innen erwartet.

Ein Beispiel wäre ein Automotor mit besonders starker Leistung.

Begeisterungsfaktoren haben den größten Einfluss auf die Zufriedenheit der Kundschaft. Sie übersteigen deren Anforderungen, sorgen für Begeisterung und werden, ebenso wie die Basisfaktoren, nicht explizit von der Kundschaft verlangt. Im Gegensatz zu den Basisfaktoren werden sie aber nicht vorausgesetzt und lösen deswegen keine Unzufriedenheit aus, wenn sie nicht vorhanden sind. Durch Begeisterungsfaktoren können sich Produkte und Dienstleistungen deutlich von der Konkurrenz abheben. Bereits kleine Leistungssteigerungen können zu einer überproportionalen Steigerung der Kund:innenzufriedenheit führen. Allerdings sind Begeisterungsfaktoren nur schwer zu ermitteln.

Ein Begeisterungsfaktor im Auto könnte eine Sitzheizung sein.

Weitere Bestandteile

Als ergänzende Faktoren können auch Questionable, sowie Indifferente und Reverse Merkmale betrachtet werden.

Questionable weisen auf unlogische Antworten hin und treten auf, wenn sowohl die funktionale Frage als auch die dysfunktionale Frage positiv beziehungsweise negativ beantwortet werden.

Ein Beispiel ist die positive Einschätzung eines sowohl hohen als auch geringen Kraftstoffverbrauchs eines Autos.

Indifferente Merkmale spielen für das Kano-Modell lediglich eine untergeordnete Rolle, da das Vorhandensein oder Fehlen dieser Attribute weder positive noch negative Auswirkungen auf die Nutzungszufriedenheit hat.

Es macht beispielsweise keinen Unterschied, ob das Gaspedal eines Fahrzeugs blau oder schwarz ist.

Bei Reversen Merkmalen sorgt ein hoher Erfüllungsgrad für Unzufriedenheit bei der Kundschaft. Ein nicht Erfüllen der Attribute führt häufig, aber nicht zwangsläufig zu einer Steigerung der Kund:innenzufriedenheit.

Autos mit besonders viel Hightech und Elektronik können auch Unzufriedenheit auslösen, da beispielsweise die Bedienung als zu kompliziert empfunden wird.^{[5], [6]}

Das Kano-Modell einfach erklärt

Bessere User Experience dank Kano-Modell

Wer weiß, was die Kund:innen begeistert, kann Features bewusst einsetzen, um einen Wettbewerbsvorteil zu erlangen oder die Qualität des Produktes zu verbessern. Zudem lassen sich durch die Steigerung der User Experience unternehmerische Ziele als auch die Interessen der Kundschaft kombinieren. Das Kano-Modell ist eine geeignete Methode, um neue Konzepte, Ideen und Features zu testen und zu bewerten. Zusätzlich vermittelt es ein umfassendes Verständnis für die verschiedenen Anforderungen der Kundschaft, indem es das Verhältnis zwischen Produktanforderung und Kund:innenzufriedenheit abbildet. Kurz gesagt: durch das Kano-Modell lernen Sie die Wünsche und Ansprüche Ihrer Kund:innen kennen, welche sie gewinnbringend für die Verbesserung der User Experience Ihrer Produkte und Dienstleistungen einsetzen können.^{[7], [8]}

Überzeugt?

Sie wollen gleich loslegen und die Zufriedenheit Ihrer Kundschaft mittels Kano-Modell herausfinden? Wir haben Ihnen eine kleine Übersicht mit weiterführenden Informationen zusammengestellt.

Mehr Infos zum Thema

Richtig in die Materie einsteigen

Aufgepasst? Testen Sie sich selbst!

Quellen

Literatur

Burmeister, Michael: User Experience = Usability plus X? Online unter https://www.uid.com/de/aktuelles/user-experience-usability [Abruf am 15.11.2022]
DIN EN ISO 9241-210, Ergonomie der Mensch-System-Interaktion. Teil 210, Menschzentrierte Gestaltung interaktiver Systeme (ISO 9241-210:2019)
Richter, Michael; Flückiger, Markus (2016): Usability und UX kompakt. Produkte für Menschen. 4. Auflage. Berlin, Heidelberg: Springer Vieweg (IT kompakt)
Graser, Laura; Nirschl, Marco (2020): Steigerung der Kundenzufriedenheit durch Gestaltung von Artikeldetailseiten am Beispiel von WITT WEIDEN. Amberg-Weiden: Ostbayerische Technische Hochschule (OTH) (Weidener Diskussionspapiere, Nr. 75 (Juni 2020))
t2informatik GmbH (2022): Kano-Modell. Online unter https://t2informatik.de/wissen-kompakt/kano-modell/ [Abruf am 09.12.2022]
Legend (2021): Kano-Modell ganz einfach erklärt. Video publiziert am 14.08.2021 auf YouTube. Online unter https://www.youtube.com/watch?v=j4aJK5ThyNI [Abruf am 20.12.2022]
Pfeifer, Anne (2018): Vorteile und Nachteile der Kano-Methode. Zuletzt aktualisiert am 02.05.2018. Online unter https://usertimes.io/2018/05/02/kano-vor-und-nachteile/ [Abruf am 09.12.2022]
Rehmann, Nico (2021): Was ist User Experience? Zuletzt aktualisiert am 05.08.2021. Online unter https://www.cio.de/a/was-ist-user-experience,3661318 [Abruf am 15.11.2022]

Abbildungen

Beitragsbild und Vektorgrafiken: eigens fotografiert und erstellt mit dem Vektorgrafikprogramm Inkscape von Katharina Trommer
Noriaki Kano: ©2022 Pendo.io, Inc, http://www.mindtheproduct.com/wp-content/uploads/2013/06/noriaki-kano.jpg [Abruf am 15.11.2022]

12. Juli 202323. Juni 2023

Über der Einsatz von KI zur Musikkomposition: Der nächste Tsch(AI)kowski?

Autor: Hendrik Kuck

Komponieren mithilfe von Künstlicher Intelligenz? Zukunftsmusik oder bereits Alltag in der Musikbranche? Wie funktioniert so etwas? Und wer profitiert davon? Mögliche Antworten liefert der folgende Artikel zum Thema “Künstliche Intelligenz in der Musikkomposition”.

Inhaltsverzeichnis

Wie funktioniert Komponieren per KI?
In der Praxis
KI in der heutigen Musikproduktion
Mensch vs. KI
Kann KI Kunst?
Quellen

KI in der heutigen Musikproduktion

Künstliche Intelligenz nimmt in unserer Gesellschaft eine immer zentralere Rolle ein. Sie ist aus Wirtschaft, Medien und Technik nicht mehr wegzudenken und wird in Deutschland u.a. von der Bundesregierung gefördert.¹ Auch die Musikbranche wird nachhaltig von KI geprägt und Künstliche Intelligenz befindet sich besonders in der Musikkomposition auf dem Vormarsch.² Besonders die Komposition von Hintergrundmusik für Social Media, Werbung und Gaming wird in Zukunft von ihr dominiert.³ Aber wie funktioniert das Komponieren von Musik mithilfe von KI eigentlich? Wer arbeitet mit ihr? Steht sie in einem ethischen Konflikt mit menschlichen Musikern und Komponisten und kann sie überhaupt wirkliche Kunst erschaffen? Diesen Fragen widmet sich der folgende Artikel.

Wie funktioniert Komponieren per KI?

Damit eine KI Musik komponieren kann, muss sie zunächst für diesen Einsatzzweck trainiert werden. Sogenannte “Neuronale Netzwerke” lernen anhand großer Datenmengen (Big Data) die Struktur und Elemente vorhandener Musik. Durch ständige Analyse wird sie immer besser darin, Muster im Songaufbau zu erkennen und ist zu beachtlichen analytischen Leistungen in der Lage.⁴ Allerdings ist die derart entstandene Musik ohne menschliche Bearbeitung eher Mittelmaß. Das Verfassen von Songtexten und Einspielen der Instrumente sollte daher durch menschliche Hand erfolgen. ⁵ Künstliche Intelligenz ist deshalb eher als Werkzeug, welches die kompositorische Arbeit erleichtert, zu betrachten.⁶

Klicken Sie auf die folgende Abbildung, um selbst mit dem Komponieren loszulegen und kreieren Sie mithilfe der KI von Soundraw eigene Songs.

Roboter spielt Klavier. Verlinkung zu Musikgenerator. Künstliche Intelligenz Musikkomposition. — Laremenko Sergii/Shutterstock.com **Musikgenerator per AI von Soundraw**

In der Praxis

Die Umsetzung computergenerierter Kompositionen ist bereits Realität. Beispielsweise erschuf der Wissenschaftler David Cope mithilfe von KI Werke klassischer Musik, welche Vivaldi, Bach oder Chopin ähneln. Die Aufführung mit einem echten Orchester konnte sogar Fachpublikum täuschen.⁷ Weiterhin konnten Forscher ein neuronales Netzwerk mithilfe von 45 Songs der Beatles so lange trainieren, bis es ein eigenes Stück entwarf, welches auffällig stark dem Ursprungsmaterial ähnelte. Lediglich der Text zu dem Song “Daddy’s Car” musste von Menschen geschrieben werden.⁸

Auch private Nutzer können KI zur Musikkomposition nutzen. So bietet das Berliner Unternehmen “Loudly” auf ihrer Homepage eine eigens mit ca. zehn Millionen Songs trainierte KI an. Nutzer können somit schnell eigene Lieder generieren lassen. Sie wählen lediglich Genre, Songlänge und Instrumente aus, den Rest übernimmt die KI.⁹ Auch professionelle Künstler haben sich bereits auf die Zusammenarbeit mit Künstlicher Intelligenz beim Kreieren von Songs spezialisiert. Die Berlinerin Holly Herndon hat auf diese Weise bereits mehrere Alben veröffentlicht.¹⁰

https://open.spotify.com/artist/2c9yn5DJQd5es7YMY92ikZ?autoplay=true

Songbeispiele der Musikerin Holly Herndon

Mensch vs. KI

Mit der zunehmenden Verbreitung von Künstlicher Intelligenz in der Musikbranche treten auch vermehrt ethische Fragen auf. Verdrängt die Maschine den Menschen? Ist computergenerierte Musik überhaupt Kunst?

Dr. Ralf Weigand, Vizepräsident des Deutschen Komponistenverbandes und Vorsitzender des Aufsichtsrats der GEMA, sieht KI in der Musik mit potenziellen Nachteilen verbunden. Besonders im Bereich der Gebrauchsmusik (Hintergrundmusik für Film, Fernsehen, Social Media etc.) könne KI eine Gefahr für die Jobs der Musikschaffenden bedeuten. Zudem sorge eine Überflutung des Musikmarkts mit computergenerierter Musik eventuell dafür, dass Menschen diese Musik nicht mehr von menschengemachter unterscheiden könnten.¹¹

Rory Kenny, Gründer des eingangs erwähnten Unternehmens “Loudly”, hält dagegen. KI schaffe bereits neue Jobs wie Softwareentwickler oder Informationsspezialisten in der Musikbranche. Weiterhin ermögliche sie auch Menschen ohne Know-how die einfache und zugängliche Produktion von Musik.¹²

“Das wird eine sehr interessante weitere Demokratisierung des Musikschaffens.”

Rory Kenny¹³

Auch professionelle Kunstschaffende könnten Vorteile aus der Kooperation mit KI ziehen und Gefallen daran finden.¹⁴ Ein Beispiel hierfür ist die bereits erwähnte Holly Herndon.

Kann KI Kunst?

Auch ob Künstliche Intelligenz wahrhaftige Kunst erschaffen kann, ist umstritten. Der Neurowissenschaftler Matthias Bethge sieht KI zwar eher als Werkzeug, spricht ihr allerdings alle Merkmale menschlicher Kreativität zu. Genau wie der Mensch würde sie zunächst Erfahrungen sammeln und Strukturen analysieren, um dann auf dieser Basis etwas Neues zu schaffen. Hans-Christian Ziupa, Gewinner des KI-Musik-Wettbewerbs “Beats & Bits”, sieht jedoch einen zentralen Unterschied zwischen Mensch und KI. Zuhörer würden von Musikern erwarten, dass sie bei der Schöpfung von etwas Neuem mit sich gerungen und dabei eine gewisse emotionale Radikalität entwickelt hätten. Dies sei einer KI nicht möglich.¹⁵

Rory Kenny glaubt ebenfalls nicht an den Ersatz menschlicher Musiker durch Maschinen. Musik sei im Kern Storytelling, KI sei jedoch nicht in der Lage Geschichten zu erzählen.¹⁶ Goetz Richter, Musiker und Professor der Universität Sydney, sieht KI zudem als abhängig von Menschen und ihren Anweisungen. Es sei komplett verschieden, ob aus bereits bestehenden Werken Eigenschaften abstrahiert, oder schöpferische Werke erschaffen würden. Zu Letzterem sei KI nicht in der Lage. Musik sei kein Ergebnis reiner Analytik, sondern erfordere Neugier, Sinnfindung, Bewusstsein, gelebte Erfahrung, Aufmerksamkeit und Empathie. Dies seien alles Eigenschaften, welche Computern fehlen würden.¹⁷ Renate Buschmann, Professorin für digitale Künste der Universität Witten/Herdecke, sieht dies ähnlich. KI habe ihre Stärke im Analysieren von Mustern und dem Kopieren. Kunst sei aber eben das Brechen von Regeln und dem Erschaffen von Unberechenbarkeit.¹⁸

Eine weitere komplexe Frage in diesem Kontext ist die, nach der rechtlichen Urheberschaft künstlich komponierter digitaler Produktionen. Sowohl Nutzer der KI (Wahl der Schlagworte bei der Generierung), Künstler (Rahmen und Konzept auf welches KI zugreift), Programmierer (Entwicklung der Software) als auch die Maschine selbst (Komposition des Werkes) kommen als mögliche Urheber infrage.¹⁹ Nicht nur diese, sondern auch die oben angesprochenen Themen, werden die Musikbranche in Zukunft mit Sicherheit prägen und beschäftigen.

1 vgl. Die Bundesregierung 2020

2 vgl. Bora 2021

3 vgl. Die Bundesregierung 2020

4 vgl. Bora 2021, Die Bundesregierung 2020 und Richter

5 vgl. Die Bundesregierung 2020

6 vgl. Bora 2021

7 vgl. Richter

8 vgl. Die Bundesregierung 2020

9 vgl. Bora 2021

10 vgl. Die Bundesregierung 2020

11 vgl. Bora 2021

12 vgl. Bora 2021

13 Bora 2021

14 vgl. Buschmann 2022, S.165

15 vgl. Die Bundesregierung 2020

16 vgl. Bora 2021

17 vgl. Richter

18 vgl. Buschmann 2022, S.164-165

19 vgl. Buschmann 2022, S.169

Quellen

Bora, Tereza (2021): Kreative KI. Künstliche Intelligenz verändert die Musikbranche. Online unter https://www.br.de/nachrichten/wirtschaft/kreative-ki-kuenstliche-intelligenz-veraendert-die-musikbranche,Spb43xK [Abruf am 23.11.2022]

Buschmann, Renate (2022): Kann aus KI Kunst werden?. Dialogische Beziehungen mit Künstlicher Intelligenz. In: Schnell, Martin W.; Nehlsen, Lukas (Hg.): Begegnungen mit Künstlicher Intelligenz. Intersubjektivität, Technik, Lebenswelt. Weilerswist: Velbrück Wissenschaft, S. 164-173. Online unter: doi.org/10.5771/9783748934493

Die Bundesregierung (2020): KI spielt die Musik. Online unter https://www.bundesregierung.de/breg-de/suche/ki-in-der-kultur-1720970 [Abruf am 23.11.2022]

Richter, Goetz (o.J.): Die scheinbare Originalität von KI-Musik. Online unter https://www.goethe.de/prj/k40/de/mus/aim.html [Abruf am 23.11.2022]

Der Autor Hendrik Kuck arbeitet an der Universitätsbibliothek Osnabrück und studiert zurzeit berufsbegleitend Informationsmanagement an der Hochschule Hannover

7. Juli 202323. Juni 2023

Text-zu-Bildysnthese: Ist das nächste Kunstwerk nur noch einen Prompt entfernt?

Autorin: Annika Bleich

Inhalt

Einführung

Sei PromptkünstlerIn

Wie funktioniert Text-zu-Bildsynthese?

Dall-E und die Welt der Kunst

Promptkunst und ihre Grenzen

Ein Blick in die Zukunft

Der Beginn einer neuen Kunstepoche?

Quellen

Einführung

Zur Definition von Kunst schreibt Brockhaus: „die Gesamtheit des vom Menschen Hervorgebrachten […] zu dessen Voraussetzungen die Verbindung von hervorragendem Können und großem geistigem Vermögen gehören.“^[1] Eine KI benötigt nur ein paar Stichworte, sogenannte Prompts, und wenige Sekunden, um ein Bild zu generieren und liefert zusätzlich verschiedene Varianten.^[2] Das Ergebnis kann von unzufrieden bis überragend präzise reichen. Dies steht in Abhängigkeit zum Prompt und der jeweiligen KI.^[3]

Sei PromptkünstlerIn

Am Anfang steht nur eine Zeile und in diese gibst du ein paar Stichworte ein. Die Zeile gehört zu einer der zahlreichen meist offen zugänglichen Bildgeneratoren. Darunter zählen unter anderem Midjourney, Dall-E und Stable Diffusion. Wie sie im Einzelnen funktionieren, kann der jeweiligen Webseite entnommen werden. Was alle gemeinsam haben:

Du entscheidest über den Prompt. Deine Fantasie ist Voraussetzung für den Bildinhalt.

Nach wenigen Sekunden erhältst du in Anlehnung an deinen Prompt ein Bild. Meistens in mehreren Variationen.

Jetzt hast du ein Bild, an dem die Urheberrechte alleine dir gehören. Aber wie ist es zustande gekommen?

Wie funktioniert Text-zu-Bildsynthese?

Zunächst wird eine Trainingsdatenbank mit Millionen von Bildern mit Bildbeschreibungen benötigt.^[4] Die Bildbeschreibungen stammen unter anderem aus dem „alt“ Text, wie man ihn bei Html verwendet, um Bildinhalte zu beschreiben.^[5] Der KI wird diese Datenbank zur Verfügung gestellt, um mittels Deep Learning, einem Lernverfahren, ihr neuronales Netz zu trainieren. Das neuronale Netz stellt, in Anlehnung an die im menschlichen Gehirn befindlichen Neuronen, eine Struktur aus miteinander vernetzten Informationen dar.^[6] Es ergibt sich eine für die KI logische Verbindung zwischen Text und Bildinhalt.^[7]

Die KI nutzt einen Prozess namens „Diffusion“. Ein Muster aus zufälligen Pixeln wird soweit modifiziert, bis sich daraus ein sinnvolles Bild ergibt.^[8] Da es sich um einen zufälligen Prozess handelt, wird bei gleichbleibendem Prompt niemals dasselbe Bild entstehen.^[9]

Dall-E und die Welt der Kunst

Unter anderem befinden sich in der Trainingsdatenbank die Bilder bekannter KünstlerInnen. Du hast also die Möglichkeit, einen Prompt dazu zu verwenden, deren Technik zu imitieren. Die UrheberInnen wurden allerdings nicht gefragt, ob sie mit der Verwendung ihrer Werke in der Datenbank und dem daraus resultierenden Nachahmen ihrer Kunst, einverstanden sind. ^[10]

Einerseits wird es dir und jedem anderen ermöglicht, eure künstlerischen Ideen mit wenigen Einschränkungen zu verwirklichen, ohne zuvor jahrelang benötigte handwerkliche Erfahrung sammeln zu müssen. Andererseits gefährdet dies die Arbeit unzähliger freischaffender KünstlerInnen, deren Einkommen darauf beruht, Grafiken, Illustrationen, Fotografien, Konzepte und dergleichen zu schaffen.^[11] Das synthetische Werk von Jason Allen, der damit einen Kunstwettbewerb gewann, führte erst kürzlich zu regen Diskussionen.

Prompkunst und ihre Grenzen

Auch wenn dich nun das Promptfieber gepackt hat, im Universum der synthetischen Bilder unterliegt deine Fantasie gewissen Einschränkungen. Grundsätzlich unzulässig ist die Erstellung von illegalem, gewalttätigem, sexuell explizitem oder anderweitig unangemessenem Inhalt.^[12] Dies soll eine missbräuchliche Nutzung der KI und das Verbreiten problematischen Bildmaterials verhindern.^[13]

Die Entwickler versuchen solche Bilder unter anderem durch Wortfilter bei der Prompteingabe und durch das Filtern unangemessener Inhalte in der Trainingsdatenbank zu verhindern.^[14] Hierfür muss zunächst, beruhend auf individuellem Empfinden, definiert werden, welche Inhalte unangemessen sind.^[15] Das Filtern hat unter anderem zur Folge, dass sich, wie im Fall von Dall-E, bei den Ergebnissen eine deutlichere Tendenz zu Genderstereotypen, wie beispielsweise nur noch Bilder von männlichen Geschäftsführern, abzeichnet. ^[16]

Einen genauen Grund konnten die Entwickler für diese Tendenz nicht nennen. Unter anderem stellten sie am Beispiel des männlichen Geschäftsführers die Hypothese auf, dass, auch wenn Männer und Frauen in der ursprünglichen Trainingsdatenbank in etwa gleichmäßig repräsentiert sind, Frauen häufiger in einem sexuellen Kontext dargestellt und somit gefiltert werden. Dem so entstehenden Ungleichgewicht der Geschlechter kann unter anderem dadurch entgegen gewirkt werden, indem die gefilterte Datenbank nun mit mehr Bildern von weiblichen Geschäftsführerinnen angereichert wird.^[17]

Neben Filtern arbeiten die Entwickler der Bildgeneratoren auch an weiteren Schwierigkeiten. Dazu gehören unter anderem ein fehlendes Textverständnis der KI gegenüber bestimmten Prompts oder die teils unrealistische Abbildung von Personen oder Tieren in synthetischen Bildern.^[18]

Ein Blick in die Zukunft

„our mission of creating AI that benefits humanity“
OpenAI

OpenAI, die Entwickler von Dall-E, formulieren auf ihrer Webseite diesen ambitionierten Wunsch. Unrealistisch ist dieser Anspruch nicht. Irgendwann soll die Leistung von KIs menschenähnliches Niveau erreichen, was in vielen wichtigen Bereichen wie zum Beispiel der Landwirtschaft, Automobilindustrie oder Pflege enorm hilfreich sein wird. ^[19]

Neben Bildern kann eine KI wie NUWA-Infinity mittlerweile sogar kurze Videoclips generieren. Zwar sind diese noch lange nicht perfekt, betrachtet man jedoch allein die rasante Entwicklung in den letzten Wochen, stellt sich die Frage, ob KIs irgendwann sogar in der Lage sind, ganze Filme synthetisch zu erstellen. Eine weitere Open Source KI von OpenAi namens ChatGPT, veröffentlicht im November 2022, ist bereits dazu in der Lage, wissenschaftliche Texte auf Grundlage von Texteingaben zu formulieren. ^[20]

Der Beginn einer neuen Kunstepoche?

Bislang reicht noch längst nicht jeder Prompt für ein Kunstwerk aus. Jason Allen investierte bereits mehrere Tage Arbeit mit Unterstützung eines Bildbearbeitungsprogramms, um sein beim Kunstwettbewerb eingereichtes Bild zu kreieren.^[21] Die Gefährdung von KünstlerInnen durch Bildgeneratoren scheint zunächst zwar greifbar, aber wann die Arbeit von KIs tatsächlich menschenähnliches Niveau erreicht, bleibt vorerst eine Frage der Zeit.^[22]

Ein Blick in die Vergangenheit hilft, um zu sehen, dass zumindest eine Definition von Kunst schon immer anpassungsfähig war. Auch die Entwicklung der Fotografie wurde lange Zeit nicht als Kunst anerkannt.^[23] Und vielleicht wird eines Tages das Generieren synthetischer Bilder zu den Kunstmaßstäben einer zukünftigen Epoche gehören.

“Die Einschätzung von Kunst hängt von den Maßstäben einer Epoche und von der individuellen Sicht ab.”
Brockhaus Enzyklopädie Online

Literaturquellen

AI IMPACTS (2022): Will Superhuman AI be created? Online unter https://aiimpacts.org/argument-for-likelihood-of-superhuman-ai/ [Abruf am 10.01.2023]➝[19]

Brockhaus Enzyklopädie Online (o.J.): neuronale Netze (künstliche Intelligenz). Online unter https://brockhaus.de/ecs/enzy/article/neuronale-netze-kunstliche-intelligenz [Abruf am 10.01.2023]➝[1]➝[7]

Ford, Martin (2019): Die Intelligenz der Maschinen. Frechen: mitp Verlags GmbH & Co (mitp Professionals). Online unter https://content-select.com/de/portal/media/view/5e4ba26b-d1d4-49a1-93de-6b1fb0dd2d03 [Abruf am 10.01.2023] S. 9 ➝[6] ; S. 525 – 526 ➝[22]

Jäger, Jens (2009): Fotografie und Geschichte. Frankfurt am Main: Campus Verlag (Historische Einführungen). Online unter https://content-select.com/de/portal/media/view/519cc341-67b0-479d-9047-290f5dbbeaba [Abruf am 10.01.2023] S. 56➝[23]

Midjourney (2022): Content and Moderation. Online unter https://midjourney.gitbook.io/docs/content-and-moderation-policy [Abruf am 10.01.2023]➝[12] ➝[13] ➝[14]

Nichol, Alex (2022): Dall-E 2 Pre-Training Mitigations. Online unter https://openai.com/blog/dall-e-2-pre-training-mitigations/?itid=lk_inline_enhanced-template [Abruf am 10.01.2023]➝[16] ➝[17]

OpenAI (o.J.): Dall-E 2. Online unter https://openai.com/dall-e-2/ [Abruf am 10.01.2023]➝[8]

Rentjes, Thomas (2022): Foto-Synthese mit KI. Die Revolution der künstlichen Bilder. Online unter https://www.deutschlandfunkkultur.de/ki-technologie-revolution-kuenstliche-bilder-100.html [Abruf am 10.01.2023]➝[2] ➝[3] ➝[4] ➝[11] ➝[14] ➝[15] ➝[18] ➝[20]

Tiku, Nitasha (2022): AI can nox create any image in seconds, bringing wonder and danger. In: The Washington Post vom 22.09.2022. Online unter https://www.washingtonpost.com/technology/interactive/2022/artificial-intelligence-images-dall-e/ [Abruf am 10.01.2023]➝[10] ➝[21]

Vox (2022): The text-to-image revolution, explained. Video publiziert am 01.06.2022 auf YouTube. Online unter https://www.youtube.com/watch?v=SVcsDDABEkM [Abruf am 10.01.2023] (06:09)➝[5]; (09:35) ➝[9]

Bildquellen

Alle verwendeten Bilder stehen unter dem Copyright der Autorin © Annika Bleich (cc by-nc)

Videoquelle

tagesschau (2023): Software ChatGPT: Möglichkeiten und Grenzen künstlicher Intelligenz. Video publiziert am 12.01.2023 auf YouTube. Online unter https://www.youtube.com/watch?v=_ab6L50HlcI [Abruf am 29.01.2023]

16. Juni 202316. Juni 2023

Künstliche Intelligenz in Filmen

Autor*innen: Angelique Pál und Dennis Schmidt

Wie wird die zukünftige Welt aussehen? Das ist eine Frage mit der die Menschheit sich oft auseinandersetzt und die auch in Filmen immer wieder aufgegriffen wird. Häufig spielt dabei Künstliche Intelligenz in Filmen eine Rolle. In vielen Fällen werden Maschinen dargestellt, welche mit Künstlicher Intelligenz oder kurz KI ausgestattet, ihre Schöpfer irgendwann unterwerfen. Aus Science Fiction Filmen sind Roboter dieser Art längst nicht mehr wegzudenken, doch die technischen Voraussetzungen dafür existieren in der realen Welt (noch) nicht.

Inhaltsverzeichnis

Künstliche Intelligenz in der Wissenschaft
Geschichte der Künstlichen Intelligenz in Medien
Der Beginn von Künstlicher Intelligenz in Filmen
Terminator und Ex Machina
Filme über Künstliche Intelligenz
Weltherrschaft der Maschinen?
Quiz
Quellen

Künstliche Intelligenz in der Wissenschaft

Im Jahr 1956 wurde der Begriff “Artificial Intelligence” also Künstliche Intelligenz von einer kleinen Gruppe Wissenschaftlern, die sich am Dartmouth College in den USA trafen, eingeführt. Dieser Workshop, der auch als “Dartmouth Conference” bezeichnet wird, gilt als die Geburtsstunde der KI (vgl. Siekmann 1994, S. 20). Doch schon fünf Jahre vorher hat Alan Turing einen Test entwickelt, nachdem beurteilt werden kann, ob ein Computersystem “intelligent” ist oder nicht. Bei diesem Test, den Turing “The Imitation Game” nannte, wird mit Hilfe natürlicher Sprache getestet, ob ein Computersystem so kommunizieren kann, dass es von einem Menschen nicht mehr zu unterscheiden ist (vgl. Manhart 2022).

Die Geschichte der Künstlichen Intelligenz in Medien

Auch schon bevor es die uns heute bekannte Künstliche Intelligenz gab, wurde sich in früheren Medien mit dem Thema der lebendigen Maschine auseinandergesetzt. So wurde der Begriff der Maschine im deutschsprachigen Raum schon etwa seit dem 17. Jahrhundert verwendet und findet sich so auch im Deutschen Wörterbuch der Brüder Grimm aus dieser Zeit. Hier wurde die Maschine noch als etwas Lebloses, synthetisches mit einem Artefakten-Charakter beschrieben (vgl. Brössel 2021, S. 28). Außerdem befindet sich eine frühe Darstellung von künstlicher Intelligenz auch in dem Werk “Die Automaten” von E.T.A Hoffmann aus dem Jahr 1814 , in dem eine mechanische Puppe beginnt Fragen von Menschen zu beantworten (vgl. Brössel 2021, S. 27).

Der Beginn von Künstlicher Intelligenz in Filmen

Mit der Erfindung von Filmen verlagerte sich das Thema der lebendigen Maschine auch immer mehr ins Kino und Fernsehen. Eine frühe Darstellung von Künstlicher Intelligenz in Filmen ist z. B. die Verfilmung des Science-Fiction-Romans Metropolis. Der gleichnamige Stummfilm erschien im Jahre 1927 und zeigt eine düstere Zukunft, in der Menschen von Androiden unterdrückt werden. Für den damaligen Stand der Filmtechnik war der Film visuell sehr eindrucksvoll und zeigte unter anderen Aufnahmen von riesigen Häuserschluchten, großen Maschinen und fortschrittlichen Verkehrsmitteln. Auch beeinflusste Metropolis spätere Filme wie Blade Runner oder Matrix stark (vgl. Schreiner 2022).

Trailer zu Metropolis (1927)

Terminator und Ex Machina

Eine Filmreihe, die sich mit einer düsteren Zukunft für die Menschheit auseinandergesetzt, ist Terminator. Der große Erfolg der Terminator Filme prägt bis heute unser Bild von künstlicher Intelligenz und Robotern. Bei der in den Terminator Filmen dargestellten KI handelt es sich stets um eine bösartige Super-KI und Killer-Roboter, die als einziges Ziel die Auslöschung der Menschheit haben (vgl. Schreiner 2022). Mit aktuell 6 Filmen, welche in den Jahren 1984 bis 2019 entstanden sind, gehört die Terminator Filmreihe zu einer der bekanntesten, welche sich mit den negativen Seiten und Folgen von Künstlicher Intelligenz auseinandersetzt. Auch der Film Ex Machina aus dem Jahr 2015 behandelt das Thema der künstlichen Intelligenz und setzt sich unter anderem mit der Frage auseinander, was Bewusstsein ist und ob eine Maschine ein Bewusstsein haben kann (vgl. Schreiner 2022).
Eine Besonderheit von Ex Machina ist hierbei, dass die Künstliche Intelligenz in diesen Film nicht primär als Böse dargestellt wird, wie es z.B. in Terminator und vielen anderen Filmen der Fall ist. Sondern das in diesem Werk der Zuschauer dazu ermutigt wird, über das menschliche Wesen, menschliche Züge und die Frage, was einen Menschen von einer Künstlichen Intelligenz unterscheidet, nachzudenken (vgl. Mehnert 2016).

Filme über Künstliche Intelligenz (KI)

Blade Runner (1982)
Tron (1982)
Terminator (1984)
Matrix (1999)
I,Robot (2004)
Transcendence (2014)
Ex Machina (2014)
Avengers: Age of Ultron (2015)
Blade Runner 2049 (2017)
I am mother (2019)
Free Guy (2021)
Ich bin dein Mensch (2021)

Weltherrschaft der Maschinen?

Künstliche Intelligenz in Filmen begegnet uns häufig, aber in den seltensten Fällen wird die Handlung des Films durch sie positiv beeinflusst. Entweder sind sie nur “kindliche Maschinen” als Nebendarsteller, wie z.B. C-3PO oder aber die Künstliche Intelligenz unterjocht die Menschheit und strebt die Weltherrschaft an, wie die Superintelligenz in “I, Robot”. Doch trotz all der Forschung auf dem Gebiet der KI sind solche, in ihrem Handeln flexible Maschinen, nach heutigem Stand, nicht realistisch (vgl. Lenzen 2020, S.119).

KIs werden in hochspezialisierten Gebieten eingesetzt, in denen sie die Leistung, die ein Mensch erbringen könnte, teilweise heute schon übertreffen. Diese Art Künstliche Intelligenz nennt man schwache KI, da sie nur für eine bestimmte Aufgabe erschaffen wurde. Sobald man dieser KI komplexere Aufgaben stellt, würde sie scheitern. Im Gegensatz zu dieser schwachen KI gibt es noch die starke KI, die ähnlich wie ein Mensch, flexibel auf unterschiedliche Situationen reagieren kann (vgl. zu diesem Abschnitt Volland 2018, S.14).

Doch starke Künstliche Intelligenz existiert bis heute (noch) nicht. Es gibt die unterschiedlichsten Aussagen von Wissenschaftlern, ob und wann diese starke Künstliche Intelligenz tatsächlich entwickelt werden könnte. Dabei schwanken die Aussagen zwischen 20 und 200 Jahren oder auch nie (vgl. Lenzen 2020, S. 120). Zumindest können wir starke Künstliche Intelligenz in Filmen weiterhin bewundern. Im folgenden Abschnitt könnt ihr euer Wissen über KIs in Filmen testen. Viel Spaß!

Quiz

Quellen

Brössel, Stephan (2021): Die Anthropologie der Goethezeit und Automaten:
Ein diskursanalytischer Aufriss und eine exemplarische Analyse
von E. T. A. Hoffmanns Die Automate (1814). In: Irsigler, Ingo u.a. (Hg.): Roboter, Künstliche Intelligenz und Transhumanismus in Literatur, Film und anderen Medien. Heidelberg: Universitätsverlag Winter, S. 27 – 44

Lenzen, Manuela (2020): Künstliche Intelligenz. Fakten, Chancen, Risiken. Originalausgabe. München: C.H.Beck

Manhart, Klaus (2022): Eine kleine Geschichte der Künstlichen Intelligenz. Online unter https://www.computerwoche.de/a/eine-kleine-geschichte-der-kuenstlichen-intelligenz,3330537,2 [Abruf am 15.12.22]

Mehnert, Ann-Kristin (2016): “Ex Machina” (2015). Philosophische Betrachtungen über das (Selbst-) Bewusstsein im Spannungsfeld zwischen Mensch und Maschine. Online unter https://www.grin.com/document/322981 [Abruf am 26.12.2022]

Schreiner, Maximilian (2022): Filme über Künstliche Intelligenz: Sieben Meilensteine der KI-Filmgeschichte. Online unter https://the-decoder.de/beste-filme-kuenstliche-intelligenz/ [Abruf am 04.01.2023]

Siekmann, Jörg (1994): Künstliche Intelligenz: Von den Anfängen in die Zukunft. In: Cryanek, Günther; Coy, Wolfgang (Hg.): Die maschinelle Kunst des Denkens. Braunschweig: Vieweg, S. 11-41

Volland, Holger (2018): Die kreative Macht der Maschinen. Warum Künstliche Intelligenzen bestimmen, was wir morgen fühlen und denken. 1. Auflage. Weinheim: Beltz

10. Mai 202310. Mai 2023

Stricken und Programmieren: von 1 links/1 rechts zu 1010

Autorin: Lena-Marie Hoppe

Crafting meets Coding

Wenn Stricken und Programmieren im selben Satz erwähnt werden, dann meist zur Verbildlichung von Gegensätzen: Tradition trifft auf Moderne, analog trifft auf digital, belächelnswertes DIY-Hobby trifft auf zukunftsorientierten Skill. Es mag widersprüchlich erscheinen, doch die Jahrhunderte alte Handarbeitstechnik und Programmiersprachen haben mehr gemein, als es auf den ersten Blick vermuten lässt. Jemand sitzt stundenlang vor unzähligen Zeilen mit kryptisch anmutenden Kürzeln, oft bis tief in die Nacht hinein und an einem bestimmten Punkt stellt sich das Gefühl ein, die Arbeit einfach nur noch in die Ecke pfeffern zu wollen. Dieses Gefühl kennen sowohl Programmierer:innen als auch Strickende.

Die binäre Basis

So groß wie die Vielfalt an Programmiersprachen ist, so groß ist auch die Vielfalt an Stricktechniken und Mustern – wahrscheinlich sogar größer. Beiden ist jedoch gemein, dass sie sich jeweils auf zwei Grundbausteine zurückführen lassen: Einsen und Nullen bzw. rechte und linke Maschen. An dieser Stelle soll kein Stricktutorial folgen, doch die grundlegenden Strickbegriffe sollten für ein besseres Verständnis bekannt sein.

Eine Strickschrift ist die grafische Repräsentation eines Strickmusters mit Hilfe eines Kästchenrasters und Symbolen für die verschiedenen Maschenarten. Der binäre “Übersetzung” ist im Vergleich komplexer.

Strickarbeiten können in Reihen oder Runden angefertigt werden. Die Strickrichtung verläuft dabei von rechts nach links. Eine Reihe oder Runde besteht aus Maschen, die während der Arbeit auf der Stricknadel liegen. Rechte Maschen bilden oft die Vorderseite des Gestricks und sehen aus wie “V”s. Sie bilden eine glatte Oberfläche. Linke Maschen erzeugen dagegen kleine Knötchen, wenn sie einzeln auftauchen, bzw. eine Wellenstruktur in der Fläche.

Rechte und linke Maschen sind die Einsen und Nullen des Strickens: Auf ihnen bauen alle weiteren Techniken auf.

Außer rechten und linken Maschen gibt es noch viele weitere Techniken, etwa Ab- und Zunahmen, um das Gestrick zu formen oder dekorative Elemente wie Zöpfe, Umschläge oder tiefer gestochene Maschen. Sie alle beruhen jedoch auf den rechten und linken Maschen, mit denen sich komplette Strickstücke inklusive komplexer Strukturmuster stricken lassen.

Genau dieses Strukturmuster mit binärer Basis sind es, die das Stricken zum perfekten Nachrichtenmedium gemacht haben, lange bevor es ausgefeilte digitale Chiffrier- und Dechriffiertechnologien gab. Selbstverständlich war der Wollpullover mit Noppenmuster nicht der Vorläufer der E-Mail. Besonders in Kriegszeiten hat das Stricken jedoch eine wichtige Rolle beim verschlüsselten Sammeln und Weitergeben von Informationen gespielt.

Steganografie: gestrickte Geheimbotschaften

Eine ältere Dame sitzt am Fenster und strickt. Von ihrem Platz hat sie einen guten Blick auf die Züge, die nicht weit von ihrem Haus entfernt vorbeifahren. Eigentlich eine idyllische Vorstellung, wenn es sich dabei nicht um Kriegsgerät der deutschen Besatzer und eine französische Spionin während des Ersten Weltkrieges handeln würde. Als Spion gilt es unauffällig zu sein, keine Aufmerksamkeit zu erregen. Doch das Stricken ist nicht nur Teil der Tarnung. Die Strickware selbst kann zur geheimen Botschaft werden, indem ein Code in die Maschen eingebaut wird. Diese Form der Steganografie, die verborgene Übermittlung von Informationen, kam sowohl im Ersten als auch im Zweiten Weltkrieg zum Einsatz.

“Drop one for a troup train, purl one for an artillery train” – so lautet es in der BBC-Dokumentation MI6: A Century in the Shadows, also eine Masche fallen lassen für einen Truppenzug, eine linke Masche stricken für einen Artilleriezug. Man kann davon ausgehen, dass statt “drop one” hier eher ein Umschlag gemeint ist, der zwar ein Loch erzeugt, aber das Gestrick nicht weiter auflöst. Den Militärhistorikern sei an dieser Stelle ihre Strickunkenntnis verziehen. Wie gut, dass die richtige Spionagearbeit den älteren Damen überlassen wurde …

Eine noch naheliegendere Form der Informationsübermittlung mittels Gestrick ist der Einbau von Morsebotschaften. Die erhabene Struktur der linken Maschen ist ideal, um mit ihnen Strich- und Punktkombinationen nachzubilden. Für das ungeübte Auge wirken sie dabei lediglich wie ein Strukturmuster, besonders, wenn der eigentliche Code durch andere Musterelemente kaschiert wird.

Es ist jedoch nicht nur das Gestrick an sich, das als steganografisches Medium genutzt werden kann. Der Mix aus Kürzeln und Ziffern bietet sich gerade dafür an, verschlüsselte Informationen darin zu verstecken. Aus diesem Grund haben sowohl die USA (im Zweiten Weltkrieg) als auch Großbritannien (im Ersten Weltkrieg) den Auslandsversand von Strickanleitungen verboten. Die durch Abkürzungen bestimmte Form von Strickanleitungen lassen sie für Außenstehende nahezu unverständlich wirken – ganz so wie Programmcode …

Seiten: 1 2

10. Mai 202315. Juni 2023

Wie werde ich ein Citizen Scientist? – Der Leitfaden für Einsteiger

Autor*innen: Mandy Tanneberger und Andreas Schlüter

Lesezeit: 6 Minuten

Sie interessieren sich für Citizen Science,
wissen aber nicht wie Sie anfangen können? Keine Angst!
Dieser Leitfaden soll Ihnen den Einstieg erleichtern.

Das erwartet Sie in diesem Blogbeitrag

Was ist Citizen Science überhaupt?

Wer kann ein Citizen Scientist werden?

Wie kann ich als Citizen Scientist aktiv werden?

1. Schritt – Ein Projekt finden

2. Schritt – Vorbereitung

3. Schritt – Starten

Wieso brauchen wir Citizen Science?

Wo findet Citizen Science statt?

Quiz Citizen Science

Was ist Citizen Science überhaupt?

Eine einheitliche Definition des Begriffes gibt es nicht, die deutschsprachige Wikipedia liefert einen guten und verständlichen Überblick.

“Mit Citizen Science (auch Bürgerwissenschaft oder Bürgerforschung) werden Methoden und Fachgebiete der Wissenschaft bezeichnet, bei denen Forschungsprojekte unter Mithilfe von oder komplett durch interessierte Laien durchgeführt werden. Sie formulieren Forschungsfragen, recherchieren, melden Beobachtungen, führen Messungen durch, publizieren oder werten Daten aus.” ^[1]

Video: Peter Barczewski©, 3D-Artstudio Leipzig und Anett Richter

Wer kann ein Citizen Scientist werden?

Kurz und knapp: Jede*r von uns kann ein Citizen Scientist werden. In der Regel startet alles mit einer Frage, die Sie nicht mehr loslässt oder dem Wunsch selbst wissenschaftlich aktiv zu werden. Dabei ist es vollkommen egal, um welche Thematik es sich handelt. Sie können sich beispielsweise mit dem Schutz der Meere^[2], dem Bienensterben^[3] oder den Auswirkungen der Corona-Pandemie^[4] beschäftigen. Haben Sie sich für eine Thematik entschieden, gilt es einen möglichen Erkenntnisgewinn für die Forschung zu definieren und anschließend mit Ausdauer und persönlichem Engagement seine Ziele zu verfolgen. Sie können in einem bestehenden Projekt mitwirken oder eigene Wissenschaft betreiben. Es kann sich lohnen Mitstreiter für ihr Projekt zu begeistern und anzuwerben. Hierfür spielt es keine Rolle, ob sie bereits über Erfahrung in der wissenschaftlichen Arbeit verfügen oder sich einfach gesellschaftlich engagieren wollen.^[5]

Alle Kinder sind geborene Wissenschaftler, bis wir es ihnen austreiben. Nur ein paar wenige sickern mit intakter Neugier und Begeisterung für die Wissenschaft durch das System.

Carl Sagan

Wie kann ich als Citizen Scientist aktiv werden?

1. Schritt – Ein Projekt finden

Die Wege um als Citizen Scientist aktiv zu werden sind vielfältig. International gibt es zahlreiche Forschungsprojekte die nach freiwilligen Mitwirkenden suchen. Eine aktuelle Übersicht der in Deutschland stattfindenden Bürgerwissenschaft finden Sie auf den folgenden Seiten:

Projekte entdecken | Bürger schaffen Wissen (buergerschaffenwissen.de)

citizen_science_germany_projekte (citizen-science-germany.de)

Dort können Sie ein zu ihren Interessen passendes Projekt finden oder nach Inspiration für eigene Ideen suchen.

2. Schritt – Vorbereitung

Haben Sie erstmal ein spannendes Vorhaben gefunden, gilt es nicht vorschnell zu Handeln und in Ruhe zu konzipieren, was für die Umsetzung benötigt wird. Dazu zählt beispielsweise:^[6]

Erstellung eines Protokolls für die anfallenden Daten
Wichtige Fragen des Projekts klären (Zielstellung, Verfahren, Art der Beteiligung)
Rechtliche Handhabe im Bezug auf Datenerfassung-/Speicherung
die eigene Rolle definieren

3. Schritt – Starten

Aller Anfang ist schwer, aber es lohnt sich! Denken Sie immer daran: Citizen Science ist keine Raketentechnik! In erster Linie soll es Ihnen Freude bereiten. Seien Sie offen für diese neue Erfahrung. Trauen Sie sich, Fragen zu stellen. Es gibt in jedem Projekt Personen, die Einsteigern helfen können und wollen! Suchen Sie sich einen Mentor oder eine Mentorin, knüpfen Sie Kontakte. Und wer weiß, vielleicht werden Sie auch selbst bald zur gefragten Personen. Teilen Sie Ihr Wissen.

Hier finden Sie hier Antworten und Unterstützung:

Netzwerk und Arbeitsgruppen | Bürger schaffen Wissen (buergerschaffenwissen.de)

Zum Schluss noch ein kleiner Anreiz: Ihre Arbeit kann sogar finanziell honoriert werden. Im Rahmen des Citizen-Science-Wettbewerbes werden in Deutschland besonders gelungene Projekte ausgezeichnet und erhalten ein Preisgeld von 50.000€. Jeder kann sich und sein Projekt bewerben^[7] . Also los geht’s!

Wieso brauchen wir Citizen Science?

Citizen Science… das klingt so großstädtisch, so modern. So gar nicht nach der dörflichen Abgeschiedenheit mit ihrem quälend langsamen Internet oder den in Ballungsräumen kaum bekannten Funklöchern.

Brauchen wir wirklich Bürgerwissenschaften? Für die Forschung sind doch Universitäten und diverse Forschungsgesellschaften zuständig? Mehrere Gründe sprechen für die Wichtigkeit von Citizen Science und die Beteilung von Bürgerwissenschaftler:innen.

Zum einen profitiert die Wissenschaft selbst von den Bürgerwissenschaften. Wissenschaftler und Forscher können gar nicht alle benötigten Daten selbst erfassen und auswerten. Denken Sie an die unglaubliche Menge beobachteter und gezählter Vögel beim “bird count”! ^[8]

*Menschengruppe beim Christmas Bird Count im Lee Metcalf National Wildlife Refuge.*

Ausserdem entsteht ein gesamtgesellschaftlicher Nutzen. Die Wissenschaft wird ermutigt, den sprichwörtlichen Elfenbeinturm zu verlassen. Die Bevölkerung kann ihrerseits einen Beitrag zur Wissenschaft leisten. Dabei kommt es geradezu zwangsläufig zum Austausch zwischen allen Beteiligten.

Und natürlich haben auch Sie als Bürgerwissenschaftler selbst etwas von der Teilnahme. Sie leisten einen aktiven Beitrag zu wissenschaftlicher Forschung. Sie selbst können Forschungsfragen definieren und wissenschaftliche Ergebnisse auch kritisch hinterfragen.

Wo findet Citizen Science statt?

Aber muss Citizen Science überhaupt zwingend im digitalen Raum stattfinden? Schaut man sich die Liste der Projekte auf der Internetseite “Bürger schaffen Wissen” an, kann schon der Eindruck entstehen, dass hier ohne Smartphone und internetfähigem PC nur wenig geht.

Aber der Eindruck täuscht. Denn oft müssen nur die finalen Ergebnisse elektronisch per App übermittelt werden. Ein Großteil der eigentlichen Arbeit kann gänzlich analog stattfinden. Oft verlangen Citizen Science Projekte nämlich vor allem eines: Geduld. Das folgende Bild zeigt sehr eindrucksvoll, dass Bürgerwissenschaften auch eine sehr praktische Komponente beinhalten kann. Es werden zum Beispiel Rezepte nachgekocht, die vorher aus einem handgeschriebenen Kochbuch mühsam transkribiert worden sind.^[9] Neben einer Transkription finden Sie auf den Internetseiten des Volkskundemuseums Wien auch ein Glossar für die heute nicht mehr gebräuchlichen Begriffe. Und beim Kochen spielen weder Internet noch Smartphone eine Rolle. Hier geht es um praktische Fähigkeiten.

*Handschriftlich verfasstes Kochbuch aus dem 18. Jahrhundert, Volkskundemuseum Wien.*

Quiz Citizen Science

Sie haben den Artikel gelesen und das Video gesehen? Testen Sie jetzt Ihr Wissen zu den Bürgerwissenschaften.

Sie sind mit dem Ergebnis noch nicht ganz zufrieden? Lesen Sie doch noch einmal den Abschnitt zur Definition von Citizen Science.

Informationen über die Autor*innen

Mandy Tanneberger
Universitätsbibliothek Leipzig (@ubleipzig) / Twitter

E-Mail: tanneberger@ub.uni-leipzig.de

Andreas Schlüter
Herzogin Anna Amalia Bibliothek (@DirektorHAAB) / Twitter

E-Mail: andreas.schlueter@klassik-stiftung.de

Quellenverzeichnis

Fußnoten

¹ Wikipedia 2022

² Vgl. Pham 2018

³ Vgl. Bundesministerium für Bildung und Forschung 2019

⁴ Vgl. Forschung und Lehre 2020

⁵ Vgl. Bürger schaffen wissen (o.J.)

⁶ Vgl. Wissenschaftskommunikation (o.J.)

⁷ Vgl. Jördens 2022

⁸ Vgl. Audubon 2022

⁹ Vgl. Paukner 2019

Literaturverzeichnis

Audubon (2022): Join the Christmas Bird Count. You can add to a century of community science by joining a count near you. Online unter Join the Christmas Bird Count | Audubon [Abruf am 29.12.2022]

Bundesministerium für Bildung und Forschung (2019): Dem Bienensterben auf der Spur. Zuletzt aktualisiert am 12.07.2019. Online unter Dem Bienensterben auf der Spur – BMBF [Abruf am 15.12.2022]

Bürger schaffen wissen (o.J.): Ein Citizen-Science-Projekt starten. Auswahl der Partnerinnen und Partner, Methoden und Beteiligten. Online unter Ein Citizen-Science-Projekt starten: Auswahl der Partnerinnen und Partner, Methoden und Beteiligten | Bürger schaffen Wissen (buergerschaffenwissen.de) [Abruf am 24.12.2022]

Forschung und Lehre (2020): Tausende Bürger teilen Pandemie-Erfahrungen im “Coronarchiv”. Zuletzt aktualisiert am 17.09.2020. Online unter Citizen Science: Tausende Bürger teilen Pandemie-Erfahrungen im “Coronarchiv” – Forschung & Lehre (forschung-und-lehre.de) [Abruf am 18.12.2022]

Jördens, Linn Merle (2022): Auf die Plätze. Citizen Science in deiner Stadt. Zuletzt aktualisiert am 20. Oktober 2022. Online unter Herzlichen Glückwunsch! Drei ausgezeichnete Projekte gehen an den Start | Auf die Plätze! (citizenscience-wettbewerb.de) [Abruf am 27.12.2022]

Paukner, Sabine (2018): “Kaiser Gerstel, Kapauner Würstel und Schnee Baalen”. Citizen Scientists transkribieren historische Kochrezepte. Online unter Volkskundemuseum – Citizen Scientists-Projekt 2017/18 im Volkskundemuseum Wien [Abruf am 03.01.2023]

Pham, Thuy (2018): Im Namen der Wissenschaft. Sieben Citizien Science-Projekte, bei denen auch du mitmachen kannst. Zuletzt aktualisiert am 24.09.2018. Online unter Im Namen der Wissenschaft: 7 Citizen Science-Projekte, bei denen auch du mitmachen kannst (zeitjung.de) [Abruf am 31.12.2022]

Wikipedia (2022): Citizen Science. Online unter Citizen Science – Wikipedia [Abruf am 29.12.2022]

Wissenschaftskommunikation (o.J.): Citizen Science (Bürger*innenwissenschaft). Online unter Citizen Science (Bürger*innenwissenschaft) – Wissenschaftskommunikation.de [Abruf am 01.01.2023]

Bildquellen

Beitragsbild: Testing out their binoculars and looking for birds. Photo Credit: Jennifer Jewett / USFWS;
Lizenz: Namensnennung 2.0 Generic (CC BY 2.0), Änderungen von A. Schlüter

Video: Was ist Bürgerwissenschaft? Youtube-Kanal der Helmholtz Gemeinschaft;
Lizenz: ©Peter Barczewski, 3D-Artstudio Leipzig und Anett Richter

Abbildung 1: Kinder und Citizen Science: Shutterstock / Photodiem;
Lizenz: Lizenzfrei

Abbildung 2: Logo Bürger schaffen wissen: Bürger schaffen Wissen | Wissenschaft im Dialog (wissenschaft-im-dialog.de);
Lizenz: Genehmigt durch Inhaber / Digitale Pressemappe

Abbildung 3: Christmas Bird Count at Lee Metcalf National Wildlife Refuge. Photo Credit: Bob Danley / USFWS/ 21.01.2011;
Lizenz: Namensnennung 2.0 Generic (CC BY 2.0)

Abbildung 4: Handschriftlich verfasstes Kochbuch. Foto: Birgit&Peter Kainz, faksimile digital;
Lizenz: Namensnennung – Nicht-kommerziell – Weitergabe unter gleichen Bedingungen 4.0 International (CC BY-NC-SA 4.0)

27. Januar 2023

Projektarbeit: H5P für interaktive Lernressourcen

Autor:innen: Katharina Deymann, Alisa Held, Katharina Kroupa, Yannick Pollmann, Friederike Roth, Luise Scheiding, Nathan Scheulen, Madeleine Schütz und Marieke Tödter

In ihrer Projektarbeit haben sich neun Studierende des 6. Semesters im Studiengang Informationsmanagement berufsbegleitend damit befasst, wie bestehende Lernressourcen didaktisch sinnvoll mit H5P angereichert werden können.

Insgesamt wurden der Projektgruppe digitale Lerninhalte aus sechs unterschiedlichen Moodle-Kursen unterschiedlicher Dozent:innen und Fachmodule bereitgestellt.

Diese Lernressourcen wurden im Zuge des Projekts mit H5P interaktiver gestaltet. Durch H5P können Lerninhalte dank interaktiver Elemente so aufbereitet werden, dass den Lernenden eine intensivere Auseinandersetzung mit den Inhalten ermöglicht wird, die zu einem tieferen Erkenntnisgewinn führen soll. Die Open Source Software H5P (HTML5 Package) ermöglicht es, im Browser interaktive Lerninhalte (interaktive Videos, Quizze, etc.) zu erstellen und plattformunabhängig zu teilen und nachzunutzen. Dabei kann es als Plugin z.B. in LMS wie in Moodle oder in Content Management Systemen (CMS) wie WordPress eingebunden werden.

Das Endziel des Projekts ist, die bereitgestellten Studienmaterialien in Anlehnung an die Lernziele nach Bloom’s Digital Taxonomy so aufzubereiten, dass sie als Open Educational Ressources (OER) unter einer CC-BY-3.0-Lizenz veröffentlicht werden können.

Einzelheiten und Ergebnisse zum Projekt sowie eine sehr hilfreiche Übersicht aller H5P Inhaltstypen samt Zuordnung des Bloomschen Levels, Priorität und dem möglichen Einsatzbereich befindet sich als Anhang im Bericht:

H5P-Projekt-Gesamtkonzept_Steinberg Herunterladen

Die mit H5P aufbereiteten Lernressourcen sind im TestWebLab einzusehen.

12. Juli 202215. Juni 2023

Ins Stammbuch geschrieben: Kodiert mit der Auszeichnungssprache TEI

Autorin: Janica Kuhr

Wie kodiere ich einen Stammbucheintrag mit XML-TEI und welchen Nutzen hat die Anwendung dieser Mark-Up-Language bei der Erschließung des Eintrags für die Forschung? Mit diesen Fragen befasst sich dieser Beitrag.

Inhalt

Was ist ein Stammbuch?
Was ist TEI?
Kodierung des “Werther-Stammbuchs” mit TEI
- Kodierung des Stammbucheintrags von Christian Albrecht von Kielmannsegg
  - Auszeichnung der Widmungspassage
  - Auszeichnung der Textpassage
- Kodierung des Stammbucheintrags von Dietz Kays
  - Auszeichnung der Bildbeigabe
  - Auszeichnung der Textkomponente
Ausblick

1. Was ist ein Stammbuch?

Zum Abschied bekam ich ein Album Amicorum – in Holland, Deutschland und in den skandinavischen Ländern ist das eine beliebte Sitte. Man geh mit diesem Buch zu einem Freund, der etwas Selbsterfundenes hereinschreibt oder einen Ausspruch irgendeines Autors, und seinen Namen daruntersetzt; wenn er kann, zeichnet er noch etwas hinzu. So hat man etwas mit dessen Hilfe man sich an seine Freunde erinnern kann. Keine schlechte Idee, aber auch ein bisschen skurril.¹
James Boswell

Den meisten von Ihnen dürfte der von James Boswell 1764 in seinem Journal beschriebene Brauch aus Kindheitstagen bekannt sein, denn beim hier erwähnten Album Amicorum – auch Stammbuch genannt -, handelt es sich um ein frühes Poesiealbum. Im Gegensatz zu heute waren jedoch meist Erwachsene, die als Stammbuchhalter bezeichnet werden, die Besitzer dieser Alben, die sie auch auf Reisen mit sich trugen.

Entstanden ist diese Tradition Mitte des 16. Jahrhundert in Wittenberg, als es Mode wurde, die Autographen der Reformatoren um Luther zu sammeln. Anfangs vor allem unter Studenten Anklang findend, waren die Stammbücher später in fast allen Gesellschaftsschichten beliebt und erfreuten sich im Besonderen in Deutschland bis Mitte des 20 Jahrhunderts gesellschaftlicher Wertschätzung. ²

Stammbücher können in verschiedenen Disziplinen als wertvolle Quelle dienen. So geben sie Auskunft über die Studienorte und Reiserouten sowie die sozialen Netzwerke ihrer Eigentümer. ³

Ferner lassen sich Rückschlüsse über die Alltagskultur ziehen und sie fungieren als Zeugnisse der Wissenschaftsgeschichte und Literaturhistorie. Für Sprachwissenschaftler sind die Alben inbesondere wegen der Vielfalt der Sprachen, in denen die Beiträge verfasst sind, von Interesse.⁴

Viele Bibliotheken und Archive sind heute im Besitz von Stammbüchern. Die weltweit größte Sammlung stellt die der Herzogin Anna Amalia Bibliothek mit über 1900 dieser Freundschaftsbücher dar.

Zentral für die Einrichtungen ist es dabei, die Erforschung ihrer Sammlungen zu ermöglichen. Doch wie soll das realisiert werden? Neben der zunehmenden Digitalisierung rückt auch eine tiefergehende Erschließung der Alben in den Fokus. So kann beispielsweise im Katalog der Herzogin Anna Amalia Bibliothek seit einiger Zeit nach Einträgen, Einträgern, Erscheinungsorten und Erscheinungsjahren der Stammbücher recherchiert werden. Die UB Tübingen wiederum stellt Transkriptionen ihrer Freundschaftsbücher zur Verfügung, die mit TEI kodiert wurden.

2. Was ist TEI?

TEI, kurz für “Text Encoding Initiative”, ist ein Dokumentenformat, das auf der Markup-Language XML basiert und der Auszeichnung von Texten dient. Beschrieben wird es in den TEI Guidelines. Neben dem Markup von textgestalterischen bzw. strukturellen Elementen, wie beispielsweise Absätzen, Zeilenumbrüchen oder der Position einer Illustration, können auch semantische Auszeichnungen vorgenommen werden. Hierzu zählt etwa die Kennzeichnung von Personennamen oder Orts- und Datumsangaben. TEI stellt heute den De-facto-Standard bei der Textkodierung dar und kommt daher bei der Erstellung von Digitalen Editionen regelmäßig zum Einsatz.⁵

Während jedoch beispielsweise mit TEI erstellte Briefeditionen häufiger vorkommen, sind – mit Ausnahme des Tübinger Projekts – mittels TEI kodierte Stammbucheinträge bislang sehr rar gesät.

3. Kodierung des “Werther-Stammbuchs” mit TEI

Welche Vorzüge die Kodierung von Stammbucheinträgen mit TEI für die Forschung mit sich bringt und wie bei der Auszeichnung vorgegangen werden kann, soll daher nachfolgend exemplarisch anhand TEI-kodierter Eintragungen aus dem auch als „Werther-Stammbuch“ bezeichneten Album von Ludwig Schneider (1750-1826), einem Juristen, veranschaulicht werden.

Abbildung 1: Titelseite des “Werther-Stammbuchs”
. © Freies Deutsches Hochstift / Frankfurter Goethe-Museum, Hs-31210/Stb. 92

Den inoffiziellen Titel “Werther-Stammbuch” trägt es, da es einen deutlichen Bezug zu Goethes Aufenthalt in Wetzlar im Sommer 1772 aufweist, als dieser die Bekanntschaft mit Charlotte Buff, dem Vorbild für Werthers Lotte sowie deren Verlobten Johann Christian Kestner machte. Von allen drei Personen finden sich Einträge im Stammbuch.⁶

Kodierung des Stammbucheintrags von Christian Albrecht von Kielmannsegg

Abbildung 2: Stammbucheintrag von Christian Albrecht von Kielmannsegg. © Freies Deutsches Hochstift / Frankfurter Goethe-Museum, Hs-31210/Stb. 92

Wie auch anhand der von Christian Albrecht von Kielmannsegg, ebenfalls Jurist und Jugendfreund Goethes, gestalteten Seite (Abbildung 2) deutlich wird, weisen Stammbucheinträge, die als Inskriptionen bezeichnet werden, typischerweise eine Zweiteilung auf. Auf eine im weiteren Sinn poetische Textpassage folgt in der Regel eine Widmungspassage, die aus immer wiederkehrenden Strukturelementen besteht.

Auszeichnung der Widmungspassage

Unter „Adressierung“ fallen alle Elemente, die Informationen über den Stammbuchhalter enthalten. Je nach Charakter der Beziehung kann hier die namentliche Nennung variieren. Des Weiteren kann sie durch Statusangaben angereichert werden.⁷

Die Elemente der „Motivierung“ und „Charakterisierung“ sind oftmals nur schwer voneinander abzugrenzen, da sie häufig fließend ineinander übergehen. Während die Komponente der Motivierung den Fokus auf den Schreibanlass legt, definiert sich die Charakterisierung dadurch, dass auf die vorangegangene Textpasssage zurückverwiesen wird. Der Stellenwert des Textteils wird hervorgehoben und Aussagen über seine Funktion getroffen.⁸

Den Abschluss der Passage bildet in der Regel eine sogenannte Sprachhandlungsformel, die das Verfassen des Stammbucheintrags meist als „schenken“, „widmen“, „sich empfehlen“, näher definiert.⁹

Dieser charakteristische Aufbau lässt sich durch TEI nachbilden. Wie das Codebeispiel zum Eintrag von Kielmannsegg zeigt, wurde der eigentliche Text als <div> (Textabschnitt) getaggt, während die Widmungspassage mit dem Element <closer> ausgezeichnet wurde, das aus der Briefedierung stammt.

[C]loser> fasst Grußformeln, Datumszeilen und ähnliche Phrasen zusammen, die am Ende eines Abschnitts stehen.¹⁰

   </teiHeader>
   <text type="Stammbucheintrag">
      <body>

         <div type="Dramenverse">
            <cit>
               <quote xml:id="Fußnote1">
                  <l>Am be&#383;ten i&#383;t, und wahr&#383;ten der mein Freund,</l>
                  <l>Der warm, nicht heiß das Gute, das ich habe;</l>
                  <l>Der &#383;treng nicht, doch genau den Fehl auch &#383;ieht.</l>
                  <l>Hat die&#383;er Freund ein Herz der Redlichen,</l>
                  <l>So liebt er mich, wie ich geliebt mag &#383;ayn.</l>
               </quote>
               <bibl>
                  <author ref="http://d-nb.info/gnd/118563386" rend="underlined"
                  >Klopstock</author>.</bibl>
            </cit>
         </div>
         <closer>
            <salute rend="right"><seg type="Adressierung">dem Herrn Be&#383;itzer die&#383;es
                  Buchs</seg>
               <seg type="Schreibhandlungsformel">em-<lb/>pfiehlt &#383;ein Andenken be&#383;tens
                  und gehor&#383;am&#383;t.</seg></salute>
            <signed rend="right">
               <persName ref="http://d-nb.info/gnd/116157372"><forename><choice>
                        <abbr>C.</abbr>
                        <expan>Christian</expan>
                     </choice></forename><surname> Kielmannsegg</surname></persName> aus <placeName
                  ref="http://d-nb.info/gnd/4038197-3">Meklenburg</placeName></signed>
            <dateline rend="left"><placeName ref="http://d-nb.info/gnd/4065878-8"
                  >Wetzlar</placeName>, den <date when="1773-05-16">16ten May 1773</date></dateline>
         </closer>

      </body>
      <note type="editorial" target="#Fußnote1">Die Verse wurden dem Trauerspiel <name type="work"
            >David.Ein Trauerspiel</name> von <persName ref="http://d-nb.info/gnd/118563386"
               ><forename>Friedrich Gottlieb</forename><surname> Kloppstock</surname></persName>
         entnommen.</note>
   </text>
</TEI>

Innerhalb dieses Abschnitts wiederum wurden die Adressierung und Sprachhandlungsformel näher spezifiziert. Zunächst wurden sie durch das Element <salute> als Bestandteil der Grußformel ausgewiesen und anschließend anhand des <seg>-Elements (Segment) in Verbindung mit dem type-Attribut eindeutig als Addressierung (<seg type=”Adressierung”) bzw. Schreibhandlungsformel (<seg type=”Schreibhandlungsformel”) gekennzeichnet.

Als problematisch kann sich in diesem Zusammenhang die Tatsache erweisen, dass XML keine Überlappungen zulässt. So ist es grundsätzlich möglich, dass Textteile sowohl Bestandteil der Motivierung als auch der Charakterisierung sind und sich darüber hinaus gleichzeitig der Sprachhandlungsformel zuordnen lassen. Als pragmatische Lösung hierfür bietet sich jedoch an, nur die jeweils charakteristischen Worte den entsprechenden Bestandteilen der Widmung zuzuordnen.

Der Name bzw. die Unterschrift des Einträgers wird als <signed> (Unterschrift) getaggt und als <persName> – unterteilt in <fore- und surname> – erfasst, während Orts- und Datumsangabe zunächst unter <dateline> zusammengefasst und dann durch <placeName> bzw. <date> gekennzeichnet werden. Durch die Verwendung des when-Attributs in Verbindung mit <date> wird das Datum zusätzlich noch in maschinenlesbarer und normierter Form aufgenommen. Das <signed>-Element dient dazu, dass der Name des Einträgers später eindeutig maschinell herausgefiltert werden kann, da an mehreren Stellen im Stammbucheintrag Personennamen in unterschiedlichen Funktionen vorkommen können. Eine Besonderheit stellt hier die Auszeichnung des Namens dar. Kielmannsegg hat seinen Vornamen mit C. abgekürzt, was durch das Element <abbr>, Abbrevation kodiert wird. TEI lässt es jedoch zu, durch das Element <expan> (Expansion) gleichzeitig den ermittelten, vollen Namen anzugeben.

Auch ein weiterer großer Vorteil der Verwendung von TEI wird in diesem Zusammenhang deutlich. So ist es durch das ref-Attribut möglich auf Normdaten zu referenzieren. Konkret wurde hier mittels des Attributs bei <persName> der GND-Eintrag des Verfassers Christian Kielmansegg verlinkt. Auch bei den Entitäten Eintragungsort und Herkunftsort des Verfassers, ebenfalls durch <placeName> ausgezeichnet, wurde ein Link zum GND-Eintrag aufgenommen.

Neben der eindeutigen Identifizierung kann diese Erfassung der Normdaten der Erforschung und Visualisierung von Personennetzwerken oder der Sichtbarmachung der Wege und Aufenthaltsorte des Stammbuchhalters sowie der Einträger dienen.

Dazu ein Beispiel aus der Goethe-Forschung: Lange ging man davon aus, dass Johann Caspar Goethe, der Vater des berühmten Dichters, zu einem bestimmten Zeitpunkt Berufspraxis in Wien sammelte, da er dies in einem Bittgesuch an Kaiser Karl zu Protokoll gegeben hatte. Anhand von zwei Stammbucheinträgen konnte man jedoch nachweisen, dass er tatsächlich aber -mutmaßlich im Rahmen einer Bildungsreise – in Augsburg weilte und auch, dass er nicht alleine reiste, da sich eine weitere Person, Johann Georg Cocceji, jeweils am selben Tag wie Goethe in beide Stammbücher eintrug. ¹¹

Die Position der Grußformel und Datumszeile auf der Seite, die sich in vielen Stammbucheinträgen wiederfindet, lässt sich durch das Attribut rend=”right” oder rend=”left” ausdrücken, z. B. <dateline rend=”left”>.

Auszeichnung der Textpassage

Werfen wir nun einen Blick auf die der Widmung vorangestellte Textpassage. Typischerweise besteht diese aus wenigen Gedichtversen oder knappen Prosatexten, die zum Nachdenken angeregen, Einsichten vermitteln oder an das Befolgen bestimmter Maxime appellieren.¹² Im Regelfall handelt es sich dabei um bereits bestehende Texte, die wortgenau oder leicht verändert, mit oder ohne Angabe des Urhebers, zitiert werden.¹³

Auch Kielmansegg bedient sich eines bereits vorhandenen Textes. So zitiert er ein Werk Friedrich Gottfried Kloppstocks. Der Zitatcharakter des Elements wurde durch das Element <quote> deutlich gemacht.

Da der Einschreiber außerdem Kloppstock als geistigen Schöpfer angegeben hatte, wurden diese Quellenangabe und das Zitat zusätzlich durch das Elternelement <cit> (cited quotation) ausgezeichnet. So heißt es in den TEI:

Dabei wird der gesamte Zitatblock, inklusive Zitat und Quelle, mit dem dafür vorgesehenen <cit>-Element umschlossen. Die Quellenangabe wird mit dem <bibl>-Element kodiert, das […] unstrukturierte bibliografische Angaben repräsentiert.¹⁴

Innerhalb der Quellenangabe wurde Kloppstock mit <author> getaggt und der GND-Normdatensatz verknüpft. In einem editorischen Stellenkommentar <note>, der über eine xml:ID und das Attribut target mit der referenzierten Passage verknüpft ist, können zusätzliche Informationen zum Text festgehalten werden. In diesem Fall wurde darauf hingewiesen, dass die Verse dem Trauerspiel “David” von Kloppstock entnommen sind.

Das Zitat wiederum wurde zusätzlich mit dem Element <div> ausgezeichnet , was erst einmal recht allgemein für Textabschnitt steht. Durch die Verwendung des Attributs type, konnte jedoch eine Aussage über die Gattungszurordnung, hier type=”Dramenverse” getroffen werden.

An dieser Stelle wird deutlich, dass die TEI-Kodierung nicht nur in Bezug auf die personengeschichtliche Forschung, sondern auch im Hinblick auf die in den letzten Jahren stärker werdende Beschäftigung mit der literarischen Gestaltung der Stammbucheinträge Potential bietet. So werden intertextuelle Verweise sichtbar und eine Auswertung der Kodierung lässt beispielsweise Aussagen über die Häufigkeit der Zitierung bestimmter Autoren oder die Verwendung von Textgattungen zu. Angesichts der wachsenden Zahl an Werknormdaten in der Gemeinsamen Normdatei wäre es in diesem Zusammenhang zukünftig wünschenswert, auch auf diese zu verweisen. Im Fall des Kloppstockschen Trauerspiels war leider kein Normdatensatz vorhanden.

Auch Besonderheiten bei der textlichen Gestaltung können ausgezeichnet werden. So wird die Unterstreichung des Namen Kloppstock durch das Attribut rend=”underlined” ausgedrückt und die verwandten langen s („ſ“) der Kurrentschrift werden durch Unicode dargestellt.

Kodierung des Stammbucheintrags von Dietz Kays

Digitalisat der Bildbeigabe des Stammbucheintrags von Dietz Kays — Abbildung 3: Bildbeigabe des Stammbucheintrags von Dietz Kays. © Freies Deutsches Hochstift / Frankfurter Goethe-Museum, Hs-31210/Stb. 92

Neben den Texten finden sich auch immer wieder Illlustrationen in den Stammbüchern. Bei der Erstellung bediente sich der Einschreiber den unterschiedlichsten künstlerischen Techniken, die von Bleistift- Buntstift-, Kohle- und Tuschezeichnungen über Aquarellmalereien und Gouache zu Druckgrafiken reichen. Ebenso vielfältig ist auch die Wahl der Motive. So finden sich darunter zum Beispiel Wappenzeichnungen oder Porträts, aber auch Bildgegenstände, die sich auf den Text, den Eigentümer des Stammbuchs oder sein Verhältnis zum Einträger beziehen.¹⁵

Auszeichnung der Bildbeigabe

Auch diese bildlichen Elemente können durch TEI ausgezeichnet werden. So wurde die Vogel-Zeichnung (Abbildung 3) in dem hier in Auszügen vorgestellten kodierten Eintrag von Dietz Kayß zunächst mittels <div type=”Bildbeigabe”> getaggt und zusätzlich mit dem Element <figure> als Abbildung ausgezeichnet. Durch das type-Attribut wurde sie näher als Tuschezeichnung klassifiziert. Mittels des Elements <graphic> in Kombination mit dem Attribut url kann die Quelle angegeben werden. <FigDesc> (description of figure) ermöglicht eine detailllierte Beschreibung des Bildinhalts.

Die Kodierung der graphischen Bestandteile des Eintrags erlaubt es auch hier, die Daten später gezielt maschinell auszulesen, um beispielsweise Aussagen über die Verwendungshäufigkeit von Techniken oder Motiven zu treffen.

 </teiHeader>
   <text type="Stammbucheintrag">
      <body>
         <pb n="60"/>
         <div type="Bildbeigabe">
            <figure type="Tuschzeichnung">
               <graphic url="bildconcordia.jpeg"/>
               <figDesc>Bei der Abbildung handelt es sich um die Zeichung eines Vogels im Flug,
                  mutmaßlich einer Taube, der ein Spruchband mit der Aufschrift "Concordia" im
                  Schnabel hält. In der rechten oberen Ecke des Bildes ist eine strahlende Sonne mit
                  grimmigen Gesichtsausdruck zu sehen. Augenscheinlich wurde die Zeichnung mit
                  brauner Tinte angefertigt.</figDesc>
            </figure>
         </div>

Auszeichnung der Textkomponente

Digitalisat des Textteils des Stammbucheintrags von Christian Albrecht von Kielmannsegg — Abbildung 4: Textteil des Stammbucheintrags von Dietz Kayß. © Freies Deutsches Hochstift / Frankfurter Goethe-Museum, Hs-31210/Stb. 92

Die Auszeichnung der Textkomponente dieser Inskription (Abbildung 4) wiederum zeigt, dass TEI auch der Erforschung, in welchen Sprachen die Stammbucheinträge verfasst wurden, Rechnung trägt. So wurde das erste Zitat, bei dem es sich um eine Gnome – also einen Sinnspruch – handelt, mit dem Attribut xml:lang und dem Sprachcode “la” ausgezeichnet, um auszudrücken, dass es, abweichend vom restlichen Text, in lateinischer Sprache vorliegt. In diesem Zusammenhang wurde auch durch @rend=”latintyp” die Verwendung der lateinischen Schrift gekennzeichnet.

Bei den darunter befindlichen Versen konnte durch das <rhyme>-Element zunächst deutlich gemacht werden, dass es sich um einen Reim handelt und mittels des Attributs label wurde zusätzlich das hier verwendete Reimschema getaggt.

Als problematisch erwies sich die Kodierung des Studentenordens im Beispiel. Eigentlich eher ein Schriftsymbol – und damit textuelles Element – wurde er dennoch in Ermangelung einer spezifischeren Auszeichnungsmöglichkeit als Abbildung getaggt.

  
         <pb n="61"/>
         <div type="Gnome">
            <p><quote xml:lang="la" rend="latintyp" xml:id="Fußnote1">Amicus certus in re incerta
                  cernitur</quote></p>
         </div>
         <div type="Gnome">
            <quote>
               <lg type="rhyming_couplet">
                  <l>Gute Freunde in der <rhyme label="a">Noth</rhyme></l>
                  <l>gehen tausend auf ein <rhyme label="a">Loth</rhyme></l>
               </lg>
            </quote>
         </div>
         <closer>
            <salute rend="right">
               <seg type="Adressierung">
                  <choice>
                     <abbr>HochEdelgeb&#x2113;</abbr>
                     <expan>Hochedelgeborener</expan>
                  </choice> Herr und <choice>
                     <abbr>Br.</abbr>
                     <expan>Bruder</expan>
                  </choice></seg>
            </salute>
            <salute rend="right">
               <seg type="Motivierung">Habe die Gewogenheit, und erinnere<lb/> Dich öfters Deines<lb/>
                  <choice>
                     <abbr>gehor&#383;&#x2113;</abbr>
                     <expan>gehor&#383;amen</expan>
                  </choice>
                  <choice>
                     <abbr>Dr.</abbr>
                     <expan>Dieners</expan>
                  </choice> und Freunds</seg></salute>
            <signed rend="right">
               <abbr>K.A.F.</abbr>
               <unclear reason="illegible" cert="medium"><persName><forename>Dietz</forename>
                     <surname>Kayß</surname></persName></unclear>. <abbr>Not.</abbr></signed>
            <dateline rend="left"><placeName ref="http://d-nb.info/gnd/4020989-1">Giesen</placeName><lb/>
               <date when="1771-03-28">28.3.1771</date>
            </dateline>
         </closer>
         <figure type="Zeichen_eines_Studentenordens" rend="left">
            <figDesc>Zeichen eines Studentenordens, enthält augenscheinlich die Zahl 1770 und ein
               C</figDesc>
         </figure>
      </body>
      <note type="editorial" target="#Fußnote1">Gnome wird <persName
            ref="http://d-nb.info/gnd/118520814"><forename>Marcus Tullius</forename>
            <surname>Cicero</surname></persName>zugeschrieben.</note>

   </text>
</TEI>

4. Ausblick

Generell stellen neben den Illustrationen auch die vielfältigen anderen Beigaben eine Herausforderung bei der Kodierung von Stammbucheinträgen mit TEI dar. Mitunter findet man Papierschnitte, Stickarbeiten, getrocknete Blumen, Siegelabdrücke, Musiknoten, aber auch Haarlocken sind keine Seltenheit.¹⁶

Während für die Kodierung von Siegeln mit <seal> ein spezifisches Element zur Verfügung steht und auch Musiknoten innerhalb eines Textes sich über <notatedMusic> taggen lassen bzw. für Musiknoten mit den MEI sogar eigene Codierungsrichtlinien existieren, sind die TEI für die Auszeichnung der anderen (dinglichen) Objekte (zumindest bislang) nicht ausgelegt.

Auch im Hinblick darauf, dass diese Beigaben sich ebenso bei Briefen finden lassen, wäre eine Weiterentwicklung der TEI in dieser Hinsicht wünschenswert. Festzuhalten bleibt aber auch, dass diese Mark-Up-Language bereits jetzt durch die inhaltlich, formal und strukturell tiefgehende Erschließung der Einträge neue Perspektiven für die Stammbuchforschung eröffnen kann.

ms01_DigitalisatStammbcuhSchneider2-2048x1337

ms02_DigitalisatStammbuchSchneider5-2048x1337

ms03_DigitalisatStammbuchSchneider1-2048x1337

Zum Download als PDF-Datei stehen nachfolgend die vollständigen Kodierungen der im Text erwähnten Beispiele sowie weitere exemplarisch kodierte Stammbucheinträge bereit:

Kodierte-Eintraege-aus-dem-Werther-Stammbuch (zip-Archiv)

Die dazugehörigen Digitalisate sind in der Slideshow (Abbildung 5-8) zu finden.

Falls Sie noch nicht mit TEI vertraut sein sollten, diese Mark-Up-Sprache jedoch Ihr Interesse geweckt hat, finden Sie beispielsweise im Internetauftritt der Universität Bern einen ausführlichen Crashkurs und Workshop.

Quellen

¹Boswell, James: Journal, hrsg. von Helmut Winter. Stuttgart 1986. Zitiert nach Linhart, Eva: Vom Stammbuch zum Souvenir d’Amité. Deutscher Schicksalsfaden. In: Schmidt, Volker [Hrsg.]: Der Souvenir : Erinnerung in Dingen von der Reliquie zum Andenken. Köln 2006, S. 202-232 ↩

²Vgl. Schlüter, Andras; Gebert, Björn: 30.000 Datensätze und neun Wochen Zeit. 17.05.2018. https://blog.klassik-stiftung.de/coding-da-vinci/, Zugriff 23.01.2022↩

³Vgl. Schlüter, Andras; Gebert, Björn: 30.000 Datensätze und neun Wochen Zeit. 17.05.2018. https://blog.klassik-stiftung.de/coding-da-vinci/, Zugriff 23.01.2022↩

⁴Vgl. Eberhards Karls Universität Tübingen [Hrsg.]: Stammbücher der UB Tübingen. Stand 25.01.2021. http://www.dh-profil.uni-tuebingen.de/tuebinger-stammbuecher/index.html, Zugriff 23.01.2022↩

⁵Vgl. Universität Graz. Zentrum für Informationsmodellierung in den Geisteswissenschaften [Hrsg.]: Text Enconding Initiative. 2006-2008. https://www-gewi.uni-graz.at/zim/lehre/tei.html, Zugriff 23.01.2022 ↩

⁶Vgl. Heumann, Konrad: Bedeutendes Stammbuch der Wertherzeit. (Unveröffentlichtes Typoskript) ↩

⁷Vgl. Bastian, Julia: «Des Menschen Herz faßt so unendlich viel» Das Stammbuch des Volrat Graf zu Solms-Rödelheim und Assenheim. Frankfurt 2013, S. 22↩

⁸Vgl. Schnabel, Werner Wilhelm: Das Album Amicorum. Ein gemischtmediales Sammelmedium und einige seiner Variationsformen. In: Kramer, Anke [Hrsg.]: Album : Organisationsform narrativer Kohärenz. Göttingen 2013, S. 213-239, hier S. 215; Bastian, Julia: «Des Menschen Herz faßt so unendlich viel» Das Stammbuch des Volrat Graf zu Solms-Rödelheim und Assenheim. Frankfurt 2013, S. 22↩

⁹Vgl. Bastian, Julia: «Des Menschen Herz faßt so unendlich viel» Das Stammbuch des Volrat Graf zu Solms-Rödelheim und Assenheim. Frankfurt 2013, S. 22↩

¹⁰Text Encoding Initiative. P5: Richtlinien für die Auszeichnung und den Austausch elektronischer Texte. Version 4.3.0. Last updated on 31st August 2021. https://tei-c.org/release/doc/tei-p5-doc/de/html/ref-closer.html, Zugriff 23.01.2022↩

¹¹Vgl. Heumann, Konrad: Unterwegs nach Italien. Johann Caspar Goethes Reise nach Nürnberg und Augsburg im Jahr 1739. In: Hopp, Doris: »Goethe Pater». Johann Caspar Goethe (1710–1782). Frankfurt 2010, S. 52-61↩

¹²Vgl. Schnabel, Werner Wilhelm: Das Album Amicorum. Ein gemischtmediales Sammelmedium und einige seiner Variationsformen. In: Kramerm Anke [Hrsg.]: Album : Organisationsform narrativer Kohärenz. Göttingen 2013, S. 213-239, hier S. 215↩

¹³Vgl. Bastian, Julia: «Des Menschen Herz faßt so unendlich viel» Das Stammbuch des Volrat Graf zu Solms-Rödelheim und Assenheim. Frankfurt 2013, S. 20↩

¹⁴Karl-Franzens-Universität Graz [Hrsg.]: Elektronische Repräsentation mit dem Standard der TEI↩

¹⁵Vgl. Bastian, Julia: «Des Menschen Herz faßt so unendlich viel» Das Stammbuch des Volrat Graf zu Solms-Rödelheim und Assenheim. Frankfurt 2013, S. 21; Schnabel, Werner Wilhelm: Das Stammbuch : Konstitution und Geschichte einer textsortenbezogenen Sammelform bis ins erste Drittel des 18. Jahrhunderts. Tübingen 2003. S. 104↩

¹⁶Vgl. Bastian, Julia: «Des Menschen Herz faßt so unendlich viel» Das Stammbuch des Volrat Graf zu Solms-Rödelheim und Assenheim. Frankfurt 2013, S. 21; Schnabel, Werner Wilhelm: Das Album Amicorum. Ein gemischtmediales Sammelmedium und einige seiner Variationsformen. In: Kramer, Anke [Hrsg.]: Album : Organisationsform narrativer Kohärenz. Göttingen 2013, S. 213-239, hier S. 218↩

Dieser Beitrag ist im Studiengang Informationsmanagement an der Hochschule Hannover im Rahmen des Kurses Content Management (Wintersemester 2021/22, Dr. Stefanie Elbeshausen) entstanden.

Die besten Beiträge stellen wir Euch hier in den nächsten Wochen nach und nach vor.