Jörn Loviscach: Was verstehen Sprachmodelle?

Die Blog-Postings sind Kommentare im Sinne von § 6 Abs. 1 MStV. Der Verfasser ist Jörn Loviscach, falls jeweils nicht anders angegeben. Die Blog-Postings könnten Kraftausdrücke, potenziell verstörende Tatsachenbehauptungen und/oder Darstellungen von Stereotypen enthalten. Die Beiträge der vergangenen Wochen werden als Bestandteil der Internet-Geschichte in ihrer ursprünglichen Form gezeigt. Menschliche Autor*innen können unzutreffende Informationen über Personen, Orte oder Fakten liefern.

vorheriger | Gesamtliste | jüngste | nächster

Was verstehen Sprachmodelle?

2023-05-20 20:24

huge clockwork machinery of small and large cogwheel gears, one single glowing light bulb, hyperrealistic, cinematographic, photography, intricate details --ar 16:9 --c 20 --v 5.1

Wie kann man am saubersten Beispiele davon definieren, was "Verstehen" heißt? Oder im Bildungswissenschaften-Lingo: Wie kann man "Verstehen" operationalisieren? Die Informatik kommt zur Hilfe: "Verstehen" kann zum Beispiel heißen, den aktuellen Zustand eines Programms abstrakt beschreiben und das zukünftige Verhalten eines Programms vorhersagen sowie Programme kürzer als gelernt (aber trotzdem korrekt) zu schreiben. Ich muss an die "kompetenzorientierten" Aufgaben aus meinen Informatik-Klausuren denken.

Im Paper Evidence of Meaning in Language Models Trained on Programs gehts allerdings nur um eine minimale Robotersimulation auf einem Schachbrett. Die Tokens beschreiben die Welt (aktuelle Ausrichtung des Roboters, Hindernisse usw.) bzw. die Aktionen des Roboters (links herum drehen usw.). Die "Bedeutung" (hier: die aktuelle bzw. zukünftige Ausrichtung des Roboters) wird mit einem trainierten linearen Klassifikator dechiffriert; die Autoren begründen ansatzweise empirisch, warum die "Bedeutung" nicht im dem Klassifikator steckt.

Moral: Viel bleibt noch zu tun! Aber wer ChatGPT Programmieraufgaben gestellt hat, spürt, dass das Ding "versteht". Jetzt bräuchten wir nur eine praktikable Definition von "Verstehen". Auf die schwammigen Bildungswissenschaften würde ich da nicht hoffen.

[Nachtrag: "Verstehen" lässt sich auch mit Kausalitäts-Fragen prüfen: Causal Reasoning and Large Language Models: Opening a New Frontier for Causality.]

Neuer Kommentar

0 Zeichen von maximal 1000

Ich bin die*der alleinige Autor*in dieses Kommentars und räume dem Betreiber dieser Website das unentgeltliche, nichtausschließliche, räumlich und zeitlich unbegrenzte Recht ein, diesen Kommentar auf dieser Webseite samt Angabe von Datum und Uhrzeit zu veröffentlichen. Dieser Kommentar entspricht geltendem Recht, insbesondere in Bezug auf Urheberrecht, Datenschutzrecht, Markenrecht und Persönlichkeitsrecht. Wenn der Kommentar mit einer Urheberbezeichnung (zum Beispiel meinem Namen) versehen werden soll, habe ich auch diese in das Kommentar-Textfeld eingegeben. Ich bin damit einverstanden, dass der Betreiber der Webseite Kommentare zur Veröffentlichung auswählt und sinngemäß oder zur Wahrung von Rechten Dritter kürzt.