Home
| Lehre
| Videos
| Texte
| Vorträge
| Software
| Person
| Impressum, Datenschutzerklärung
|
Die Blog-Postings sind Kommentare im Sinne von § 6 Abs. 1 MStV. Der Verfasser ist Jörn Loviscach, falls jeweils nicht anders angegeben. Die Blog-Postings könnten Kraftausdrücke, potenziell verstörende Tatsachenbehauptungen und/oder Darstellungen von Stereotypen enthalten. Die Beiträge der vergangenen Wochen werden als Bestandteil der Internet-Geschichte in ihrer ursprünglichen Form gezeigt. Menschliche Autor*innen können unzutreffende Informationen über Personen, Orte oder Fakten liefern.
vorheriger | Gesamtliste | jüngste | nächster
2025-02-09 19:14
Diese Woche waren Mathematik 2 und Mensch-Maschine-Interaktion dran. Ich habe die beiden Klausuren von ChatGPT o3-mini-high, o3-mini, o1, DeepSeek R1, Gemini 2.0 Pro (exp-02-05) und Claude 3.5 Sonnet durchnudeln lassen. tl;dr: Game over.
Die Texte der Klausuren habe ich als LaTeX-Code hinter diesen Prompt gesetzt: Löse die folgenden Aufgaben. Schreibe die Lösungen in ein gesamtes LaTeX-Dokument. Wenn Skizzen nötig sind, benutze TikZ. Hier sind die Aufgaben:
Bei Mensch-Maschine-Interaktion ohne den Satz zu den Skizzen, weil dort nichts zu zeichnen war. Falls sich jemand wundert, warum die Modelle in letzterer Klausur die Formeln der Kurven von Aufgabe 1 kennen: Die lesen sie aus dem TikZ-Code des Diagramms auf dem Aufgabenzettel.
Die Mathematik 2 dreht sich um Lineare Algebra, Differentialgleichungen, Laplace und Ähnliches. Die meisten der Modelle schaffen die Klausur ohne einen einzigen Fehler und mit nur kleinen Schönheitsmängeln (Aufgaben und Lösungen). Gemini macht einen Rechenfehler und Claude verrechnet sich gleich an acht Stellen. Vielleicht bräuchte Claude einen anderen Prompt, mit dem es mehr Zwischenschritte macht, denn es äußert sich arg knapp. Ob man bei Anthropic weniger mit dem Verbessern und mehr mit dem Lobotomieren des Modells befasst ist? Das wäre ein genialer Move, falls die EU-Kommission dann nur noch Claude erlaubt.
Bei Mensch-Maschine-Interaktion geht es um Wahrnehmung, Usability-Evaluationen, GUI-Programmierung, Maschinenlernen und Ähnliches, ein bunter Blumenstrauß. Alle der Modelle bestehen die Klausur im Einser-Notenbereich (Aufgaben und Lösungen). Gemini und Sonnet verhauen Aufgabe 1. DeepSeek und Gemini fabulieren bei jeweils einer Aufgabe eine Lösungsoption hinzu. o3-mini-high empfiehlt (was nicht gefragt war) fälschlicherweise bei Normalverteilung den Wilcoxon-Test. o1 macht sich skurrile Gedanken, die allerdings im seinem Output nicht mehr auftauchen: Riestermerzen abschwächen
. Und alle, wirklich alle Modelle drücken sich in den Aufgaben 5 und 9 um den geforderten Bezug auf die konkreten gegebenen Anwendungen.
Wo ich nun Zugriff auf o3 habe, musste auch das noch die Wind- und Wasserkraft von vergangener Woche lösen (Aufgaben und Lösungen). Die Skizze in Aufgabe 1 macht es nun fast richtig, aber bei Aufgabe 4 übersieht es wie die anderen, dass man bei der potenziellen Energie mit dem Schwerpunkt rechnen muss.
Fun Fact zum Aufmacherbild: Das Modell vom Le Penseur war ein Boxer.
[Nachtrag 1: Die frisch erschienene Beta von Grok 3 schlägt sich bei Mensch-Maschine-Interaktion wacker, allerdings mit ein paar Fehlern im Deutsch und mit einem (verräterischen?) chinesischen Einsprengsel.]
[Nachtrag 2: Das gerade verfügbar gewordene Claude 3.7 Sonnet kann die Mathematik 2 wunderhübsch erklären, verrechnet sich nur noch zweimal und zeichnet eine der beiden Geraden falsch. Komplettes Ergebnis wieder hier.]
Kommentar vom 2025-02-09, 22:15
Frage zu einer editoriellen Kleinigkeit: In der Klausur "Wind- und Wasserkraft" (siehe https://j3l7h.de/lectures/2425ws/Wind-_und_Wasserkraft/Klausur/Klausur_2025-01-27.pdf) sieht es so aus, als ob in der Aufgabe 12 keine (halben) Leerzeichen zwischen Zahl und Einheit gesetzt sind, in den anderen Aufgaben jedoch schon. Täuscht das oder ist das so, und wenn ja, warum? (M.M.)
Kommentar vom 2025-02-09, 23:16
@M.M.: Täuschung! $1{,}0\,\Omega$ und eine Induktivität von $10{,}0\,\mbox{mH}$. Der Generator liefert aktuell eine Wirkleistung von $1{,}0\,\mbox{MW}$
J. L.
Kommentar vom 2025-02-20, 12:54
Jetzt gibts im Posting einen Nachtrag mit der Beta von Grok 3. J. L.
Kommentar vom 2025-02-25, 10:54
Und nun gibts im Posting auch einen Nachtrag zu Claude 3.7 (Sieben!) Sonnet. J. L.
Kommentar vom 2025-02-26, 15:46
Danke für die Aufklärung zum LaTeX-Quelltext und die Ergänzungen.
Neuer Kommentar
0 Zeichen von maximal 1000
Ich bin die*der alleinige Autor*in dieses Kommentars und räume dem Betreiber dieser Website das unentgeltliche, nichtausschließliche, räumlich und zeitlich unbegrenzte Recht ein, diesen Kommentar auf dieser Webseite samt Angabe von Datum und Uhrzeit zu veröffentlichen. Dieser Kommentar entspricht geltendem Recht, insbesondere in Bezug auf Urheberrecht, Datenschutzrecht, Markenrecht und Persönlichkeitsrecht. Wenn der Kommentar mit einer Urheberbezeichnung (zum Beispiel meinem Namen) versehen werden soll, habe ich auch diese in das Kommentar-Textfeld eingegeben. Ich bin damit einverstanden, dass der Betreiber der Webseite Kommentare zur Veröffentlichung auswählt und sinngemäß oder zur Wahrung von Rechten Dritter kürzt.