Home | Lehre | Videos | Texte | Vorträge | Software | Person | Impressum, Datenschutzerklärung | Blog RSS

Die Blog-Postings sind Kommentare im Sinne von § 6 Abs. 1 MStV. Der Verfasser ist Jörn Loviscach, falls jeweils nicht anders angegeben. Die Blog-Postings könnten Kraftausdrücke, potenziell verstörende Tatsachenbehauptungen und/oder Darstellungen von Stereotypen enthalten. Die Beiträge der vergangenen Wochen werden als Bestandteil der Internet-Geschichte in ihrer ursprünglichen Form gezeigt. Menschliche Autor*innen können unzutreffende Informationen über Personen, Orte oder Fakten liefern.

vorheriger | Gesamtliste | jüngste | nächster

DeepSeek R1 und meine Klausuren

2025-01-29 21:56

Passenderweise ist hier gerade Prüfungsphase, so dass ich die Musterlösungen nun einfach parallel aus ChatGPT o1 und DeepSeek R1 holen kann – wenn sich letzteres nicht gerade wegen Server-Überlast verweigert.

Es geht los mit Mathematik 1 (Aufgaben und Lösungen) sowie Wind- und Wasserkraft (Aufgaben und Lösungen). Die Mathematik 1 mit Themen wie Kombinatorik, Logarithmen, Ungleichungen, Ableitung und Integral wird wie zu erwarten von beiden Modellen mit Bravour gelöst. Aber erstmals klappt auch die Wind- und Wasserkraft im Einser-Notenbereich. ChatGPT o1 finde ich dabei einen Tick besser, auch in den Erklärungen.

Faszinierend an DeepSeek R1 ist allerdings der in Ausführlichkeit und Inhalt gigantische innere Monolog (in den oben verlinkten Lösungen mit enthalten). Ist dieser stream of consciousness ein großer Schritt in Richtung auf künstliches Bewusstsein?

Hier noch eine Anmerkung, weil da gerade gut was durcheinandergeht: Was als kleinere Varianten von DeepSeek R1 gehandelt wird, ist nicht DeepSeek R1, sondern sind damit trainierte Ableger von Qwen 2.5 and Llama 3. Das dürfte zu schweren Enttäuschungen führen.

Nächste Woche stehen Mathematik 2 (DGLn, Potenzreihen, Fourier usw.) und Mensch-Maschine-Interaktion an. Updates folgen hier in diesem Posting. [Nachtrag 3: Das ist wegen o3 doch ein getrennter Beitrag geworden.]

[Nachtrag 1 für den Fall, dass die chinesischen Server mal wieder überlastet sind: DeepSeek R1 is now available on Azure AI Foundry and GitHub. Schon mal das Popcorn für den Ehekrach zwischen Microsoft und OpenAI bereitlegen.]

[Nachtrag 2 mit (derzeit noch?) ohne Anmeldung nutzbaren Alternativen: Lambda Chat und die Demo für Nvidia NIM]

Kommentar vom 2025-01-29, 22:30

Welche Möglichkeiten sehen Sie, um eigenständige Lernleistungen (Transferwissen, AFB3) zu prüfen, wenn Sie keinen Einfluss auf KI-Nutzung haben können? (Hausarbeiten, Unterrichts-/Vortragsvorbereitung, Home Schooling)

Mit freundlichen Grüßen,
P. Niechciol
(wir haben vor einigen Jahren an der OvGU-Magdeburg zusammengearbeitet)

Kommentar vom 2025-01-29, 23:31

@P. Niechciol: Das hängt davon ab, ob die Schüler*innen noch glauben, dass es erstens gut sei, wenn sie etwas selbst können, statt es sofort an die KI zu delegieren, und dass es zweitens ok ist, auch mal keine 15 Punkte zu haben (also nicht Medizin oder Psychologie studieren zu wollen). Falls zweimal nein: no way. J. L.

Kommentar vom 2025-02-01, 00:09

Zum Thema KI-Einsatz habe ich gerade gestern und heute mal unsere letzte unüberwachte Online-Leistungskontrolle in den Grundlagen der Elektrotechnik getestet, im deutschen und englischen Modul:

Lösungsidee für die Online-Leistungskontrolle "Grundlagen der Elektrotechnik I" vom 29.01.2025
https://youtu.be/Agqryj9InTU

Wie gut löst Gemini 1.5 Flash unsere Online-Leistungskontrolle in den Grundlagen der Elektrotechnik?
https://youtu.be/VHsMXOj6vZM

This is how I would solve our online assessment in "Electrical Engineering" from 29.01.2025
https://youtu.be/D7oKua-TZ-s

How well does Claude solve our online assessment in electrical engineering?
https://youtu.be/wWx86ALZDPw

How well does DeepSeek V3 solve our online assessment in electrical engineering?
https://youtu.be/VwDtNKJ4hG4

Fazit:
ChatGPT: 23/30 Punkten
Gemini: 26/30 Punkten (mit etwas Hilfe)
Claude: 3/19 Punkten (dann Abbruch)
DeepSeek: 11/14 Punkten (dann Abbruch)

Bei Gemini und Claude wäre das Ergebnis mit einer Premiumlizenz vermutlich noch besser bzw. deutlich besser ausgefallen, weil die abgespeckte Haiku-Version wirklich "as dumb as a brick" ist. DeepSeek war stark, aber einfach nur sehr langsam.

Im Grunde sind damit aber unüberwachte Online-Tests mit Rechenaufgaben durch. Selbst wenn man schon versucht, die Aufgaben spezifisch so zu gestalten, dass diese nicht gut zum Trainingsmaterial passen, kann eine KI diese in vielen Fällen trotzdem lösen.

Jetzt kann man wieder auf überwachte Leistungskontrollen umsteigen, die Aufgaben schwerer machen oder sich stattdessen überlegen, was unsere Studierenden vielleicht alternativ lernen sollten, was die KI nicht kann (entwickeln, löten und messen?, messen, modellieren und simulieren?). Die Situation ist echt nicht so einfach.

Andere Sache: Jörn Loviscach hat mal an der OVGU in Magdeburg gearbeitet!? (M.M.)

Kommentar vom 2025-02-01, 11:23

@M.M.: Na, wir müssen halt kompetenzorientierte Prüfungen machen!!1!, erzählen uns die Leute, die keinen Schimmer haben, was KI inzwischen kann. – Elektrotechnik und auch der Maschinenbau haben allerdings derzeit noch den Vorteil, dass im Internet nur relativ wenig Material zum Training der KI insbesondere zum Thema Produktentwicklung zu finden ist. Auch das Reinforcement Learning geht mit Mathematik und Programmierung viel besser. Man müsste für Reinforcement Learning in Elektrotechnik und im Maschinenbau die KI an eine Multiphysik-Engine koppeln. – Nein, ich habe nie an der OVGU gearbeitet; das war nur ein kleines Projektchen aus der Ferne. J. L.

Neuer Kommentar

0 Zeichen von maximal 1000

Ich bin die*der alleinige Autor*in dieses Kommentars und räume dem Betreiber dieser Website das unentgeltliche, nichtausschließliche, räumlich und zeitlich unbegrenzte Recht ein, diesen Kommentar auf dieser Webseite samt Angabe von Datum und Uhrzeit zu veröffentlichen. Dieser Kommentar entspricht geltendem Recht, insbesondere in Bezug auf Urheberrecht, Datenschutzrecht, Markenrecht und Persönlichkeitsrecht. Wenn der Kommentar mit einer Urheberbezeichnung (zum Beispiel meinem Namen) versehen werden soll, habe ich auch diese in das Kommentar-Textfeld eingegeben. Ich bin damit einverstanden, dass der Betreiber der Webseite Kommentare zur Veröffentlichung auswählt und sinngemäß oder zur Wahrung von Rechten Dritter kürzt.