Home | Lehre | Videos | Texte | Vorträge | Software | Person | Impressum, Datenschutzerklärung | Blog RSS

Die Blog-Postings sind Kommentare im Sinne von § 6 Abs. 1 MStV. Der Verfasser ist Jörn Loviscach, falls jeweils nicht anders angegeben. Die Blog-Postings könnten Kraftausdrücke, potenziell verstörende Tatsachenbehauptungen und/oder Darstellungen von Stereotypen enthalten. Die Beiträge der vergangenen Wochen werden als Bestandteil der Internet-Geschichte in ihrer ursprünglichen Form gezeigt. Menschliche Autor*innen können unzutreffende Informationen über Personen, Orte oder Fakten liefern.

vorheriger | Gesamtliste | jüngste | nächster

ChatGPT nicht nachzuweisen

2023-07-10 23:27

Wo Universitäten und FachHochschulen dieser Tage damit ringen, ChatGPT einzudämmen, drücken sie den Student*innen wohl auch aufs Auge, zwangsweise einem automatischen Test bei einer*m IT-Dienstleister*in zuzustimmen. Die Details davon (Beispiel: Werden die Daten zum Anlernen von KI benutzt?) bleiben im Zweifelsfall im Dunkeln. Außerdem muss man Arbeiten mit Unternehmen von der automatischen Prüfung ausschließen, weil: Geschäftsgeheimnis. Pro-Tipp: Selbst eine Mini-Firma aufmachen!

Aber die ganze automatische Prüfung ist – Überraschung! – sowieso ein Witz. Mal wieder Deborah Weber-Wulff et al.: Testing of Detection Tools for AI-Generated Text. Ergebnis des großen Vergleichstests: Am besten hilft es, ein bisschen per Hand umzuformulieren, aber Quillbot ist auch nicht schlecht.

Und keine Angst: Vor Gericht ist all das sowieso chancenlos, weil die Programme keine Belege für ihre Bewertung liefern. Wie sollten sie auch? Ich hätte noch erwähnt, dass nach DSGVO eine vollautomatische Entscheidung sowieso verboten ist.

Die Autor*innen hätten deutlich machen können, dass sich ihre Messwerte wie Accuracy und ihr "False Accusations Ratio" auf das Verhältnis echt/fake in den Versuchen beziehen. Man müsste auf das Verhältnis echt/fake der wahren Welt umrechnen – aber wer kennt das?

[Nachtrag: GPT detectors are biased against non-native English writers]

Kommentar vom 2023-07-13, 10:22

Was denken Sie über das Paper: GPT detectors are biased against non-native English writers?

Es ist interessant, was dort gesagt wird, irgendwie mag es aber nicht so recht passen. Das Paper befasst sich mit GPT-Detektoren und behauptet mehr nebenbei nicht native Sprecher benachteiligt sind.
Aber:
"(Prompt: “Enhance the word choices to sound more like that of a native speaker.”) [...] Remarkably, this intervention led to a substantial reduction in misclassification, with the average false positive rate decreasing by 49.45% (from 61.22% to 11.77%)."

Ich finde Diversität bei schweren Themen wie ML hinderlich bei den Begrifflichkeiten. Man kann zu einem Neuron z.B. auch Knoten sagen, oder Einheit, oder oder ..., und die dann alle verwenden? Dann auch noch ein Rezept mit außergewöhnlich unterschiedlich klingenden Worten zu schmücken statt zu sagen: Erst Punkt 1, dann Punkt 2, dann Punkt 3. Dieses "dann" ist klar und alternative Wörter sind doch nur verwirrend für den Leser.

Was ist da dran?

Kommentar vom 2023-07-13, 14:24

@Kommentator*in von 10:22: (Das Paper hatte ich als Nachtrag angeführt.) Beim professionellen Schreiben ist klar, dass der (früher?) in der Schule gepredigte "Wechsel im Ausdruck" keine gute Idee ist. Wolf Schneider karikiert das irgendwo: Paris, die Stadt an der Seine, die französische Metropole usw. in mehreren Sätzen hintereinander. Ich hätte "word choice" hier aber so aufgefasst, dass man das übliche Wort, die übliche Redewendung nehmen soll. So etwas. J. L.

Neuer Kommentar

0 Zeichen von maximal 1000

Ich bin die*der alleinige Autor*in dieses Kommentars und räume dem Betreiber dieser Website das unentgeltliche, nichtausschließliche, räumlich und zeitlich unbegrenzte Recht ein, diesen Kommentar auf dieser Webseite samt Angabe von Datum und Uhrzeit zu veröffentlichen. Dieser Kommentar entspricht geltendem Recht, insbesondere in Bezug auf Urheberrecht, Datenschutzrecht, Markenrecht und Persönlichkeitsrecht. Wenn der Kommentar mit einer Urheberbezeichnung (zum Beispiel meinem Namen) versehen werden soll, habe ich auch diese in das Kommentar-Textfeld eingegeben. Ich bin damit einverstanden, dass der Betreiber der Webseite Kommentare zur Veröffentlichung auswählt und sinngemäß oder zur Wahrung von Rechten Dritter kürzt.