Home | Lehre | Videos | Texte | Vorträge | Software | Person | Impressum, Datenschutzerklärung | Blog RSS

Die Blog-Postings sind Kommentare im Sinne von § 6 Abs. 1 MStV. Der Verfasser ist Jörn Loviscach, falls jeweils nicht anders angegeben. Die Blog-Postings könnten Kraftausdrücke, potenziell verstörende Tatsachenbehauptungen und/oder Darstellungen von Stereotypen enthalten. Die Beiträge der vergangenen Wochen werden als Bestandteil der Internet-Geschichte in ihrer ursprünglichen Form gezeigt. Menschliche Autor*innen können unzutreffende Informationen über Personen, Orte oder Fakten liefern.

vorheriger | Gesamtliste | jüngste | nächster

KI-Lerndatensätze vergiften im Park

2023-02-22 21:16

Ein neuer Angriffsvektor: Man sorgt dafür, dass zum Training der großen KI-Modelle bösartig verfälschte Daten gecrawlt werden. Methode 1: den Crawler erkennen und ihm andere Daten geben als Menschen (dazu eine abgelaufene Domain kaufen, denn von solchen Domains ist viel in den üblichen Crawl-Datensätzen, wie der Preprint ausführt), Methode 2: Wikipedia usw. editieren kurz bevor der nächste Snapshot gemacht wird, so dass noch niemand die Änderungen rückgängig gemacht hat.

Wer die falsch gelernten Texte bzw. Bilder loswerden will, muss mit dem Training von vorne anfangen. Das kostet ja heute gerne mal einen sechs- oder siebenstelligen Dollar-Betrag – und eine entsprechende Umweltbelastung. Als Anwendung dieser Möglichkeiten (rein hypothetisch zur Risikoabschätzung, ich beabsichtige keine Anleitung zu einer Straftat!) fallen mir Sabotage-Aktionen gegen die KI-Unternehmen ein. Vielleicht kann man auch strafrechtlich relevante Texte oder Bilder als eidetisch gelernte U-Boote verstecken und die KI-Unternehmen damit erpressen, den dafür passenden Prompt zu verraten.

Neuer Kommentar

0 Zeichen von maximal 1000

Ich bin die*der alleinige Autor*in dieses Kommentars und räume dem Betreiber dieser Website das unentgeltliche, nichtausschließliche, räumlich und zeitlich unbegrenzte Recht ein, diesen Kommentar auf dieser Webseite samt Angabe von Datum und Uhrzeit zu veröffentlichen. Dieser Kommentar entspricht geltendem Recht, insbesondere in Bezug auf Urheberrecht, Datenschutzrecht, Markenrecht und Persönlichkeitsrecht. Wenn der Kommentar mit einer Urheberbezeichnung (zum Beispiel meinem Namen) versehen werden soll, habe ich auch diese in das Kommentar-Textfeld eingegeben. Ich bin damit einverstanden, dass der Betreiber der Webseite Kommentare zur Veröffentlichung auswählt und sinngemäß oder zur Wahrung von Rechten Dritter kürzt.