Home
| Lehre
| Videos
| Texte
| Vorträge
| Software
| Person
| Impressum, Datenschutzerklärung
|
Die Blog-Postings sind Kommentare im Sinne von § 6 Abs. 1 MStV. Der Verfasser ist Jörn Loviscach, falls jeweils nicht anders angegeben. Die Blog-Postings könnten Kraftausdrücke, potenziell verstörende Tatsachenbehauptungen und/oder Darstellungen von Stereotypen enthalten. Die Beiträge der vergangenen Wochen werden als Bestandteil der Internet-Geschichte in ihrer ursprünglichen Form gezeigt. Menschliche Autor*innen können unzutreffende Informationen über Personen, Orte oder Fakten liefern.
vorheriger | Gesamtliste | jüngste | nächster
2023-01-31 17:01
Normalerweise generiert die generative KI ja plagiatsfreie Resultate. Normalerweise. Ende vergangenen Jahres gab es schon Beobachtungen dazu. Nun die nächste Runde: Extracting Training Data from Diffusion Models.
Einige Bilder sind dann doch eidetisch statt generalisiert gelernt, bei Stable Diffusion von 175 Millionen (je nach Empfindlichkeit) 50 bis 100 Stück, bei Imagen 23 Stück von 500.000. Die Zahlen beziehen sich allerdings auf (jeweils 500-mal verwendete) bekannte Prompts aus den Trainingsdaten für eine Auswahl an Bildern/Prompts, die am häufigsten in den Trainingsdaten (nahezu) dupliziert sind. Auch schon das alte CIFAR-10 ist betroffen. Und das Deduplizieren in den Trainingsdaten scheint nicht viel zu helfen.
Neuer Kommentar
0 Zeichen von maximal 1000
Ich bin die*der alleinige Autor*in dieses Kommentars und räume dem Betreiber dieser Website das unentgeltliche, nichtausschließliche, räumlich und zeitlich unbegrenzte Recht ein, diesen Kommentar auf dieser Webseite samt Angabe von Datum und Uhrzeit zu veröffentlichen. Dieser Kommentar entspricht geltendem Recht, insbesondere in Bezug auf Urheberrecht, Datenschutzrecht, Markenrecht und Persönlichkeitsrecht. Wenn der Kommentar mit einer Urheberbezeichnung (zum Beispiel meinem Namen) versehen werden soll, habe ich auch diese in das Kommentar-Textfeld eingegeben. Ich bin damit einverstanden, dass der Betreiber der Webseite Kommentare zur Veröffentlichung auswählt und sinngemäß oder zur Wahrung von Rechten Dritter kürzt.