Digital.Leben Geheime KI-Trainingsdaten

Do, 20.06.  |  17:55-18:00  |  Ö1
Wie und womit Sprachmodelle trainiert werden

Ein KI-Modell lernt über die Welt, indem es mit riesigen Datensätzen trainiert wird. Erst Millionen Bilder von einem Apfel samt der Bildbeschreibung „Apfel“ machen es einer bildverarbeitenden KI möglich, einen Apfel zu erkennen.Was in solche Trainings-Datensätze reinkommt, beziehungsweise wie sie überhaupt zusammengestellt werden, ist fast ein noch größeres Betriebsgeheimnis als die Modelle selbst. Denn es gibt nur wenige offen verfügbare, große Trainingsdatensätze, in die man Einblick nehmen kann. Einer der größten ist mit 5,8 Milliarden Text- und Bilddaten LAION 5B. Der österreichische Programmierer, Investigativjournalist und Pulitzerpreis-Träger Christo Buschek hat ihn sich genauer angesehen, um zu verstehen, mit welchen Daten Laion 5B KI-Modelle ausbildet. Irmi Wutscher hat mit ihm darüber gesprochen.

in Outlook/iCal importieren