Wenn Sie eine KI lokal installieren, verbleiben die Daten bei Ihnen und werden nicht Teil des Trainings der KI. Der Artikel erklärt, wie sich mehrere KIs schnell lokal installieren und nutzen lassen.
Trainingsdaten sind der Rohstoff für KI-Systeme. Sie bestehen aus riesigen Mengen an Bildern und Texten aus dem Netz. Da die Daten aus dem Internet weitgehend abgegrast sind, suchen sich die KI-Konzerne wie OpenAI, Microsoft, Google und Meta neue Datenquellen, mit denen sie ihre datenhungrigen Modelle füttern können. Immer mehr rücken dabei private Daten ins Visier. Beiträge und Bilder auf Facebook, öffentlich zugängliche Dokumente von Google Docs oder eben Daten, die Sie bei der Nutzung einer KI preisgeben. Zumindest letzteres lässt sich einzäunen. Indem Sie die Modelle lokal installieren, unterbinden Sie, dass der Anbieter erfährt, was Sie generieren lassen und welche Daten Sie dafür zur Verfügung stellen.
Wenn Sie mit einer KI wie ChatGPT kommunizieren, gibt es immer auch einen Rückkanal. Informationen fließen an den Anbieter zurück und dienen künftig womöglich als Trainingsmaterial. Gerichtlich ist diese Praxis noch nicht abschließend bewertet. Denn beim Training kommen urheberrechtlich geschützte Werke ebenso wie Firmengeheimnisse und sensible private Daten in das Mahlwerk der KI. Für Schlagzeilen sorgte das Nacktbild eines Niederländers: In dem Metadaten des Bilds standen sein Vor- und Nachname und die Geokoordinaten des Aufnahmeortes. Bei der Analyse des weltweit größten Trainingsdatensatzes für KI-Bildgenerierung haben Datenjournalisten massenweise solche Daten gefunden, mit denen sich Personen identifizieren lassen: Namen und Gesichter, Geokoordinaten oder E-Mails. Der untersuchte LAION5B-Datensatz besteht aus fünf Milliarden Links auf Bilder und ihren Beschreibungen im Internet. Er ist zugleich der einzige vergleichbare Trainingsdatensatz für KI-Modelle, der öffentlich zugänglich ist. Nur bei lokal installierten Offline-KIs kann man sichersein, dass keine privaten Daten abfließen. […]
Fachartikel für Chip