Eine bahnbrechende Studie des Forschungsteams um Prof. Dr. Tim C. Kietzmann vom Institut für Kognitionswissenschaft an der Universität Osnabrück zeigt einen innovativen Ansatz zur Verbesserung künstlicher Sehsysteme. In einem Artikel, der im renommierten Fachmagazin Nature Machine Intelligence veröffentlicht wurde, präsentieren die Wissenschaftler ein biologisch inspiriertes Trainingscurriculum, das die visuelle Entwicklung von Säuglingen nachahmt. Die Robustheit dieser kleinen KI-Modelle übertrifft sogar die größerer Systeme.
Trotz ihrer beeindruckenden Fortschritte haben moderne KI-Systeme Schwierigkeiten mit der Wahrnehmung von Bildern. Während Menschen Formen zuverlässig erkennen können, verlassen sich KI-Modelle oft auf feine Oberflächenmuster, was zu ihrer Anfälligkeit für Störungen und Manipulationen führt. Der Artikel hebt hervor, dass KI-Modelle Fotografien markieren und selbstfahrende Autos leiten können, jedoch die Welt anders als Menschen wahrnehmen. Oft scheitern sie bei Unschärfe oder digitalen Veränderungen, da sie auf kleine Texturen fixiert sind, anstatt die Gesamtform von Objekten zu erfassen.
Der neue Trainingsansatz
Das Team hat ein Trainingsprogramm mit dem Namen „Developmental Visual Diet“ entwickelt, das die ersten Jahre menschlichen Sehens nachbildet. Säuglinge beginnen mit einem unscharfen und kontrastarmen Blick auf ihre Umwelt, was sich im Laufe der Jahre verbessert. Durch das schrittweise Training der KI-Systeme – beginnend mit unscharfen Bildern, die über die Zeit klarer und kontrastreicher werden – können die Modelle bedeutend stabilere und genauere Wahrnehmungen entwickeln.
Die Forschung zeigt, dass KI-Modelle, die nach diesem entwicklungsbasierten Ansatz geschult wurden, eine höhere Präferenz für die Formen von Objekten zeigen. Sie konzentrieren sich eher auf ganze Objektregionen und sind weniger ablenkbar von unwesentlichen Details. Sie verbesserten sich in der Erkennung versteckter Formen in komplexen Szenen und bewiesen eine höhere Genauigkeit bei Herausforderungen wie Unschärfe und Bildrauschen.
Robustheit gegenüber Angriffen
Ein weiterer signifikanter Befund der Studie ist die gesteigerte Widerstandsfähigkeit der KI-Modelle gegen gezielte Angriffe. Diese Modelle erlangten bis zu fünfmal mehr Robustheit, was bedeutet, dass sie nicht nur stabiler sind, sondern auch besser mit adversarialen Angriffen umgehen können. Ein bemerkenswertes Beispiel dazu stellt das Bild eines Bären dar, das aus Flaschen besteht: Während die KI lediglich die Flaschen als Objekte erkennt, sieht ein Mensch zunächst die umgebende Form eines Bären.
Zusammenfassend bietet diese Forschung einen alternativen Ansatz zum gängigen Trend in der KI-Forschung, der oft auf die Verwendung größerer Modelle und mehr Daten setzt. Stattdessen zeigt das Team von Osnabrück, dass die zugrunde liegende Trainingsmethodik entscheidend für die Entwicklung stabiler und menschenähnlicher Sichtweisen von KI-Systemen ist. Mit einem ressourceneffizienten Ansatz, der mit „schlechtem“ Sehen beginnt und darauf aufbaut, könnten sicherere visuelle KI-Systeme entwickelt werden, die weniger anfällig für Fehler sind.