RuhrCampusOnline.de - Das studentische Magazin von Rhein und Ruhr
Keine Suchergebnisse
Alle Suchergebnisse einsehen
Gartenfreunde
  • Bochum
  • Bonn
  • Dortmund
  • Duisburg
  • Düsseldorf
  • Essen
  • Gelsenkirchen
  • Köln
  • Krefeld
  • Wuppertal
  • Bochum
  • Bonn
  • Dortmund
  • Duisburg
  • Düsseldorf
  • Essen
  • Gelsenkirchen
  • Köln
  • Krefeld
  • Wuppertal
Keine Suchergebnisse
Alle Suchergebnisse einsehen
Justnow Press
Keine Suchergebnisse
Alle Suchergebnisse einsehen

Startseite » Krefeld » Wenn die KI so „denkt“ wie wir

Wenn die KI so „denkt“ wie wir

13. November 2025
in Krefeld
Reading Time: 3Minuten Lesezeit
Wenn die KI so „denkt“ wie wir
Share on FacebookShare on Twitter

(openPR) Gemeinsame PM von TU Berlin, BIFOLD, Google DeepMind, Max-Planck-Institut für Bildungsforschung und Max-Planck-Institut für Kognitions- und Neurowissenschaften

Auch wenn die so genannten Vision Foundation Modelle, Computermodelle für die automatisierte Bilderkennung, in den vergangenen Jahren enorme Fortschritte gemacht haben – sie unterscheiden sich immer noch deutlich von dem menschlichen visuellen Verständnis. Zum Beispiel erfassen sie in der Regel keine mehrstufigen semantischen Hierarchien und haben Schwierigkeiten, mit Beziehungen zwischen semantisch verwandten, aber visuell unähnlichen Objekten. In einem gemeinsamen Projekt mit Google DeepMind und dem Max-Planck-Institut für Bildungsforschung haben Wissenschaftler*innen des Forschungsinstituts BIFOLD an der TU Berlin aus dem Team von Co-Direktor Prof. Dr. Klaus-Robert Müller vom Fachgebiet für Maschinelles Lernen an der TU Berlin jetzt einen neuen Ansatz entwickelt. „AligNet“ integriert erstmals menschliche semantische Strukturen in neuronale Bildverarbeitungsmodelle und nähert damit das visuelle Verständnis der Computermodelle dem des Menschen an. Die Ergebnisse wurden jetzt unter dem Titel „Aligning Machine and Human Visual Representations across Abstraction Levels“ in dem renommierten Fachmagazin Nature publiziert.

Die Wissenschaftler*innen untersuchen, wie visuelle Repräsentationen von modernen, tiefen neuronalen Netzen im Vergleich zu menschlichen Wahrnehmungen und konzeptuellem Wissen aufgebaut sind und wie man diese besser aufeinander abstimmen kann. Obgleich künstliche Intelligenz (KI) in der Bildverarbeitung heute beeindruckende Leistungen zeigt, generalisieren Maschinen häufig weniger robust als Menschen, etwa wenn neue Bildtypen oder Verhältnisse vorliegen.

„Die zentrale Frage unserer Studie lautet: Was fehlt modernen maschinellen Lernsystemen, damit sie ein menschenähnliches Verhalten zeigen – nicht nur in der Leistung, sondern auch in der Art und Weise, wie sie Repräsentationen organisieren und abstrahieren“, erläutert Erstautor Dr. Lukas Muttenthaler, Wissenschaftler bei BIFOLD und dem Max-Planck-Institut für Kognitions- und Neurowissenschaften, sowie ehemaliger studentischer Mitarbeiter bei Google DeepMind.

Die Forschenden zeigen, dass menschliches Wissen typischerweise hierarchisch organisiert ist, also sortiert in detaillierte (z. B. „Haustier Hund“) bis hin zu groben (z.B. „Tier“) Unterscheidungen. Maschinenmodelle hingegen erfassen diese Ebenen der Abstraktion und Semantik oft nicht. Um die Modelle dem menschlichen Verständnis anzugleichen, haben die Wissenschaftler*innen zunächst ein „Lehrer“-Modell darauf trainiert, menschliche Urteile (z. B. Bild-Ähnlichkeitsurteile) nachzuahmen. Dieses Lehrer-Modell hat somit eine Repräsentationsstruktur gelernt, welche als „menschlich“ gelten kann. Anschließend wird diese Repräsentationsstruktur genutzt, um bereits trainierte, leistungsstarke Vision-Foundation-Modelle („Studentenmodelle“) zu verbessern („soft alignment“). Dieses Nachjustieren kostet um mehrere Größenordnungen weniger als das Neutraining der Modelle.

Die „Studenten“-Modelle wurde mit Hilfe von „AligNet“ fein abgestimmt. AligNet ist ein über das „Lehrer“-Modell generierter, großer Bilddatensatz, der Ähnlichkeitsurteile beinhaltet, die denen von Menschen entsprechen. Zur Evaluierung der feinjustierten Studenten-Modelle wurde anschließend der von den Wissenschaftler*innen speziell erhobene, sogenannte „Levels“-Datensatz verwendet. „Für diesen Datensatz führten etwa 500 Probanden eine Bild-Ähnlichkeitsaufgabe durch, die mehrere Ebenen semantischer Abstraktion abdeckt, von ganz groben Kategorisierungen bis hin zu detaillierten Unterscheidungen und Kategorie-Grenzen.

Für jedes Urteil wurden die vollständigen Antwortverteilungen sowie Reaktionszeiten der Probanden erfasst, um mögliche Zusammenhänge mit der Unsicherheit menschlicher Entscheidungen zu erfassen. Der so gewonnene, innovative Datensatz stellt einen neu etablierten Benchmark für die Übereinstimmung zwischen Mensch und Maschine dar und wurde von uns als Open-Source publiziert“, berichtet Frieda Born, Doktorandin bei BIFOLD an der TU Berlin und am Max-Planck-Institut für Bildungsforschung.

Die mit „AligNet“ trainierten Modelle zeigen deutliche Verbesserungen in der Übereinstimmung mit menschlichen Urteilen. Darunter eine bis zu 93,5 Prozent relative Verbesserung bei den grob-semantischen Bewertungen. In manchen Fällen übertreffen sie sogar die Zuverlässigkeit von menschlichen Bewertungen. Darüber hinaus zeigen diese Modelle keinerlei Leistungseinbußen, sondern im Gegenteil, konsistente Leistungssteigerungen (25 bis zu 150 Prozent relative Verbesserung) bei diversen komplexen, praktischen maschinellen Lernaufgaben bei geringen Kosten für Rechenzeit.

Prof. Klaus-Robert Müller: „Unsere Forschung verbindet methodisch kognitive Wissenschaft (menschliche Abstraktionsebenen) mit moderner Deep-Learning-Praxis (sogenannte Vision-Foundation-Modelle) und bildet somit ein Scharnier zwischen dem Konzept der Repräsentation von Menschen und Maschinen. Das ist ein wichtiger Schritt hin zu einer verbesserten, interpretierbaren, kognitiv fundierten KI.“ „Wir schlagen eine effiziente Methode vor, um Computer-Vision-Modellen die hierarchische Struktur menschlichen konzeptuellen Wissens beizubringen. Wir zeigen, dass dies nicht nur die Repräsentationen dieser Modelle menschenähnlicher und damit besser interpretierbar macht, sondern auch ihre Vorhersagekraft und Robustheit bei einer Vielzahl von Bildverarbeitungsaufgaben verbessert“, so Dr. Andrew K. Lampinen von Google DeepMind.

Disclaimer: Für den obigen Pressetext inkl. etwaiger Bilder/ Videos ist ausschließlich der im Text angegebene Kontakt verantwortlich. Der Webseitenanbieter distanziert sich ausdrücklich von den Inhalten Dritter und macht sich diese nicht zu eigen. Wenn Sie die obigen Informationen redaktionell nutzen möchten, so wenden Sie sich bitte an den obigen Pressekontakt. Bei einer Veröffentlichung bitten wir um ein Belegexemplar oder Quellenennung der URL.

Vorherige News

Angewandte Wissenschaften an FH/HAW trägt wesentlich zur Lösung wirtschaftlicher und gesellschaftlicher Probleme bei

Nächste News

DAAD-Preis 2025 der Pädagogischen Hochschule Karlsruhe geht an Canan Evecen

Ähnliche Beiträge

Chancen nutzen - Studienaussteiger zu Fachkräften ausbilden
Krefeld

Chancen nutzen – Studienaussteiger zu Fachkräften ausbilden

2. Dezember 2025
Software aus 60 Jahren wird archiviert und ediert
Krefeld

Software aus 60 Jahren wird archiviert und ediert

2. Dezember 2025
IMAXXAM erwirbt Hotelneubau in zentraler Lage von Hagen
Krefeld

IMAXXAM erwirbt Hotelneubau in zentraler Lage von Hagen

1. Dezember 2025
Osnabrücker Universitätspräsidentin soll neue Rektorin der Uni Münster werden
Krefeld

Osnabrücker Universitätspräsidentin soll neue Rektorin der Uni Münster werden

28. November 2025

Beliebte News

  • Opfer von Jakub Jahl in Afrika

    Opfer von Jakub Jahl in Afrika

    0 shares
    Share 0 Tweet 0
  • Rotary Club Bochum-Hellweg engagiert sich fürs Deutschlandstipendium

    0 shares
    Share 0 Tweet 0
  • Rotary Club Bochum-Hellweg verleiht RUB-Universitätspreis für herausragende Abschlussarbeit an Nele Borgert

    0 shares
    Share 0 Tweet 0
  • Desk-Sharing Plattform aus Bonn erobert Deutschlands Coworking-Markt

    0 shares
    Share 0 Tweet 0
  • RFH Köln informiert über Bachelor Wirtschaftsinformatik

    0 shares
    Share 0 Tweet 0
  • Impressum
  • Datenschutz
  • Kontakt
© 2020 RuhrCampusOnline.de
Keine Suchergebnisse
Alle Suchergebnisse einsehen
  • Bochum
  • Bonn
  • Dortmund
  • Duisburg
  • Düsseldorf
  • Essen
  • Gelsenkirchen
  • Köln
  • Krefeld
  • Wuppertal

Cookie-Zustimmung verwalten
Wir verwenden Cookies, um unsere Website und unseren Service zu optimieren.
Funktional Immer aktiv
Die technische Speicherung oder der Zugang ist unbedingt erforderlich für den rechtmäßigen Zweck, die Nutzung eines bestimmten Dienstes zu ermöglichen, der vom Teilnehmer oder Nutzer ausdrücklich gewünscht wird, oder für den alleinigen Zweck, die Übertragung einer Nachricht über ein elektronisches Kommunikationsnetz durchzuführen.
Vorlieben
Die technische Speicherung oder der Zugriff ist für den rechtmäßigen Zweck der Speicherung von Präferenzen erforderlich, die nicht vom Abonnenten oder Benutzer angefordert wurden.
Statistiken
Die technische Speicherung oder der Zugriff, der ausschließlich zu statistischen Zwecken erfolgt. Die technische Speicherung oder der Zugriff, der ausschließlich zu anonymen statistischen Zwecken verwendet wird. Ohne eine Vorladung, die freiwillige Zustimmung deines Internetdienstanbieters oder zusätzliche Aufzeichnungen von Dritten können die zu diesem Zweck gespeicherten oder abgerufenen Informationen allein in der Regel nicht dazu verwendet werden, dich zu identifizieren.
Marketing
Die technische Speicherung oder der Zugriff ist erforderlich, um Nutzerprofile zu erstellen, um Werbung zu versenden oder um den Nutzer auf einer Website oder über mehrere Websites hinweg zu ähnlichen Marketingzwecken zu verfolgen.
  • Optionen verwalten
  • Dienste verwalten
  • Verwalten von {vendor_count}-Lieferanten
  • Lese mehr über diese Zwecke
Einstellungen anzeigen
  • {title}
  • {title}
  • {title}