Ein Forschungsteam der New York University trainierte ein multimodales KI-System, indem es audiovisuelle Daten eines zweijährigen Kindes aufzeichnete, um den Prozess des frühen Spracherwerbs bei Kindern zu untersuchen. Die Ergebnisse zeigen, dass selbst mit begrenzten Kindererfahrungen ein KI-Modell mit relativ universellen Lernmechanismen ein bedeutendes Vokabellernen erreichen kann. Die Studie berücksichtigt jedoch nicht den Einfluss anderer Faktoren auf den Lernprozess und bedarf weiterer Forschung. Diese Forschung bietet neue Perspektiven auf Theorien des Spracherwerbs bei Kindern und unterstreicht die Bedeutung von Lern- und Cross-situationalen Mechanismen.