Фей-Фей Ли, которую называют «крёстной матерью ИИ», нарисовала карту будущего. И это будущее — не в словах, а в пространстве.
Фей-Фей Ли — вице-президент Google и профессор Стэнфордского университета. Её статус «крёстной матери» она получила за создание в 2009 году базы данных ImageNet. Это масштабный набор данных для распознавания объектов, который стал катализатором прорыва в глубоком обучении и компьютерном зрении.
И вот теперь Ли говорит прямо, что большие языковые модели овладели абстрактными знаниями, но им не хватает способности восприятия и действий в пространстве. Они не могут оценивать расстояние и движение. «Пространственное понимание является когнитивной основой человеческого интеллекта и важнейшим шагом на пути перехода искусственного интеллекта от языка к восприятию и действию», — говорит она.
По её словам, модели мира будут иметь решающее значение для создания такого интеллекта. Но им необходима способность создавать реалистичные 3D миры, понимать входные данные — изображения и действия, и предсказывать, как эти миры меняются со временем.
Сейчас основная задача — обучить ИИ физике реального мира.
И настоящий прорыв случится, когда машины научатся понимать физическую реальность.
