Наука
Российские ученые создали универсальную модель для 3D-зрения роботов
Автор: Лаура Акопян
4 января 2025, 11:49
Исследователи из России разработали первую универсальную нейросеть, способную распознавать трехмерные объекты и одинаково эффективно работать с любыми наборами данных.
Об этом сообщает пресс-служба Института искусственного интеллекта AIRI. Новая технология может применяться в робототехнике, дополненной реальности и 3D-сканировании.
До этого момента каждая задача требовала создания отдельных моделей с уникальными настройками, что тормозило разработку и ограничивало ее использование.
Теперь российские ученые предложили решение — универсальную архитектуру на основе трансформера-кодировщика. Этот подход устраняет необходимость в адаптации моделей к разным наборам данных.
По словам руководителя научной группы AIRI Антона Конушина, основная проблема трехмерного зрения заключается в ограниченном количестве данных для обучения.
Например, самый крупный из существующих наборов содержит всего 7 тысяч сцен, что крайне мало по сравнению с миллионами изображений, используемых для обучения моделей 2D.
Чтобы справиться с этой проблемой, ученые переработали данные, объединили их и сократили число уникальных классов объектов.
Эксперименты подтвердили, что новая модель может эффективно распознавать объекты в разных типах 3D-данных: «облаках точек», координатах, полученных с лазерных радаров, и других источниках.
Исследователи уверены, что их разработка ускорит создание сложных систем машинного зрения и повысит их точность.
Напомним, что российские ученые рассказали о странных звуках из саркофагов в Антарктиде. Подробнее об этом читайте в материале «ЭкоПравды».
Больше актуальных новостей и эксклюзивных видео смотрите в телеграм канале "ЭкоПравда". Присоединяйтесь!
Подписывайтесь на ЭкоПравда: