Любой релиз open-source модели от Apple вызывает автоматический интерес разработчиков. Но если посмотреть на их новый генератор LiTo, возникают сомнения в его практической ценности. В основе лежит токенизация поверхностного светового поля — алгоритм восстанавливает форму объекта через анализ освещения с разных ракурсов. Звучит как надежная база, но на практике подход пока не дает нужной плотности сетки.
Проблема в том, что исследователи выбрали довольно удобный бейзлайн для оценки качества. Они сравнивают результаты с первой версией TRELLIS, указывая на ошибки конкурента с ориентацией камеры. При этом пространственного разрешения самому LiTo явно не хватает, а геометрия получается слишком сглаженной. На фоне современных моделей вроде Hunyuan3D разработка Apple выглядит скорее как академический эксперимент.
Правда, проект может оказаться полезным с архитектурной точки зрения. Команда опубликовала код и веса, так что концепцию можно разобрать на запчасти. Сама идея работы со световыми полями для реконструкции объема имеет смысл для будущих пайплайнов. Вопрос лишь в том, станет ли кто-то развивать этот фреймворк при наличии более мощных альтернатив.
Поделиться:
Документальный сериал Студии Артемия Лебедева о формировании языка дизайна пространства →
Архитектура Claude Code: реверс-инжиниринг AI-агента от Anthropic →