Стабильное субметровое позиционирование — основа современного мобильности: от точных посадок для каршеринга и эффективной доставки до AR и автономных систем. Однако достичь точности менее метра на массовых устройствах все еще непросто.
На рынке испытывают множество подходов: RTK и PPP-корректировки, методы 5G по спецификациям 3GPP, SLAM, лидар, инерциальные измерительные блоки (IMU), UWB. В повседневных, масштабных сценариях разговор сводится преимущественно к двум парадигмам: визуальным системам позиционирования (VPS), сопоставляющим изображения с эталонными базами, и к слиянию GNSS с IMU (GNSS+IMU), которое объединяет спутниковые координаты с инерционными данными из уже существующих в миллиардах устройств датчиков.
Эти подходы не конкурируют, а дополняют друг друга. В плотной городской застройке, где GNSS приемники страдают от многопутевости и затенения, VPS показывает наилучшие результаты. На открытых пространствах, где визуальных ориентиров мало, пальму первенства держит GNSS+IMU. Более того, сами VPS обычно полагаются на GNSS для сужения пространства поиска в базах изображений. Вместе это кирпичики следующего поколения пространственного интеллекта.
GNSS+IMU: масштабируемая основа
GNSS дает глобальное покрытие, но на смартфонах типичной является ошибка 3–5 м, чего недостаточно для ведения по полосам, точного пешеходного маршрута или подведения к входу в здание. Добавление IMU меняет ситуацию: инерционные данные вносят контекст ориентации и движения.
Слияние сенсоров объединяет позицию GNSS (x, y, z) с ориентацией из IMU (α, β, γ), обеспечивая шесть степеней свободы (6DoF). Устройство определяет не только где оно находится, но и куда направлено — критично для навигации и якорной привязки в AR. Важно и то, что такое слияние эффективно работает на самом устройстве, полагаясь на маломощные сенсоры, не разряжает батарею, не зависит от видимости камеры и минимизирует риски приватности, поскольку не требует постоянного видеопотока.
Роль VPS: сильный козырь в городах
VPS с помощью компьютерного зрения определяет положение относительно известных ориентиров. В благоприятных условиях — прежде всего в плотных, насыщенных объектами городских районах — точность впечатляет. Этот подход хорошо прижился для AR-якорей, пешеходной навигации и даже части indoor-кейсов, где GNSS самостоятельно редко достигает подобного уровня.
Тем не менее, масштабирование VPS как универсального решения ограничивают несколько факторов. Поддержание огромных библиотек эталонных изображений требует непрерывного сбора и обновления контента (даже на ресурсах уровня Street View от Google), камеры и нейросетевое сопоставление активно потребляют энергию и вычисления, а в условиях низкой освещенности, непогоды или в «бедных на признаки» средах (открытые поля, коридоры со стеклом и бликами) точность заметно падает. Добавьте к этому вопросы приватности и соответствие GDPR из-за постоянного использования камеры.
Именно поэтому VPS лучше всего проявляет себя там, где GNSS имеет наибольшие проблемы — в плотной застройке. В паре с GNSS+IMU эта комбинация существенно усиливает общую надежность локализации.
Полевые результаты: сенсорное слияние на практике
Независимые испытания демонстрируют, что GNSS+IMU существенно повышает точность в реальных условиях. Например, в Луисвилле (штат Колорадо) обычные смартфоны только с GNSS показали среднюю ошибку около 1,9 м. Когда добавили коллаборативные корректировки и слияние с IMU, средняя ошибка уменьшилась до approximately 0,55 м — более чем в три раза лучше.
Чтобы сравнить локализацию с визуальными подходами, рассматривали определение курса по сенсорной методике Zephr против VPS от Google, одного из отраслевых эталонов. На той же локации и том же устройстве курсы, сгенерированные ArPose и Zephr, сопоставили с выходами VPS. Результат (Рисунок 1): сильная корреляция, средняя разница курса всего 7,58° и корреляция курса 99,52%. Это показывает, что сенсорные методы способны достигать точности по курсу, сопоставимой с визуальными, без затрат на данные, вычисления и непрерывную работу камеры.
Сравнение подходов: кто и где лучше
— Стоимость и инфраструктура. VPS обеспечивает детализированное визуальное позиционирование, но требует постоянных инвестиций в сбор и обновление эталонных изображений — вплоть до петабайтов данных и масштабных облачных хранилищ. GNSS+IMU использует существующие спутниковые созвездия и массовые сенсоры в смартфонах, так что масштабируется естественно без дополнительной инфраструктуры.
— Аккумулятор и вычисления. VPS должен держать камеру активной и обрабатывать высокоразрешающие кадры — это энерго- и ресурсоемко. GNSS+IMU сливает легкие сенсорные данные на устройстве, поддерживая режим реального времени с минимальным потреблением. Гибридные системы могут эпизодически включать VPS как визуальные якоря, когда позволяет энергобюджет.
— Устойчивость к среде. VPS блестяще работает в городских ядрах, но деградирует при слабой освещенности, непогоде или в средах с бедной геометрией — на трассах или в открытых полях. GNSS+IMU стабильно работает в большинстве внешних сценариев, а IMU перекрывает короткие провалы GNSS в туннелях или «городских каньонах». Вместе они расширяют надежное покрытие.
— Приватность. VPS полагается на постоянные видеопотоки, что порождает риски с точки зрения GDPR и CCPA. GNSS+IMU использует только инерционные и спутниковые данные, которые можно анонимизировать и обрабатывать локально. Приложения, чувствительные к приватности, обычно берут GNSS+IMU по умолчанию и включают VPS лишь контролируемо.
— Масштабируемость. VPS дает отличные результаты в уже отснятых регионах, но тормозится стоимостью глобального сбора и поддержания визуальных баз. GNSS+IMU масштабируются вместе с поставками устройств со стандартными приемниками и сенсорами, а точность возрастает дополнительно, когда устройства делятся поправками в общей сети. В паре VPS наиболее полезен в плотных городских коридорах, где визуальное разнообразие оправдывает инфраструктурные затраты.
Мимо «только точности»: пространственный интеллект без камер
Слияние GNSS+IMU не только уменьшает ошибку, но и добавляет контекст. Объединив позиционные векторы с ориентацией, система понимает не только местоположение устройства, но и что именно попадает в его поле зрения. Это открывает путь к навигации, чувствительной к ориентирам, и естественным взаимодействиям с AI: вместо координат — «встретимся у синего почтового ящика рядом с входом в кафе». В AR цифровой контент можно привязывать к реальному миру без нагрузки визуальных пайплайнов. А ассистенты могут отвечать на пространственные запросы вроде «Ресторан справа или слева?» интуитивно точно.
При этом VPS остается полезным приложением в визуально насыщенных пространствах, предоставляя надежные «якоря». Вместе методы образуют более гибкую и устойчивую систему локализации, чем каждый по отдельности.
Вывод: курс на мультимодальность с опорой на GNSS+IMU
VPS доказал ценность в исследованиях, робототехнике и AR-демонстрациях, особенно в плотных городах. Но зависимость от массивов изображений, тяжелые вычисления и постоянная работа камеры усложняют масштабирование как универсального средства до субметровой точности.
Чтобы запустить новую волну пространственно-умных приложений — от контекстных ассистентов до погружающей AR, — локализация должна быть практичной и массово масштабируемой. Эта основа дается слиянием GNSS+IMU, дополненным визуальными методами там, где они добавляют ценность. GNSS+IMU опирается на инфраструктуру и сенсоры, уже встроенные в миллиарды устройств, обеспечивает эффективную локальную обработку и обходят компромиссы приватности, присущие камерам.
По мере того как позиционирование становится «скелетом» пространственного AI, вырисовывается четкая картина: будущее будет мультимодальным, но масштабируемым каркасом останется слияние GNSS+IMU — оно позволяет устройствам надежно понимать мир и взаимодействовать с ним, с камерой или без нее.
Источник: GPS-World


