От точного распознавания дорожных знаков до голосового ассистента — как крупнейший сервис доставки и такси учит ИИ «видеть» улицы
Grab — лидер рынка доставки еды и каршеринга в Юго-Восточной Азии с 42 млн пользователей в месяц и 6 млн водителей-партнеров. Но их амбиции выходят за рамки такси и фудтех-сервисов: с помощью GPT-4o Vision компания создает GrabMaps — гиперточные карты, которые не просто показывают дороги, а понимают их особенности.
«Чтобы удовлетворить потребности региона, нам нужно было создать что-то по-настоящему локальное и динамичное — карты, которые эволюционируют вместе с городами», — Адриан Марджин, руководитель отдела Data Science в Grab.
Почему Юго-Восточная Азия — вызов для картографов?
Узкие улицы, рассчитанные на мотоциклы и пешеходов
Быстро меняющаяся городская среда
Ограниченное покрытие у традиционных картографических сервисов
«Чтобы соответствовать потребностям региона, нам нужно было создать что-то гиперлокальное и динамичное — карты, которые развиваются вместе с Юго-Восточной Азией».
— Эдриан Маргин, руководитель отдела геокартографии Grab.
Для решения этой задачи Grab использует GPT-4o с точной настройкой компьютерного зрения.
Сеть мотоциклистов и пешеходов-партнёров, оснащённых 360-градусными камерами, собирает миллионы изображений улиц, которые затем используются для обучения моделей и создания детализированных карт.
GPT-4o помогает GrabMaps точнее распознавать знаки ограничения скорости, правила поворотов, названия мест и геометрию дорог.
Использование компьютерного зрения для автоматизации картографии
Первый эксперимент Grab сосредоточился на привязке знаков ограничения скорости к соответствующим дорогам.
Команда использовала всего 100 примеров, сочетая уличные изображения и картографические данные, а затем корректировала гиперпараметры модели для повышения точности.
Изначально точность составила 67%, но после двух раундов настройки достигла 80%, увеличившись на 13 процентных пунктов.
Модель особенно хорошо справляется со сложными сценариями, такими как эстакады и перекрытия видимости, которые раньше требовали значительного ручного вмешательства. Анализируя изображения улиц в сочетании с картами, модель принимает контекстно-обоснованные решения, сравнимые с работой человеческих операторов.
«Тонкая настройка GPT-4o с нашими данными позволила нам эффективнее обрабатывать сложную геометрию дорог, сократив затраты на ручную работу».
— Эдриан Маргин, руководитель отдела геокартографии Grab.
Снижение затрат и повышение доверия к данным
Внедрение компьютерного зрения дало значительный эффект:
Точность определения количества полос движения выросла на 20%.
Определение местоположения знаков ограничения скорости улучшилось на 13%.
Сократились затраты на ручную картографию, что повысило доверие к качеству данных.
Улучшилось распознавание сложных ситуаций (например, знаков на эстакадах), что привело к снижению количества ошибок в картах.
Эти улучшения делают платформу Grab надёжнее как для внутренних операций, так и для корпоративных клиентов. Детализированные карты ежедневно помогают миллионам пользователей и водителей-партнёров, способствуя экономическому развитию региона.
«GrabMaps — это не просто инструмент, а наше обязательство перед Юго-Восточной Азией. Благодаря технологии OpenAI мы сделали процесс картографии быстрее, умнее и экономичнее», — добавляет Маргин.
Расширение доступности и удобства
Grab продолжает развивать ИИ-решения для повышения доступности и удобства своей платформы. В разработке — голосовой помощник с мультиязыковой поддержкой, который поможет слабовидящим и пожилым пользователям проще взаимодействовать с приложением.
Также компания создаёт усовершенствованный чат-бот поддержки, способный разбирать сложные запросы. Он анализирует стандартные операционные процедуры (SOPs) и даёт персонализированные, эмпатичные ответы, улучшая пользовательский опыт и масштабируемость сервиса.
«Мы были пионерами в применении ИИ в регионе и видим огромный потенциал этой технологии. Работа с OpenAI помогает нам ускорять исследования и внедрение инновационных решений», — говорит Филипп Кандал, директор по продукту в Grab.