vityok_m4_15 (vityok_m4_15) wrote,
vityok_m4_15
vityok_m4_15

Categories:

Лизаалерт, дроны и нейронные сети

Много букв



По оценке Александра Ломоносова, координатора направления «Беспилотный поиск» отряда «Лиза Алерт», один поиск дает приблизительно 2,5 тыс. фото с квадрокоптера, на их просмотр вручную требуется в среднем 240 часов. И вот здесь появляется второй помощник – интеллектуальное ПО распознавания образов.

Сервис «BeelineAI–Поиск», который «ВымпелКом» разработал специально для поддержки поисковых задач «Лиза Алерт», использует механизмы глубокого обучения (Deep Learning, DL) на сверточной нейронной сети. В качестве базовой архитектуры выбрана известная модель VGG16, которая регулярно показывает отличные результаты в различных глобальных соревнованиях DL–сетей по тематике распознавания образов. Как рассказал Джордж Хелд, вице–президент по развитию цифрового и нового бизнеса «Вымпелком», ПО сервиса реализует модель VGG16, которая содержит до 30 сверточных слоев (каждый слой фактически соответствует некоторым признакам, выявляемым на изображениях) и 3 полносвязных слоя (характеризует наличие нескольких признаков одновременно). Он подчеркнул, что модель DL используется для реализации интеллектуальных алгоритмов двух типов: собственно распознавания того, что изображено на каждом фото, и прогнозирования – наличия человека или важных артефактов (например, рюкзак, сапог или иной предмет, не являющийся естественным элементом окружающей среды).

Для задач DL особое значение имеет обучающий набор данных (так называемый «датасет»). Сложность данной ситуации, пояснил Александр Ломоносов, заключалась в том, что нигде в мире не существует готового набора данных, ориентированного на задачи поисковой деятельности. Разработчики «BeelineAI–Поиск» использовали имеющиеся датасеты для задач распознавания изображений из арсенала VGG16, собирали подходящий материал в интернете, а также формировали обучающий набор данных своими силами. Например, просили волонтеров делать собственные фото в позах, характерных для рассматриваемых ситуаций, в своем регионе и в разные времена года.

Архитектурная модель VGG16 требует для своей работы большого количества вычислительных ресурсов. Джордж Хелд пояснил, что нейросетевое ПО работает в ЦОДе «Вымпелком» в Ярославле, и доступно участникам отряда в двух режимах: онлайн (через постоянное подключение к облаку BeeCloud) или офлайн (с помощью приложения, устанавливаемом на портативном компьютере, которое обновляется при установлении связи с облаком провайдера). В этих условиях, по оценкам Хелда, длительность анализа фотоизображений одного полета квадрокоптера сокращается до нескольких секунд.

Счет на минуты и секунды в данном случае – это не просто выдающиеся технологические результаты, а реально спасенные человеческие жизни, напомнил Григорий Сергеев: «В нашей стране суровый климат, как правило, у нас нет часов и дней для просмотра фото вручную».

Команда «Лиза Алерт» довольна результатами пилотного тестирования и переводит сервис «BeelineAI–Поиск» в режим повсеместного поиска, который, к слову, сегодня охватывает 50 регионов России.

«За полгода поиска квадрокоптеры создают приблизительно 33 тысячи фотоснимков местности. С помощью умного ПО, которое мы в течение двух месяцев тестировали в реальных пилотных поисковых операциях, мы можем этот объем изображений обработать не за шесть месяцев, а за один день, если во всех регионах страны ежедневно будут работать дроны», – отмечает Александр Ломоносов.

Отряд прорабатывает применение других типов оборудования, а также технологий обработки данных аэрофотосъемки и др. В частности, идут переговоры с концерном «Калашников», компанией «Геоскан» и т.д.

Сами умные технологии также будут совершенствоваться. Дело в том, что для задачи обнаружения человека на фото участка леса, сделанного с высоты полета квадрокоптера, критически важна так называемая ошибка второго рода («пропуск цели») и менее важна ошибка первого рода («ложная тревога»). На нынешнем этапе, как пояснил Джордж Хелд, DL–алгоритм решает задачу быстрого выявления тех фото, на которых нет человека. Нынешняя точность его работы – 99,999%. Фактически, алгоритм быстро сужает пространство поиска для пеших групп спасателей.

«Вначале группы получают фото тех мест, на которых система DL обнаружила присутствие человека, а затем поисковые группы получают фото, которые программа признала пустыми», – рассказывает Александр Ломоносов.

Дальнейшее развитие блока предиктивной аналитики сервиса «BeelineAI–Поиск», по словам Джорджа Хелда, предполагает включение в анализ дополнительной информации, например, наличие тропинки или следов человека, для формирования гипотезы о том, в каком направлении, скорее всего, человек двинулся дальше




Subscribe
Buy for 1 000 tokens
Buy promo for minimal price.
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 3 comments