Недавно Google представил фотографии природы, идеально отредактированные при помощи технологии глубинного обучения. Эти снимки, вместе с прочими кадрами, показали профессиональным фотографам. 40% фото, усовершенствованных при помощи искусственного интеллекта, получили высшие оценки экспертов. Это заставляет говорить о переменах в фото-индустрии, к которым привело использование продвинутых технологий.
Коммуна Интерлакен в Швейцарии: внизу реальный кадр, вверху - обработка Google
Искусственный интеллект в действии
В случае с Google, экспертам было сложно определить, какие фотографии редактировались вручную, а с какими работал искусственный интеллект.
На нижнем снимке Ясперский национальный парк в Канаде. Верхний кадр - результат обработки Google.
Как это происходит? С 2017 года на рынке появились нейронные процессоры (NPU) - чипы на основе искусственного интеллекта, которые включают в себя процессор, память, графический чип, модули беспроводной коммуникации и иногда сенсоры. Изначально нейронные процессоры создавались для ускорения работы нейронных сетей, но разработчики обнаружили, что искусственный интеллект способен тратит гораздо меньше времени и ресурсов на обработку фотографий, чем человек. Это дало возможность внедрить интересные фото-решения, например, семантическую сегментацию кадра - "умное" распознавание элементов фотографии с последующим применением разнообразных настроек к каждому сегменту. Неудивительно, что на сегодняшний день нейронные процессоры пришлись по душе создателям мобильных телефонов, которые таким образом совершенствуют камеры.
Искусственный интеллект использует мета-данные и ключевые слова, чтобы впоследствии иллюстрации можно было быстро найти. Компьютер анализирует ключевые слова, чтобы усовершенствовать фотографию до такой степени, которая полностью устроит владельца смартфона. Даем искусственному интеллекту несколько секунд - и появляется превью.
Так как искусственный интеллект в работе пользуется специальными алгоритмами для обработки данных, процесс редактирования осуществляется на базе заданных параметров. Алгоритмы глубинного обучения улучшают качество фотографии, придавая снимку такую правдоподобность, которой было не достичь в прошлом.
В цифровые камеры встраивается продвинутое программное обеспечение, и вот уже есть ощутимая разница между Google Pixel и кадрами, снятыми на последнюю модель iPhone.
Например, ещё в 2018 года в Pixel 3 был встроен режим "ночного зрения", что позволяет делать естественные снимки без применения ненатуральных спецэффектов. Когда телефон находится в статичном положении, а фотографируемый объект движется, "ночное зрение" успевает захватить как можно больше света, чтобы устранить визуальный "шум". Наконец, если владелец телефона не стоит на месте, и гаджет приходит в движение, новые технологии делают несколько тёмных, но четких снимков, которые затем комбинируются, чтобы создать яркое и довольно контрастное фото.
Искусственный интеллект является довольно обучаемым. В отличие от некогда модных роботов, которые проектировались под выполнение конкретной задачи, теперь на рынке появляются другие технологии. Разработчикам достаточно пару раз продемонстрировать таким программам, что от них требуется в будущем, и искусственный интеллект начинает анализировать текущую задачу, предлагая уместное решение.
Например, Google использовал фотографии, которые пользователи загружали в социальную сеть Google+ и приложение Google Photos, чтобы обучать искусственный интеллект алгоритмам распознавания, сортировки и группировки снимков. Таким же образом искусственный интеллект учился улучшать качество и добавлять дополнительные эффекты, например, размытый фон. Получается, что такие технологии не только радуют потребителя эстетической стороной, но и продвигают развитие искусственного интеллекта, который теперь способен анализировать кадры, что раньше казалось недостижимым.
Например, в процессе машинного обучения из панорамы на рисунке A выделен фрагмент B, насыщенность и HDR отражены на сегменте C, а драматический эффект применяется в части D. Каждый шаг отражает одну эстетическую категорию, и это - реальный пример обучения искусственного интеллекта, применяемый в Google.
Тренды и инновации
Выпустив Pixel 5, Google продемонстрировал, что идёт в ногу с веяниями эпохи. Pixel 5 выглядит довольно похожим на Pixel 4. Однако на этот раз модель доступна только в размере дисплея 6 дюймов. Кроме того, Google отказался от системы распознавания жестов и лиц, которая критиковалась экспертами по кибербезопасности за эксплуатацию незащищённого ip-адреса. Вместо этого, телефон узнает владельца по отпечаткам пальцев.
Но поговорим о камере, которой славится Pixel. На этот раз Google заменил телеобъектив широкоугольным. Вы всегда сможете увеличить изображение, и в этом - заслуга Super Res Zoom от Google.
Производительность расширенного динамического диапазона здесь также на высоте. HDR является не маркетинговым ходом с целью привлечь потребителя, а реальным решением, способным снимать в динамике при любом освещении. Наконец, Pixel 5 работает с портретным режимом ночью, и это открывает новые возможности перед творческими личностями.
Как искусственный интеллект повлиял на цифровую фотографию?
Как утверждал Марк Левой, профессор Стэнфордского университета, ответственный за Google Pixel, в случае с искусственным интеллектом речь идёт о так называемой вычислительной фотографии. Это - разнообразные техники вычислительного иллюстрирования, которые улучшают возможности цифрового снимка. Помимо тех функций, которыми обладает камера, вычислительная фотография базируется на алгоритмах программного обеспечения, что и даёт возможность изменить или усовершенствовать кадр.
Так как нейтронный процесс постоянно совершенствуется, телефонные камеры на базе машинного обучения взаимодействуют также с другими приложениями. Например, приложение Welltory использует камеру на смартфоне, чтобы записывать видео с отпечатками пальцев владельца, и эти данные в дальнейшем позволяют измерить вариабельность сердечного ритма и на основании этого сделать предположение о состоянии здоровья.
Такую информацию сообщает приложение Welltory
Кроме того, вычислительная фотография может использоваться в таких случаях:
- распознавание и коррекция тени пригодится в технологиях видеонаблюдения;
- реконструкция иллюстрации позволит работать с документацией, качество которой было испорчено;
- автоматическое фотографирование лица и тела послужит органам власти с целью обеспечения безопасности в местах с большим скоплением людей.
Лайфхак для фотографов
Если, несмотря на продвинутую камеру телефона, снимок получился не самого лучшего качества, есть несколько программ, которые доводят кадры до совершенства благодаря искусственному интеллекту.
Luminar 4 за несколько минут проделает работу, которая обычно длится часами. А именно, уберет дефекты кожи, морщины, тёмные пятна. В то же время, все элементы, которые вы хотите оставить на фотографии, например, характерные веснушки или родимые пятна, останутся нетронутыми.
Photolemur создаёт сбалансированную экспозицию при любом освещении, сделает естественный акцент на глаза и приведёт в порядок кожу, отбелит зубы и выполнит подобную работу достаточно быстро.
Aurora HDR, как можно догадаться по названию программы, использует HDR фильтры для обработки фотографий. Эта технология может свести воедино разрозненные фотографии, убрать засветы, добавить натуральную контрастность и насыщенность. А также устранить нежелательные световые эффекты.
Prisma, несомненно, придётся по душе ценителям искусства. Например, если вы хотите, чтобы ваша фотография выглядела, будто картина, вышедшая из-под кисти Ван Гога, стоит задуматься именно об этой программе. Что интересно, эта технология в работе основывается на вычислительных нейронных сетях.
Sharpen AI делает фото более чётким, даже если съёмка происходила практически без света. Программа, созданная специально для фотографов, использует искусственный интеллект, чтобы отличать деталь от визуального "шума", и работает только с теми элементами, которые этого требуют.
Наверное, почти каждый из нас в детстве мечтал стать фотографом, запечатлеть прекрасные моменты жизни. Но, повзрослев, мы понимаем: для того, чтобы стать хорошим фотографом, необходимо не только иметь художественный талант, но и выдержку, усидчивость - чтобы поймать кадр при правильном освещении, композиции, работать с тенью, светом и "шумом". И мало того, что эта работа довольно кропотлива. Оборудование также стоит дорого: раньше это были плёночные фотоаппараты, где работа с пленкой, негативом и проявителем отнимала много сил и времени. Затем появилась цифровая техника с большим набором настроек, что облегчило работу фотографа, но все же времени на обработку вручную уходило немало. Теперь каждый смартфон имеет камеру, правда, качество снимков, сделанных на флагманы, оставляет желать лучшего.
Но теперь, с развитием искусственного интеллекта и применением его в камерах, встроенных в гаджеты, каждый может почувствовать себя фотографом, делая качественные снимки и принося эстетическое удовольствие своим близким.
Ася Шкуро и Дмитрий Журавель
Персоны1 и Компании3 в новости
Новости по теме
Последние новости
Общественная редакция в Москве
- Запросами в любые органы власти местного и федерального уровня;
- Экспертными мнениями о проблеме у тематических спикеров.