Подписаться ВК
 12.09.2023 в 21:20   OpenAI

Размытие по Гауссу в цифровой обработке изображений для рендеринга в реальном времени

Поделиться
с друзьями:

Эксперимент с использованием Размытия по Гауссу привлек внимание как энтузиастов, так и профессионалов, благодаря своим особенностям. Алекс Карлье решил провести творческое испытание этого метода. В ходе эксперимента он в ручную настраивал различные положения камеры для трех изображений в одной сцене, а затем использовал обученные нейросети. При изменении перспективы камеры возникает завораживающий эффект перехода, плавно переходящий одно изображение в другое. Размытие продемонстрировало свою способность плавно отображать различные изображения под разными углами, демонстрируя потенциал этой инновационной технологии.

Реализация Размытия по Гауссу была интегрирована в популярную библиотеку NerfStudio , расширяя возможности графических энтузиастов. NerfStudio представляет собой комплексную платформу с упрощенным API, которая позволяет создавать, обучать и тестировать модели NeRF (Neural Radiance Fields). Модульная структура каждого компонента обеспечивает более удобную и понятную реализацию библиотеки. Практические последствия этого эксперимента выходят за рамки обычных экспериментов.

NerfStudio становится удобным репозиторием для участников. Целью проекта является создание сообщества, в котором пользователи опираются на вклад друг друга, способствуя инновациям и прогрессу в этой области. Он был первоначально представлен как проект с открытым исходным кодом студентами Berkeley AI Research ( BAIR ) в октябре 2022 года в рамках исследовательской деятельности и продолжает развиваться благодаря вкладу студентов Беркли и более широкого сообщества.

Видео, демонстрирующее способность алгоритма реконструировать трехмерную сцену с использованием изображений, снятых дроном, является увлекательной иллюстрацией мастерства алгоритма. Это замечательное достижение связано с недавним переосмыслением техники нейронного рендеринга, которая казалась «старой». Инновационный метод предполагает использование Structure from Motion (COLMAP) для извлечения облака точек из видеоданных. Затем над облаком точек инициализируется кластер небольших полупрозрачных точек, которые тщательно оптимизируются для точного восстановления исходных кадров после рендеринга. В результате получается яркая, захватывающая 3D-сцена, по которой можно перемещаться в режиме реального времени.

Хотя этот метод может показаться передовым, он имеет сходство с подходом Neural Point-Based Graphics 2019 года, который включал обучение плоских эллипсоидов для каждой точки аналогичным образом. Простота этого метода доказывает его силу, обеспечивая как эффективное обучение, так и быстрый рендеринг.

Комментарии: