Другие журналы

научное издание МГТУ им. Н.Э. Баумана

НАУКА и ОБРАЗОВАНИЕ

Издатель ФГБОУ ВПО "МГТУ им. Н.Э. Баумана". Эл № ФС 77 - 48211.  ISSN 1994-0408

Программа редактирования фотографий создает трехмерный мир

#4 апрель 2007

Photo software creates 3-D world

Программа редактирования фотографий

создает трехмерный мир

В век цифрового фото составление фотоколлекций становится все проблематичнее. Существует пословица "лучше один раз увидеть, чем сто раз услышать". Но теперь возникает другой вопрос: чего стоят сотни и сотни изображений?

 

"Любой, кто имеет цифровую камеру, неизбежно сталкивается с такой проблемой, когда у него накапливается больше фотографий, чем он способен посмотреть, и когда становится очень трудно найти среди всего количества фотографий нужную," говорит  Стив Сейтц, адъюнкт-профессор компьютерных наук.

 

Теперь же экспериментальное программное обеспечение под названием Photo Tourism, специально разработанное программистами корпорации Microsoft и университета Вашингтона, обращает на пользу фотолюбителю чрезмерное количество отснятых им фотографий. Сотни фотографий с изображением одной-единственной сцены, отснятой в разных ракурсах, могут быть превращены в трехмерный виртуальный мир. Эта технология имеет большой потенциал  - не только для того, чтобы составлять фотоколлекции, но и для того, чтобы сразу сфотографировать сцену в трехмерном изображении, и, возможно когда-нибудь создать визуальную карту всех фотографий в Интернете.

 

За прошлый год исследование в этой области приблизилось к рынку. Работа еще на ранней стадии привлекла внимание специалистов на проведенном в марте заседании TechFest корпорации Microsoft. Затем работа над проектом была продолжена, и его представили на конференции по графическим программам в августе. Microsoft Live Labs подписала коммерческую лицензию для программы опытного образца в августе 2006 года. В течение нескольких месяцев компания тестировала предварительный вариант продукта, которому дали название Photosynth.

 

 

"Было просто здорово видеть, сколько людей хотело увидеть этот продукт в действии," говорит докторант Снейвли. В то время как разработка программы Photosynth идет своим собственным путем, Снейвлай продолжает разрабатывать Photo Tourism для своей докторской диссертации в сотрудничестве с Seitz, экспертом по  компьютерному зрению, и Риком Селиски, служащим корпорации Microsoft и, по совместительству, профессором в Университете Вашингтона.

 

Снейвли приехал из Университета Аризоны три года назад, заинтересованный исследованием компьютерной графики. Его целью было исследование не только личных коллекций фотографий, но и массивных коллекций фотографий в интернете, таких, как на популярном вебсайте Flickr.  Сейчас в общем и целом количество фотографий, добавленных на сайт Flickr, перевалило за 200 миллионов.

 

Если набрать, например, слова Trevi Fountain в поисковой строке сайта Flickr, то поисковая система выдаст более 11 000 фотографий. Просмотр этих фотографий заключается в простом перелистывании страниц со всеми найденными фотографиями, щелкая мышью по маленьким изображениям, ссылки от которых ведут к большим изображениям.  Любой, кто хоть раз искал нажные изображения, например, на поисковом сервере Google, знаком с чувством, которое испытываешь, когда система выдает совсем не то изображение, которое ищешь. Ведь найти похожее изображение - это еще не значит найти менно то, что ищешь.

 

"Когда находишь фото в обычном поисковике, смотришь на фотографию и гадаешь: а что находится слева от того, что изображено на фото? а что справа? Или думаешь, как жаль, что нельзя увидеть изображение в другим масштабе," объясняет Снейвли. Это похоже на серьезное испытание - найти одно и то же изображение, сфотографированное с разных точек зрения и/или в разное время суток. Поиск фотографий с изображением фонтана Trevi был в данном случае тестовым поиском.  Снейвли никогда не был в Риме и никогда не видел фонтана Треви, но после просмотра фотографий, найденных на сайте Flickr, Снейвли может сказать, что практически увидел фонтан со всех точек зрения.

 

Чтобы решить проблему, исследователи использовали недавно разработанные передовые технологии в области компьютерного зрения.  Они написали программу, которое анализирует каждое изображение и вычисляет, откуда оно. Чтобы сделать это, программа ищет маленькие детали, сходные с деталями других фотографий, которые можно использовать для того, чтобы сравнить их и затем скомбинировать вместе в трех измерениях. Каждая фотография представлена маленьким квадратиком, помещенным в соответствующее положение в эскизе оригинальной сцены.

 

Эффект заключается в том, что просматриваешь сотни или тысячи фотографий, но это больше похоже на видеоигру. Перемещаясь вправо или влево или изменяя масштаб изображения, компьютер в конце концов приведет к нужному изображению.  Выделяя, например, статую Нептуна (в случае с фотографиями фонтана Треви), компьютер выдает окончательный результат:  фотографию высокого разрешения данного объекта.

 

По словам Стива Сейтца, новая программа выходит за пределы простого составления коллекции фотографий. Она практически заново воссоздает  изображение или место в соответствии с разрешением имеющихся фотографий. Агентства недвижимого имущества, музеи и отели вполне могли бы использовать новую программу для создания виртуальных туров, потому что люди сами могут изменить масштаб изображения для того, чтобы, например, прочитать меню в ресторане или подробнее рассмотреть картину в музее. Археологи и биологи выразили интерес к созданию реалистических визуальных презентаций своих вебсайтов. Военные организации и организации слежения и наблюдения также хотели бы составлять фотографии интуитивным способом. Поклонники разных видов спрта тоже могли бы составлять и обновлять свои любимые игры,  комбинируя все фотографии, отснятые во время игры.

 

Данный интерфейс представляет каждую фотографию как небольшой квардратик, и фотографии как бы наслаиваются одна на другую в рамках этого квадратика, что создает эффект трехмерного изображения. Специалисты сейчас даже говорят о том, что они собираются разработать программу до такой стадии, когда она будет создавать интерфейс, сходный с интерфейсом игр. У пользователей будет создаваться ощущение, что они как будто они путешествуют по трехмерному миру.

 

Компании, такие, как Google и Microsoft, недавно начали создавать трехмерные модели городов, кропотливо собирая фотографии, снятые с разных точек зрения, и затем комбинируя их вместе. Что касается Photo Tourism'а, то с этим не все так гладко, так как иногда, например, не хватает фотографий, снятых с опреденного угла, или на фотографиях бывают изображения людей на фоне объектов. Но в долгосрочной перспективе у Photo Tourism'а большое будущее и много преимуществ перед обычнями фотографиями.

 

"Я думаю, что это намного больше, чем просто статическая трехмерная модель," говорит Снейвли.

Самым многообещающим применением Photo Tourism'а в будущем может быть создание коллекции миллионов фотографий, которые существуют в Интернете. Снейвли описывает это как "визуальная Википедия." Пользователи интернета могут загружать в "визуальную Википедию" фотографии, а программа скомбинирует их и, по мере добавления фотографий, будет создавать все более и более всестороннюю картину мира.

Более подробная информация и демо-версия программы Photo Tourism – на сайте http://phototour.cs.washington.edu/.

Информация о программе Microsoft's Photosynth  - на сайте http://labs.live.com/photosynth/.

Источник:

http://www.innovations-report.com/html/reports/information_technology/report-79376.html

 

 

 


Тематические рубрики:
Поделиться:
 
ПОИСК
 
elibrary crossref ulrichsweb neicon rusycon
 
ЮБИЛЕИ
ФОТОРЕПОРТАЖИ
 
СОБЫТИЯ
 
НОВОСТНАЯ ЛЕНТА



Авторы
Пресс-релизы
Библиотека
Конференции
Выставки
О проекте
Rambler's Top100
Телефон: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)
  RSS
© 2003-2019 «Наука и образование»
Перепечатка материалов журнала без согласования с редакцией запрещена
 Тел.: +7 (915) 336-07-65 (строго: среда; пятница c 11-00 до 17-00)