Цифровое объемное телевидение 3DTV
Наступление эры цифрового телевидения — уже свершившийся факт. Каким же станет дальнейшее развитие? Телевидение стандартной четкости (SD) сменяется телевидением высокой четкости (HD). Как известно, количественные изменения имеет тенденцию переходить в качественные. Многие обозреватели предполагают, что следующим качественным скачком будет появление объемного телевидения. Предсказывают, что такое телевидение появится в течение 10 лет. В данной статье рассказывается, как уже сегодня на основе промышленно выпускаемых устройств создаются системы показа стереоскопического видео.
Краткая историческая ретроспектива
В истории развития телевидения и цифрового видео можно выделить следующие крупные этапы:
1 -- черно-белое телевидение -- передается яркость изображения.
2 -- цветное телевидение -- передается яркость и цветовые составляющие. С точки зрения объема данных, добавление цвета -- это количественный переход. С точки зрения наблюдателя -- качественный.
3 -- появление цифрового видео (Video CD, DVD) -- качественный переход с точки зрения формата данных.
4 -- цифровое видео и телевидение высокого разрешения (Blu-Ray, HDTV)-- количественный переход с точки зрения объема данных. Однако передаются все те же составляющие: яркость и цвет.
Среди специалистов и зрителей назрело ожидание очередного качественного перехода, давно предсказанного писателями-фантастами, -- появление объемного телевидения. Долгое время "узким местом" в реализации стереоскопического видеопоказа был объем данных, который было невозможно передать существующими средствами. Цифровое телевидение позволило передавать достаточное количество информации и стало основой ряда устройств, позволяющих осуществить объемную визуализацию.
Каким должно быть стереоскопическое телевидение
Попробуем сформулировать основные требования к объемному телевидению для широкого применения в домашних условиях.
С точки зрения пользователя (зрителя):
- Устройство воспроизведения должно создавать реалистичное ощущение объемности изображения.
- Просмотр должен осуществляется естественно, без напряжения, для просмотра не должны требоваться дополнительные устройства (например, шлем или специальные очки). Он должен быть доступен как для одного наблюдателя, так и для нескольких зрителей одновременно.
- Устройство визуализации должно «уметь» показывать как стереоскопические, так и обычные изображения.
- Устройство визуализации должно быть достаточно компактным и удобным для размещения в жилых помещениях.
С точки зрения инженеров, обобщенные требования к средствам и техническим устройствам объемного телевидения:
- Объем данных, необходимых для показа стереоскопического изображения, не должен существенно превосходить объем данных, передаваемых для обычного изображения.
- Способ передачи данных должен быть совместим с существующими стандартами и технологиями.
Казалось бы, перечисленным требованиям трудно удовлетворить одновременно. Однако совокупность современных технических решений делают это возможным.
Физические основы стереоскопического восприятия
Получить представление об объемности окружающего мира человеку позволяет ряд явлений: геометрическая и воздушная перспектива, тени и блики на поверхностях объектов, относительные размеры объектов. Изобразительные приемы, моделирующие эти явления, используются художниками с давних пор для передачи объемности трехмерных предметов, нарисованных на плоскости.
Природа наделила человека бинокулярным зрением -- парой глаз, расположенных на расстоянии 60-70 мм. За счет этого человек видит мир одновременно с двух точек наблюдения. В результате изображения, получаемые левым и правым глазом, слегка отличаются. Эти два изображения принято называть стереопарой. Анализируя различия между изображениями стереопары, мозг человека получает информацию об объеме и удаленности наблюдаемых объектов (рис. 1).
Рис. 1. Параллакс: каждый глаз видит предмет по-своему; мозг оценивает разницу и формирует объемный образ (изображения с сайта www.triaxes.ru). |
Кажущееся смещение рассматриваемого объекта, вызванное изменением точки наблюдения, называется параллаксом и является главным фактором в восприятии трехмерности мира.
Все способы, которые широко используются для создания стереоэффекта в видео, используют принцип раздельного просмотра -- левому глазу человека демонстрируется левое изображение стереопары, правому -- правое. Различия заключаются в том, каким образом достигается сепарация (разделение) изображений стереопары. Большинство современных устройств стереовизуализации и в кино, и в телевидении основаны на методах, известных более 100 лет.
Анаглифному методу показа 150 лет. Метод предложен ДАльмейда и Дюко дю Ороном в 1858 году. Реализован в кино Луи Люмьером в 1935-м. Анаглифный метод (от греч. anagliphos -- рельефный) состоит в окрашивании изображений стереопары в дополнительные цвета. Оба кадра стереопары формируют одно изображение. Разделение левого и правого кадра происходит с помощью цветных очков, окрашенных в соответствующие цвета. Анаглифный метод используется и в кинопоказе, и в телевизионных трансляциях. Этот метод работает практически на любых цветных телевизорах и мониторах. Достоинство метода -- простота и дешевизна реализации, недостаток -- потеря части цветов и необходимость использования очков.
Поляризационному методу стереопроекции около 120 лет. Предложен Ж. Андертоном в 1891 году. Получил широкое распространение после изобретения в 1935-м Е. Лэндом поляроидной пленки. Левый и правый кадр проецируются одновременно, но свет поляризуется (линейно или циркулярно) в разных направлениях. Просмотр осуществляется с помощью очков, имеющих соответствующие светофильтры. Поляризационный метод получил широкое распространение в кинопрокате благодаря четкому разделению стереопары, сохранению цветности; недостатки -- необходимость использования дорогостоящего оборудования, специальных устройств визуализации и очки, которые зритель должен надевать. Используется в кинотеатрах IMAX и др.
Растровому стерео более 110 лет. Впервые метод безочкового стерео с применением параллельного светопоглощающего растра предложен одновременно Бертье и Лизегангом в 1896 году. Впервые в мире для демонстрации стереокино этот метод был предложен в СССР С. Ивановым и А. Андриевским и реализован под руководством Б. Иванова в 1942-м. Первый в мире кинотеатр с растрово-линзовым экраном "Стереокино" был открыт в Москве в 1947-м. Растр выглядел в виде ряда непрозрачных вертикальных полос. Свет проходил в прозрачные участки между полосами, каждому глазу зрителя показывался необходимый фрагмент изображения. Размеры экрана составляли 3х3 м.
Подобные устройства "безочковой" объемной визуализации называются автостереоскопическими. Этот метод имеет различные конструктивные реализации: барьерный, линзовый варианты. В настоящее время в основном используется линзово-растровый (lenticular) вариант конструкции экранов. Для показа через растр исходная стереопара кадров "нарезается" на вертикальные полоски, которые затем чередуются так, чтобы под каждой линзой оказалась пара полос: одна от левого кадра, другая -- от правого. Такое "полосатое" изображение называют кодированным. Принцип действия линзово-растрового экрана показан на рис. 2. Поток света, исходящий от кодированного изображения, проходя через линзы, разделяется таким образом, что левый глаз наблюдателя видит левое изображение стереопары, правый глаз -- правое.
Рис. 2. Схема разделения кодированного изображения стереопары с помощью линзового растра. Левое изображение условно обозначено красным цветом, правое – голубым (изображения с сайта www.triaxes.ru). |
Наибольший эффект от линзово-растрового способа показа достигается, когда показываются не два кадра стереопары, а ряд кадров, сделанных с небольшим смещением по горизонтали (многоракурсная съемка). В этом случае при просмотре образуется широкая зона стереовидения, в которой наблюдатель может перемещаться, поочередно наблюдая сцену с разных ракурсов. Появляется возможность как бы заглянуть за объекты переднего плана. Это придает натуральность наблюдаемому стереоизображению. В фотографии для съемки серии кадров используют специальные стереофотокамеры с рядом объективов (рис. 3), или специальные штативы, позволяющие при съемке перемещать камеру в горизонтальном направлении (рис. 4).
Рис. 3. Многообъективный стереофотоаппарат (фотография с www.3-dimages.com). |
Рис. 4. Штатив Triaxes StereoRail для стереопарной и многоракурсной фото-видеосъемки (изображения с сайта www.triaxes.ru). |
Достоинство растрового метода в том, что устройство сепарации объединено с самим изображением и зрителю нет необходимости надевать какие-либо очки для просмотра. Кроме того, формирование объемного изображения из серии кадров, снятых с различных точек зрения, позволяет придать большую реалистичность сцене.
Недостаток в том, что для качественного воспроизведения объемного изображения требуется гораздо больше данных. Если для анаглифного и поляризационного методов достаточно двух кадров стереопары, то для растрового желательно иметь одновременно 9-12 кадров. Далее будет рассказано о способе решения данной проблемы.
Стереоскопические мониторы (телевизоры)
Существует большое количество реализаций стереоскопических мониторов [см. Сергей Книгин. 3D дисплеи.]. Практически у всех известных марок (LG, Philips, Sharp и др.) есть модели стереомониторов, основанные на принципе линзового растра. Это можно объяснить тем, что данные устройства достаточно хорошо отвечают требованиям 1-5 из обозначенных выше. Разработка линзово-растровых стереомониторов началась еще в прошлом веке (например, Philips), однако действительно хорошего эффекта и определенного коммерческого успеха удалось добиться лишь сравнительно недавно, с распространением стандарта высокого разрешения (HD). Это связано с тем, что для формирования кодированного многоракурсного изображения требуется разрешение более высокое, чем для каждого из исходных кадров по отдельности: под каждую линзу должны войти элементы всех исходных кадров. Только с появлением возможности передавать и декодировать видео высокого разрешения количества пикселов стало достаточно, чтобы увеличить качество воспроизводимого стерео (3D) эффекта.
Формат 2D + Z
Очевидно, что выполнить многоракурсную видеосъемку -- задача непростая. Требуется либо специальная камера с большим количеством объективов, либо ряд камер и устройство, обеспечивающее синхронную съемку. Надо учесть также, что возникает задача хранения большого количества данных -- видеопотоков с каждой камеры. Даже с учетом того, что современные методы цифрового видеосжатия позволяют эффективно учитывать временную и пространственную избыточность, объем данных при многоракурсной видеосъемке возрастет многократно.
Один из эффективных способов решения проблемы большого объема данных состоит в использовании так называемого формата 2D+Z. Любому обычному (2D) изображению можно сопоставить информацию об удаленности каждого пиксела от наблюдателя (Z-координату). Такое представление изображения называют "формат 2D+Z", а плоскость координат Z – "картой глубины". Ее можно представить в виде монохромного изображения. В карте глубины градациями серого обозначается удалённость точек изображения от наблюдателя. На рис. 5 показан пример оригинального изображения и карты глубины.
Рис. 5. Оригинальное изображение и карта глубины (изображения с сайта www.stamptex.pl). |
Формат 2D+Z является продолжением концепции представления информации об изображении по компонентам. Как известно, и в аналоговом, и в цифровом телевидении изображение формируется из яркости и двух цветовых составляющих. Добавление еще одного компонента, характеризующего "объемность" изображения, является вполне логичным развитием и хорошо согласуется с принципами совместимости. Действительно, в настоящее время черно-белые телевизоры успешно работают, воспринимая только яркостный компонент телевизионного изображения, в то время как цветные телевизоры используют все данные. При трансляции видео, содержащего информацию об объеме изображения, дополнительные данные могут быть использованы теми устройствами визуализации, которые умеют их правильно интерпретировать и игнорированы остальными. Использование формата 2D+Z позволяет осуществить передачу стереоскопического видео с увеличением потока данных всего на 25-30%. Таким образом, удовлетворяется требование приемлемого объема данных.
Реконструкция многоракурсного изображения
Однако 2D+Z -- это не моногракурсная серия и даже не стереопара. Чтобы показать объемное изображение, необходимо выполнить расчет серии кадров. Восстановление стереоскопического изображения происходит путем интерполяции исходного изображения с учетом карты глубины. Полученная серия кадров затем демонстрируется с использованием растрового дисплея (рис. 6).
Рис. 6. Трансформация 2D+Z изображения в серию кадров и показ на устройстве объемной визуализации (изображения с сайта www.philips.com, www.isu3d.org). |
Стандартизация
Формат MPEG-2 имеет дополнительный многоракурсный (multiview) профиль, принятый в 1996 году и позволяющий кодировать и передавать изображения с двух и более камер [см. Jens-Rainer Ohm. Stereo/Multiview Video Encoding Using the MPEG Family of Standards.]. Спецификация формата MPEG-4, части 2, определяющая способ кодирования видеообъектов, позволяет стандартным способом передавать и обычное 2D изображение, и соответствующую ему карту глубины (Z). Аналогичные возможности есть и в MPEG-4, части 10 (AVC). Причем стандарты определяют возможность кодировать плоскость Z как дополнительные данные, которые могут быть проигнорированы устройствами, не ожидающими их появления. При этом наличие Z никак не повлияет на декодирование основного изображения. Форматы MPEG-2 и MPEG-4 (AVC) являются основными в цифровом телевидении, поэтому уже есть достаточная база для стандартной трансляции 3D видеоданных. Надо отметить, что работа над стандартизацией продолжается, и принятие очередных добавлений ожидается к 2011 году [см. Atanas Gotchev. Computer Technologies for 3D Video Delivery for Home Entertainment.].
Техническая реализация
Уже имеющиеся в настоящее время наработки позволяют приступить к непосредственной реализации систем стереоскопического вещания в интернет-сетях (IPTV). В таких сетях есть возможность предоставлять услугу 3D индивидуально, а не транслировать поток на тысячи абонентов, из которых только несколько процентов пока имеют 3D-мониторы. Рядом мировых производителей мониторов выпускаются модели, позволяющие показывать объемные изображения. В частности, Philips промышленно выпускает 3D мониторы, основанные на растровом принципе. Входными данными таких мониторов является обычное изображение и карта глубины (формат 2D+Z) [3D Interface Specifications. White Paper. Philips 3D Solutions]. Данные мониторы получили распространение и успешно используются для демонстрации рекламы в крупных торгово-выставочных помещениях. Есть информация об их применении в тестовых системах 3D IPTV [5. Philips and eventIS demonstrate 3D video-on-demand at IBC2007]. Недостатком является необходимость специальной обработки изображения перед передачей на монитор. В настоящее время обработка выполняется с помощью компьютера и специального программного обеспечения. Использование компьютера не всегда удобно и ограничивает сферу применения мониторов такого типа.
Как было отмечено выше, 2D+Z видеоданные могут быть переданы в виде, сжатом в соответствии с общепринятым стандартом MPEG-2 или AVC. Декодирование стандартных потоков может быть выполнено и с помощью компактных устройств декодирования цифрового видео (set top box -- STB). Однако выпускаемые многими мировыми производителями STB не генерируют необходимую управляющую информацию для правильной интерпретации данных о глубине. Российской компанией "Элекард" (Elecard) выпускается серия STB на базе DSP-процессоров Philips Nexperia и TI DaVinci [ Elecard iTelec STB 61x ]. Особенность этих устройств в том, что они сочетают в себе свойства аппаратного декодера (малый размер, низкое потребление мощности в пределах 6-8 Ватт, надежность), а также гибкость программного обеспечения (легкость наращивания функционала). Архитектура этих устройств позволяет менять встроенное в них программное обеспечение. Это дает возможность легко наращивать функциональность устройств, не меняя при этом аппаратную часть и, например, предусмотреть в партии устройств возможность работы с объемным изображением.
Разработана специальная версия программного обеспечения для STB, которая выполняет формирование служебной информации, необходимой для показа видео в формате 2D+Z на 3D мониторе. Рабочий прототип устройства показан на рис. 7. Рисунок иллюстрирует декодирование потока MPEG-2 1920х1080 (HD) формата 2D+Z в реальном времени. Вся картинка в ширину 1920, но на 3D мониторе будет показана только левая часть. Правая часть – это информация о глубине.
Рис. 7. Прототип Elecard 3DSTB. Декодирование MPEG-2 1080 HD видеопотока в формате 2D+Z. |
При переключении STB в режим объемной визуализации в изображение добавляется управляющая информация, которая обеспечивает объемную визуализацию на автостереоскопических дисплеях. Такой 3DSTB позволяет расширить сферу применения устройств стереоскопической визуализации. Elecard 3DSTB имеют аналоговые выходы для подключения к бытовым телевизорам и DVI/HDMI интерфейсы для подключения к цифровым устройствам. По сути, это реальная возможность создать доступные для большого числа абонентов услуги стереоскопического телевидения по IP-сетям (IPTV) и в перспективе обеспечить реализацию стереоскопического телевизионного вещания. Кроме того, компактность устройства 3DSTB облегчает использование стереоскопических мониторов для оформления и демонстрации рекламной информации в магазинах и других общественных местах.
IPTV-сети с использованием Elecard STB SD разрешения развертываются в городах Екатеринбург, Челябинск, Красноярск, Уфа, Москва и др. Прототип Elecard 3DSTB изготовлен на основе разработки для серийного производства HD версии Elecard STB. Обе разработки (3DSTB и HD STB) проходят тестовые испытания, их серийное производство намечено на 2009 год. Тестирование ведется с использованием мониторов Philips 3D Wow display.
Подготовка 3D видеоматериалов
Построение системы объемного телевидения невозможно без достаточного количества 3D видеоматериалов, средств конвертации в различные форматы и соответствующих кодеков. Многие мировые киностудии уже стали снимать новые фильмы в формате стереопары, то есть сразу двумя камерами (рис. 8).
Рис. 8. Камера для 3D видеосъемки (использованы изображения с сайта www.inition.co.uk). |
Такая съемка позволяет демонстрировать стереоскопические фильмы в кинотеатрах и на мониторах, работающих с использованием поляризационной технологии. Однако двух кадров недостаточно для демонстрации объемного видео на автостереоскопических устройствах. Как было отмечено выше, формат 2D+Z представляется наиболее приемлемым вариантом с точки зрения применимости для реконструкции стереоизображения и размера передаваемых данных. Поэтому актуально решение задачи преобразования стереопары в формат 2D+Z. Математически это задача нахождения относительного расстояния до объектов по двум изображениям. Уже существуют программные продукты, позволяющие выполнить расчет Z (карты глубины), например, для стереопары фотографий карту глубины позволяет автоматически найти программа Triaxes StereoTracer, для видео -- BlueBox от фирмы Philips 3D Solutions. Несмотря на наличие уже существующих средств расчета 2D+Z, эта область предоставляет широкие возможности для исследований и разработки новых продуктов.
Еще более сложной задачей является преобразование большого количества 2D материалов в формат объемной визуализации. Разработки в этой области ведут многие компании мира, в том числе российская компания "Триаксес Вижн" (Triaxes Vision), основанная на базе компаний "Триаксес" и "Элекард" для разработки системы цифрового объемного телевидения 3DTV.
Проект, представленный "Триаксес Вижн" на конкурс Фонда содействия развитию предприятий в научно-технической сфере, по оценкам экспертов, занял первое место в Сибирском Федеральном округе. Проект включает решение следующих задач:
- разработка математических алгоритмов и программ преобразования 2D видео в 3D (2D+Z);
- реализация кодирования 3D информации в требуемый формат;
- обеспечение совместимости форматов 3D видеокодирования с используемым в настоящее время и планируемым к запуску в 2015 году оборудованием цифрового телевизионного вещания;
- проектирование схемы передачи и декодирования на приемном конце;
- вывод 3D видео на монитор (телевизор).
В настоящее время в рамках проекта уже разработаны модификации стандартных MPEG-2 и MPEG-4 (AVC) видеокодеков, предназначенные для компрессии 3D видеоданных. Разработаны модули преобразования видео в 2D+Z формат, а также программный модуль для создания 3DSTB.
Прототип 3D IPTV системы
Компанией "Элекард" совместно с "Триаксес Вижн" создан прототип системы доставки 3D видео-по-запросу. Система включает сервер, содержащий библиотеку 3D видеофильмов и обеспечивающий сервис видео-по-запросу, (video on demand — VOD), и распределенную сеть абонентов, стереомониторы которых оснащены приставками 3DSTB (рис. 9).
Рис. 9. Схема прототипа 3D IPTV системы. |
Областью применения таких систем может быть и вещание 3D видео в сетях IPTV для отдельных абонентов, и доставка цифрового видео к большим экранам демонстрации рекламной информации в стереоскопическом формате.
Демонстрация разработанной системы планируется в 2009 году на тематических выставках в России и других странах.
Об авторе
Алексей Юрьевич Поляков, кандидат технических наук, главный инженер "ЗАО Элекард Девайсез", директор группы компании Триаксес. Имеет 15 лет опыта в области разработки систем автоматизированного проектирования радиоэлектронных устройств, обработки изображений и мультимедиа информации, автор технологии и программного обеспечения для создания стереоскопических изображений, автор четырех книг по теме "компьютерная графика", опубликованных в России и США.
Источник: ТелеМультиМедиа
blog comments powered by Disqus