sonyps4.ru

Графическая подсистема X11. Графическая подсистема

Одним из важнейших устройств компьютера, применяющихся для вывода ин- формации, является дисплей или монитор (от monitor - устройство для слеже- ния, контроля). На экран дисплея выводятся данные, вводимые с клавиатуры, результаты их обработки, а также всевозможная служебная информация.

Дисплеи бывают монохромные (то есть одноцветные - черно-белые, с желтым или зеленоватым оттенком) и цветные. Кроме того, различают алфавитно-циф- ровые и графические дисплеи. У алфавитно-цифровых дисплеев группа пиксе- лов, занимающая небольшую прямоугольную область экрана и используемая для размещения изображения одного символа, образует знакоместо. Например, для растра размером 600 х 480 область, занимаемая знакоместом, образуется груп- пой 8x8 пикселов. Изображение символа формируется примерно так же, как из группы точек на почтовом конверте получается изображение какой-либо цифры почтового индекса адресата. Подчеркнем, что у алфавитно-цифровых дисплеев не существует возможности работать с отдельным пикселом. Информация вы- водится на экран сразу целым знакоместом, символом. Поэтому такие дисплеи могут использоваться только для вывода различного рода текстов. Рисунки, графики, чертежи, картинки не могут быть выведены на алфавитно-цифровые дисплеи. В настоящее время алфавитно-цифровые дисплеи используются для управления различного рода серверами, то есть там, где отображение графики не является обязательным.

Графические дисплеи отличаются тем, что из программы можно управлять со- стоянием отдельного пиксела, и, следовательно, для них доступны все возмож- ности формирования изображений.

Основными техническими характеристиками дисплеев являются:

Принцип действия;

Размер экрана по диагонали;

Разрешающая способность;

Размер «зерна» экрана;

Частота регенерации;

Форма экрана;

Класс защиты.

По принципу действия выделяют дисплеи на электронно-лучевой трубке (ЭЛТ, или CRT - от Cathode Ray Terminal, т. е. терминал на катодно-лучевой труб- ке), жидкокристаллические (ЖК, или LCD - от Liquid-Crystal Display, то есть жидкокристаллический дисплей) и плазменные дисплеи.

Принцип действия мониторов с электронно-лучевой трубкой в точности такой же, как у бытовых телевизоров. Электронная пушка, аналог катода в электронных лампах накаливания, вырабатывает луч - узконаправленный поток электронов, который с помощью системы отклоняющих пластин сканирует поверхность эк- рана дисплея. Точка пересечения луча с экраном представляет собой пиксел - элементарную единицу изображения. С помощью декодирующей схемы, на вход которой поступает закодированное изображение, пиксел переводится в одно из двух состояний - черное или белое: это позволяет формировать монохромные изображения. Для создания цветного изображения в мониторе устанавливаются три электронных пушки - красного, зеленого и голубого цвета. ЭЛТ-мониторы отличаются довольно большими габаритами, прекрасной цветопередачей и не- высокой стоимостью.

Принцип действия жидкокристаллических дисплеев основан на свойствах жид- ких кристаллов, открытых еще в 1888 г. Они представляют собой вязкие органи- ческие молекулы, которые, с одной стороны, имеют структуру, аналогичную структуре кристалла, а с другой - ведут себя как молекулы жидкости. Оказалось, что оптические свойства жидких кристаллов зависят от ориентации молекул, а на ориентацию молекул жидкого кристалла можно воздействовать электриче- ским полем, что создает возможность для программно-управляемого построения изображения.

Экран LCD-дисплея состоит из двух стеклянных параллельных пластин, про- странство между которыми заполнено жидкокристаллическим веществом. У жид- кокристаллических дисплеев с пассивной матрицей на стеклянные пластины на- носится сетка прозрачных электродов. Например, для обеспечения разрешающей способности экрана 800 х 600 сетка на задней пластине содержит 800 вертикаль- ных проводов, а сетка на передней пластине - 600 горизонтальных. Источник света за задней пластиной освещает экран изнутри монитора. На провода сетки подается напряжение, которое различным образом ориентирует молекулы в раз- ных точках экрана, определяя нужным образом цвет, яркость или контрастность в каждой его точке, в каждом пикселе. У жидкокристаллических дисплеев с ак- тивной матрицей вместо двух наборов сеток около каждого пиксела экрана на- ходится крошечный элемент переключения напряжения электрического поля. Меняя соответствующим образом напряжение элемента в каждой точке, можно управлять изображением на экране.

Жидкокристаллические дисплеи отличаются малой толщиной и плоским экра- ном. Их стоимость пока выше, чем стоимость мониторов с электронно-лучевой трубкой. Причем мониторы с активной матрицей более качественные и более до- рогие, а мониторы с пассивной матрицей имеют более бледное изображение, на них заметнее следы от смены кадров, но они и дешевле.

Самыми дорогими в настоящее время являются плазменные мониторы, которые обладают высоким качеством формируемого изображения и могут иметь значи- тельные размеры - до 1 м и более по диагонали при толщине всего 10 см.

Перспективным направлением в развитии устройств отображения данных яв- ляются дисплеи, построенные по технологии ОLЕD (от Organic Light Emitting Diodes - органические светодиоды).

Во-первых, эти дисплеи не требуют допол- нительной подсветки, так как вещество само испускает свет, а во-вторых, воз- можно размещение очень тонких экранов на гибкой основе.

Размер экрана дисплея по диагонали определяется в сантиметрах или дюймах. В настоящее время выпускаются мониторы с экранами от 9 до 42 дюймов или от 23 до 107 см. Наиболее распространенными являются экраны размером 15, 17, 19 и 21 дюйм. Для стандартных целей достаточно 17-дюймового экрана. При большом объеме работы с графикой желательно выбирать 19- или 21-дюймовые мониторы.

Важной характеристикой дисплеев является разрешающая способность экрана, определяющая степень четкости изображения. Разрешающая способность зави- сит от количества строк на весь экран и количества пикселов в строке. В настоя- щее время существует несколько стандартных разрешений, в частности: 800 х 600, 1024 X 768,1152 х 864,1280 х 1024,1600 х 1200,1600 х 1280,1920 х 1200,1920 х 1600, 2048 X 1536. Здесь первая цифра определяет количество пикселов в строке, а вто- рая - количество строк на экране. Возможное разрешение существенно зависит от фактического размера экрана. Например, для 17-дюймового монитора стан- дартным считается разрешение 1024 х 768, а максимальным может быть разре- шение 1600 X 1200.

Отметим, что у ЭЛТ-мониторов разрешающая способность лучше, она может достигать 2048 х 1536, в то время как у лучших ЖК-мониторов она пока значи- тельно ниже - до 1280 х 1024. Попутно заметим, что у телевизионных приемни- ков наилучшим на сегодняшний день считается разрешение 1024 х 768.

Качество изображения определяется не только разрешающей способностью, но и так называемой зернистостью экрана. Зернистость разными производителями определяется либо как фактический линейный размер пиксела, либо как рас- стояние между двумя соседними пикселами. В настоящее время этот параметр у большинства мониторов равен 0,18-0,28 мм. Чем меньше размер зерна, тем лучше, но и дороже монитор.

Частота регенерации (обновления) - это параметр, который показывает, сколь- ко раз в секунду обновляется изображение на экране дисплея. Без такого обнов- ления невозможно формирование нормального зрительного восприятия телеви- зионного изображения, а также невозможна передача движений. Если частота регенерации меньше 60 Гц, то есть если обновление происходит менее чем 60 раз в секунду, то появляется мерцание изображения, что отрицательно сказывается на зрении. В настоящее время частота регенерации большинства мониторов со- ставляет 60-100 Гц, а стандартной считается частота 85 Гц.

Экраны мониторов бывают выпуклые и плоские. В настоящее время большин- ство экранов, в том числе и у бытовых телевизоров, выпуклые. Вместе с тем более перспективными моделями считаются мониторы с плоским экраном, напри- мер модель Trinitron, у которой экран абсолютно плоский по вертикали и лишь слегка искривлен по горизонтали.

С точки зрения техники безопасности работы с мониторами, необходимо учи- тывать класс защиты монитора, который определяется международными стан- дартами. В настоящее время действует стандарт под названием ТСО-2ОО4, выдвигающий самые жесткие требования к безопасному для человека уровню электромагнитных излучений, эргономическим и экологическим параметрам, а также к параметрам, определяющим качество изображения - яркости, кон- трастности, мерцанию, антибликовым и антистатическим свойствам покрытия экрана монитора.

Для создания изображения на экране дисплея необходим еще один компонент компьютера, который называют видеоплатой, видеокартой или видеоадапте- ром. Если быть точным, то это устройство следует называть графическим кон- троллером. Именно видеоадаптер определяет разрешающую способность монито- ра и количество передаваемых цветовых оттенков. Видеоадаптер вместе с дис- плеем образуют видеоподсистему компьютера. В настоящее время в основном используются адаптеры типа SVGA (от Super Video Graphics Array - супервидео- графический массив), способные передавать 16,7 млн. цветовых оттенков.

Для обеспечения такого количества цветов, а также хорошего разрешения ви- деоадаптеры содержат собственную видеопамять довольно большого объема - 64 Мбайт и выше. Построение высококачественных изображений и, тем более, какие-либо их преобразования, как правило, требуют выполнения большого ко- личества математических операций. Чтобы освободить процессор компьютера от действий с изображениями и тем самым существенно ускорить их построение, а также повысить общую эффективность работы компьютера, современные ви- деоадаптеры берут на себя значительную часть этих операций. При этом часть работы по формированию изображения возлагается на аппаратные средства адаптера - микросхемы видеоускорителя, которые могут входить в состав ви- деоадаптера или размещаться на отдельной плате, подсоединяемой к адаптеру. Различают два типа видеоускорителей: плоские, или 2D (от 2-dimension - двухмер- ный), и трехмерные, или 3D (от 3-dimension - трехмерный). Требования совре- менных видеоадаптеров, особенно с аппаратным ускорением, уже не удовлетво- ряются стандартными шинами компьютера. Поэтому для них были разработаны уже упоминавшиеся специализированные шины AGP.

Не будем в очередной раз вспоминать пословицу о том, что «все новое это», а просто попробуем логическим путем рассудить, к чему придут ускорители трехмерной графики в ближайшем и (даже) более-менее отдаленном времени. Рассуждать будем не просто, а по частям. Итак.

Внешние интерфейсы и вывод изображения

Нет сомнений, что через некоторое время все системы отображения (мониторы, проекторы и пр.) будут подсоединяться к ускорителю по цифровому интерфейсу. В начале это будут плоды эволюции специализированного интерфейса (DVI), но позже, вполне логично ожидать постепенное замещение специализированной цифровой последовательной шины ее аналогом общего назначения, например одним из потомков USB или FireWire. Почему я в этом уверен?

Во-первых, разрешение и тем более частота кадров отображающих устройств не будут расти столь же стремительно, как вычислительная мощь ускорителя. Этому есть несколько причин, первая из них - ограниченное разрешение глаза, для которого изображение с 3..4 тысячами точек по горизонтали уже воспринимается (при условии разглядывания целиком) как монолитное и бесконечно детализированное. Во-вторых, кадровая частота выше 150..200 смен изображений в секунду не имеет смысла даже при условии отсутствия сглаживания движущихся объектов: почти десятикратное превосходство над кинематографической частотой обеспечит сглаживание движения за счет инерции восприятия в глазу, который невольно будет накапливать, и усреднять по нескольку кадров подряд. Разумеется, возможны варианты - такие как панорамные и сферические дисплеи, или стереодисплеи, требующие две картинки для разных глаз, но все они, так или иначе, могут довольствоваться разрешением порядка десяти тысяч точек по горизонтали. Дальнейшее увеличение разрешения возможно, но не видится приоритетной задачей - гораздо больше сил (уже сейчас) тратится на повышение реалистичности картинки, чем на ее сглаживание.

Итак, медленный (относительно) рост разрешения и кадровой частоты позволит в скором времени обычным шинам общего назначения служить каналом для передачи информации на монитор и другие устройства отображения. Почему это важно? Потому что это очень удобно. Представьте себе, что в каждый из 6 USB портов вы можете подключить (при желании по дисплею). Представьте, что самый элементарный фотоаппарат или КПК может быть при желании подсоединен к проектору или монитору через тот же интерфейс, через который вы осуществляете синхронизацию и передачу данных на PC. И т.д. и т.п.

В более отдаленном времени возможность соединять «все-со-всем», пользуясь одними и теме же интерфейсами (+ открытые протоколы передачи данных разных форматов) откроет прекрасные перспективы, причем не только в области отображения визуальной информации…

Итак, у нашего ускорителя будущего появился первый более-менее четкий элемент - один или несколько универсальных внешних портов на основе скоростных последовательных шин. Кстати, им не обязательно находится на самой плате (модуле, карте) ускорителя, он может использовать для передачи изображения и порты системной платы - тем паче, что системная шина заведомо будет опережать по пропускной способности внешние универсальные интерфейсы периферии.

В этом же ключе, логично ожидать появление дисплеев и проекторов со встроенными радиоинтерфейсами (уже существуют первые модели проекторов с разновидностями 802.11). Очевидно что все будущие ПК, КПК, ноутбуки и прочие устройства будут включать в себя те или иные беспроводные интерфейсы и передача изображений на ближайший экран, без какого-либо проводного соединения очень удобна, как в бизнес, так и в бытовых или персональных применениях. Кстати, о дисплеях:

Дисплеи и другие системы отображения

Обсудим вопрос демонстрации передаваемых с ускорителя картинок. Во-первых, очевидно, что в ближайшем будущем практически все дисплеи станут плоскими и будут использовать ту или иную технологию плоских панелей. Пока мы не говорим о проекторах, но и они в большинстве своем используют в наше время не сканирующие вакуумные трубки, а работающие на просвет миниатюрные высокотемпературные ЖК матрицы или матрицы с массивами микромеханических зеркал. Разрешение и размер дисплеев подрастут, но ничего особенно нового здесь ждать не приходится - слишком большие панели не удобны и даже вредны - они занимают много места и их не просто транспортировать (вес, хрупкость). Поэтому, размеры более 20 дюймов по диагонали по-прежнему будут сопутствовать только специфическим нишам. Идеальным решением для больших размеров являются те или иные разновидности проекторов - в паре с очень компактными экранами они могут обеспечивать изображение разных размеров в достаточно широких пределах и при этом являются сами по себе вполне компактными устройствами.

Итак, персональный дисплей будущего это плоская панель размером от 17 до 20..24 дюймов с разрешением порядка 3..4 тысяч точек по горизонтали и предельной физической частотой обновления информации около 100 кадров в секунду. Далее, в игру вступают различные проекторы и составные панели. Первые получат более высокое разрешение и яркость, опять таки до 3..4 тысяч точек - что не только позволит полноценно отображать на них фильмы очень высокого качества, но и потребует новых стандартов для съемки, сжатия и передачи движущегося изображения - даже передовые HDTV стандарты далеки от таких цифр. Именно в этой области и произойдет наиболее значимый прогресс, в плане качества захвата, хранения и передачи картинки. Но мы не должны забывать, что основная тема данной статьи - трехмерная графика в будущем.

Во-вторых, очень широкое, если не повсеместное, распространение получат панели способные создавать объемное изображение без применения дополнительных средств, таких как специальные стерео очки. Здесь могут дать результат различные технологии. В отдаленном будущем вероятны голографические ЖК матрицы (я лично знаком с бывшими сокурсниками занятыми такими исследованиями для компании LG), способные воспроизводить больше характеристик захваченного потока света, чем традиционные системы и давать объемную, цветную(!) голографическую картинку. Такие решения потребуют существенно большего разрешения матрицы и специальной формы представления данных, а потому не следует ожидать их появления в коммерческих количествах в ближайшие пять лет. Возможны и какие либо гибридные решения, в которых дифракционные динамически настраиваемые структуры разводят свет от матрицы для правого и левого глаза, следя при этом за положением головы и обеспечивая оптимальную глубину зоны устойчивого восприятия стереоизображения. И, наконец, наиболее вероятные уже в ближайшее время системы с простым разделением изображения для правого и левого глаза, на основе одной ЖК панели. Такие системы уже доступны коммерчески. Очевидно, что в ближайшее время появятся реконфигурируемые матрицы, способные работать как в режиме разделения изображения на два глаза, так и в режиме обычной плоской матрицы с широкими углами обзора - чисто технически это не представляет никакой трудности.

Итак, дисплеи будущего станут тоньше и легче, и, вероятно, получат стереорежим, как обязательную опцию. Но, в области больших размеров и разрешений куда как более впечатляющие качественные и количественные скачки будут происходить в проекционных устройствах.

Системная шина, шина памяти и передача данных

То, что системные шины вскоре все станут последовательными, уж не является секретом для большинства читателей. Проприетарные соединения между компонентами чипсета, HT, PCI-Express и даже LPC четко продемонстрировали реализацию уже не новой тенденции на перевод всего и вся на последовательные сигнальные каналы. Однако давайте прикинем, как конкретно этот процесс отразится на ускорителях. В ближайшее время появятся ускорители с PCI-Express интерфейсом с пропускной способностью 16х - именно такой слот для графических и других высокопроизводительных PCI-Express карт будут иметь первые PC. Однако гибкая возможность масштабирования этой шины позволяет пойти далее.

Представьте себе, что в чип заранее встроены 32 канала PCI-Express с возможностью динамической конфигурации. Во-первых, как только появятся производительные рабочие станции (и чипсеты) со слотами конфигурации 32х, можно будет сделать профессиональную карту на основе того же чипа. Во-вторых, можно сделать серверный вариант карты с 8х (типичный серверный разъем), и в сервер может быть одновременно установлено несколько таких карт. И, наконец, при необходимости можно сделать многочиповое решение, просто соединив двое или несколько чипов тем или иным образом, с участием вторых 16 каналов.

Но это только начало. В будущем шины памяти также станут более интеллектуальными и последовательными. Это позволит не только проще масштабировать пропускную способность памяти, но и упростить разводку на плате, т.к. данные разных каналов могут передаваться не синхронно и, соответственно, длинна проводников не обязательно должна быть одинаковой. Это позволит повысить тактовую частоту и снизить стоимость разводки. Кроме того, уже знакомые нам по PCI-Express одиночные двунаправленные каналы могут действовать независимо друг от друга и в дуплексном режиме - т.е. основная проблема задержек при интенсивных обращениях ускорителя к памяти - проблема переключения из режима чтения в режим записи и проблема параллельных потоков данных будет красиво и естественно решена. В итоге, снизится необходимость в интенсивном кэшировании некоторых типов данных и освободившиеся ресурсы на чипе можно будет бросить на самое главного - буфер кадров, полностью разместив его на чипе и связав с блоками закраски очень широкой шиной. Впрочем, мы несколько забегаем вперед.

А теперь самое интересное - а, собственно, почему последовательная шина памяти и последовательная системная шина должны быть разными? Рано или поздно мы можем ожидать схожую, при желании совместимую, а возможно и просто четко совместимую сигнальную технологию, которая позволит просто снабдить чип 256-ю (или скорее 256+32+8 - догадайтесь почему;-)) высокоскоростными последовательными каналами и, в зависимости от воли разработчиков конкретного продукта, раздавать их на общение с системой (процессором и чипсетом), на общение с локальной памятью, на общение с другими чипами в многочиповом решении, а также на различные интерфейсы ввода и вывода, например, один канал можно отдать на чип захвата видеосигнала. Изначально каналы равноправны, и каждый из них, например, может занимать 4-ку соседних выводов чипа. Это позволит расположить прочие элементы на плате ускорителя так, как того пожелает душа разработчика, а затем, не особенно задумываясь, протянуть к ним каналы с ближайших выводов чипа.

Очевидно, что подобный подход - обширный массив одинаковых и гибко распределяемых каналов передачи данных, имеет и более глобальные перспективы. Рано или поздно (скорее рано - см. материалы по HT) и системная логика (чипсеты) и процессоры тоже придут к подобной схеме, позволив в итоге создавать совершенно фантастические топологии вычислительных систем, как наборов активных компонент, соединенных различными по числу каналов шинами - словно игрушки собранные из детского конструктора «Лего».

Архитектура и программируемость ускорителя

Происходящая унификация хорошо заметна. Например, вершинные и пиксельные блоки (далее процессоры) внутри ускорителя уже сейчас имеют унифицированную систему команд и схожую программную архитектуру (отличается число регистров, но не методы работы с ними). Но, еще до общей унификации, нас ждет появление третьего типа процессоров - процессор генерации вершин или, иначе, «тесселяции». И, соответственно новый тип шейдеров - тесселяционные шейдеры. Его место в графическом конвейере - перед вершинными процессором:


А так же, очень вероятно появление отдельного процессора для выборки, распаковки, фильтрации и генерации текстур.

Основная задача блока тесселяции, на основе гибкой программы (шейдера тесселяции, TS) создавать новые треугольники и вершины, и затем, передавать их вершинному шейдеру (VS) на уже привычную нам трансформацию и освещение. Этот подход позволит наиболее общим путем переложить на ускоритель построение примитивов более высокого порядка, нежели треугольники, например гладких сплайновых поверхностей. В первую очередь, наличие такого процессора позволит увеличить сложность сцен и реализовать адаптивную детализацию моделей и окружения без дополнительной нагрузки на центральный процессор и системный канал передачи данных. Например, хорошо известная разработчикам симуляторов задача построения ландшафта с адаптивной детализацией в данный момент не может быть решена эффективно только на ускорителе. Любые решения выглядят как компромисс, а с появлением тесселяционного процессора позволит генерировать адаптивное представление ландшафта на лету, не загружая системный процессор или шину.

Обратите внимание на зеленый блок - это процессор фильтрации, выборки и обработки текстур. На данный момент все нестандартные операции с текстурами, такие как специальные методы фильтрации или генерация процедурных текстур исполняются на уровне пиксельных шейдеров, а некоторые задачи, такие как распаковка сжатых форматов текстур реализованы только жестко аппаратно. Однако, гораздо эффективнее выделить для этого отдельный процессор и в будущем это будет сделано. Текстурные шейдеры (TxS) уже известные по программным пакетам реалистичной графики, будут отвечать за генерацию по запросу процедурных текстур, выборку, преобразование и модификацию значений обычных текстур, реализацию оптимальных методов сжатия и, самое главное, на специальные методы фильтрации, например продвинутую анизотропную, стохастическую или, очень важную для будущих приложений фильтрацию с учетом движения объекта для реализации эффективного и качественного сглаживания движущихся объектов.

Между процессорами расположены очереди данных, отмеченные на рисунке стрелками. Они позволяют накапливать (а по возможности и кэшировать для повторного использования) рассчитанные одним процессором для другого данные, и таким образом избежать задержек, позволив процессорам работать параллельно и в должной степени асинхронно. Именно наличие таких четких однонаправленных потоков данных позволяет эффективно распараллеливать задачи по построению изображения и одновременно именно этот факт накладывает на шейдеры существенные ограничения - например, они не могут иметь произвольный доступ к данным соседних примитивов или пикселей, т.к. они могут рассчитываться параллельно или еще не быть рассчитанными. Впрочем, обладая возможностью, так или иначе, записать поток данных с выхода шейдерного процессора и снова подав его на вход, мы можем (так сказать «в несколько проходов») реализовать более сложные алгоритмы, включая произвольный доступ, пускай и не самым удобоваримым путем.

На нашей схеме и процессор тесселяции и геометрический процессор, и пиксельный процессор могут получать данные у процессора выборки текстур, и тонкие черные стрелочки символизируют очередь запросов на получение таких данных. Например, при генерации ландшафта процессор тесселяции может таким образом получать доступ к карте высот, сохраненной в виде двумерной текстуры, а процессор трансформации может использовать текстуру как карту смешения (Displacement Map) вершин.


Перед нами графический ускоритель будущего. Основная концепция - набор из некоего числа одинаковых шейдерных процессоров (разумеется с неограниченной длинной программы, обширным набором команд включая динамическое управление исполнением команд - условия, циклы и подпрограммы). Во время построения изображения процессоры динамически соединяются между собой в некую топологию, например, так:


а между процессорами (кружки) организуются одно и двунаправленные асинхронные очереди данных, которыми фактически заведуют контроллеры потока (см. предыдущую схему). Каждый контроллер настраивается для того или иного метода хранения данных (стек, очередь, просто произвольный доступ) и получает в монопольное владение часть скоростной внутренней памяти (кэша) ускорителя или реализует доступ к потоку данных из внешней по отношению к чипу ускорителя локальной или системной памяти. Возможен и режим с произвольным, не потоковым доступом, но в реальных приложениях следует всячески избегать подобных настроек, ибо они способны существенно подорвать производительность в результате плохо оптимизируемых попыток доступа к внешней памяти. Однако, так или иначе, за счет интенсивного кэширования и использования предсказания паттернов доступа данная задача может быть решена на твердую «4», пусть и не в первом поколении таких ускорителей, открыв путь к более привычным программистам подходам, например, к произвольной индексации элементов массивов.

Итак, появляется множество возможностей. Не только альтернативные методы фильтрации, выбора и генерации вершин и пикселей, но и такие варианты как шейдер программирующий новый метод полноэкранного сглаживания, и даже шейдер отвечающий за динамическое перераспределение ресурсов (вычислительных и памяти) ускорителя, т.е. некая «операционная система». Понятно, что самому программисту крайне тяжело управлять всей коммуникацией блоков такого чипа, но это и не надо - этим будет заниматься API. Программист будет формулировать задачу в виде набора шейдеров различного назначения (фактически - функций на некоем языке программирования высокого уровня) и описания структур передаваемых и получаемых или параметров, а следовательно, и того, в каком порядке данные будут проходить через эти шейдеры. Остальное берет на себя API - DirectX или OpenGL будущего. API компилирует шейдерный код в машинные инструкции, оптимизирует их, настраивает взаимодействие очередей и блоков, распределяет кэш и другие ресурсы. Например, встает логичный вопрос - сколько процессоров отдать под шейдер А а сколько под шейдер Б, так, чтобы вся система была максимально сбалансирована и ни одного миллиметра силикона не простаивало без дела. Ответ на этот вопрос не однозначен. Можно грубо указывать важность шейдера в тех или иных единицах, еще при написании его на языке высокого уровня, а можно и создать API анализирующий по ходу построения кадров значения внутренних счетчиков производительности в чипе и динамически перераспределяющий процессоры по мере исполнения приложения каждую секунду или около того.

Представьте себе - играя в FPS, вы выходите к воде и больше процессоров отдается на пиксельные шейдеры, появляется детализированный монстр и чуть больше ресурсов уходит вершинным процессорам. Тонкая и кропотливая работа по балансу нагрузки на различные блоки ускорителей, реализуемая ныне во время программирования приложения путем достаточно утомительных итераций, проб и ошибок, будет автоматизирована на уровне API и железа!

Новые и улучшенные подходы к построению изображения

Разумеется, получив в свое распоряжение столь гибкую систему, мы не можем не обратить свой взгляд к альтернативным методам построения изображения. Новые примитивы, например объемные (3D) полигоны с заданным картой смещения рельефом (с точностью до одного пикселя!), шары или гладкие поверхности (на сей раз истинно гладкие, а не аппроксимированные треугольниками). И, конечно, мягкие тени: станет возможна трассировка лучей для расчета т.н. «глобального» освещения, в то время как закраска идет традиционным методом. Хотите? -Пожалуйста. Комбинированные методы с использованием Radiosity? - Нате. Да, и на худой конец, может быть легко реализована «стопроцентная» старая добрая обратная трассировка лучей. При условии, что сцена, пусть даже описанная примитивами достаточно высокого уровня, будет полностью размещена в локальной памяти ускорителя. Тогда она сможет интерпретироваться им практически без участия процессора.

Несомненно, важным видится сглаживание движущихся объектов. Именно оно отличает реалистичную кинематографическую графику от игровой аппаратной, и именно благодаря ему, мультфильмы с использованием компьютерных персонажей смотрятся при 25 кадрах в секунду куда как лучше, чем всем лучшие шутеры при 120. Подход к сглаживанию должен быть сбалансированным - грубая сила, выражаемая в расчете N кадров вместо одного и последующем их усреднении не допустима. Грамотное использование пиксельных, текстурных и специальных сглаживающих шейдеров вкупе с информацией о скорости каждой конкретной точки позволит создать очень аккуратно и качественно сглаженные движущиеся предметы, нарисовав при этом только одно (!) изображение за один проход. Ключ к этому - гибкая архитектура ускорителя описанная мной.

Толи еще будет, ой-ой-ой

Интересно, что вопросы питания, энергопотребления и теплорассеивания беспокоят конструкторов современных PC куда как сильнее вопросов надежности. Следует ожидать новых форм факторов для ускорителей, в виде некоего похожего на процессорный модуля (картриджа), такого, каким был в свое время процессор Pentium II или, например, такого, каким сконструирован ныне Itanium. Металлическая коробка, снизу контактный разъем, вертикальная установка оным на плату. Внутри, чип ускорителя и память. Интерфейсы перенесены на материнскую плату - все данные, включая захват видео и результирующую картинку, идут в цифровом виде по общей системной шине.

Итоги

  • Динамическое распределение ресурсов
  • Большой массив одинаковых по возможностям процессоров
  • Общий коммутатор
  • Большой набор контроллеров очередей и доступа к памяти
  • Только цифровые интерфейсы, все на основе массива последовательных шин общего назначения
  • Память, работающая напрямую с такими шинами
  • Устройства вывода с общими периферийными интерфейсами, а также беспроводными интерфейсами
  • Фокусировка на качестве, а не на разрешении или тем более кадровой частоте изображения
  • Стерео дисплеи.

Итак, ставка сделана, придет время, и я смогу ответить, насколько процентов я был прав, а насколько ошибался;-)

Ждать не так уж и долго.

Приложение

Вопрос, чем эта штука отличается от CPU?

Ответ 1 - ориентацией на эффективную параллельную обработку достаточно простых потоков данных, наличием специализации.

Ответ 2 - если рассуждать строго, то чем дальше, тем практически ничем.

Очень сложно сказать, кто первый придет к логической точке сращивания - или очередной CPU от Intel научится программно рассчитывать изображения уровня современных компьютерных мультфильмов (на что надо не так уж много - ~20 лет) или очередной ускоритель от NVIDIA или ATI научится исполнять Microsoft Windows или (на худой конец) один из клонов Linux. Может быть и такое.

UNIX не требователен к интерфейсу, когда речь идет об управлении системой. Типичный способ администрирования UNIX -сервера – удаленная работа по сети, причем (спасибо Internet ) удалиться от компьютера можно сколь угодно далеко, лишь бы связь была достаточно надежной для терминальной работы. Это означает, что все прочие возможности взаимодействия машины с человеком понимаются системой как ресурс , который следует распределять между пользовательскими задачами так же, как и оперативную память , дисковое пространство или, скажем, ресурсы подсистемы печати .

Напомним три задачи, которые решает операционная среда относительно ресурсов: унификация , разделение и учет доступа. С унификацией все более или менее понятно: на свете существует множество графических устройств, управление которыми на низком уровне – задача совсем не для пользователя, тем более что каждый вид устройства управляется по -своему. Низкоуровневые команды система должна взять на себя, а пользователю предоставить графические примитивы (вроде функции рисования линии), которые будут работать всегда одинаково.

Выходит, что пользователю этого ресурса недостаточно представлять графический адаптер как большую страницу видеопамяти, частично отображаемую на устройстве вывода – мониторе: ведь пользователю диска мало представлять его в виде массива секторов! Разница в том, что этого было бы недостаточно и самой системе, так что в UNIX введено понятие файловой системы , объекты которой значительно сложнее, чем "сектор" или " диск ". А что касается графики – у UNIX нет ни предпочтений, ни особых видов на эти способности машины. Значит, со стороны системы разумно организовать именно доступ к устройству , а требуемую объектную модель пусть реализует пользовательская задача.

Такая задача будет, конечно, отличаться от пользовательских утилит и программных продуктов. По своим правам она скорее будет сродни демонам. Она получит единоличный доступ к устройству, а по отношению к пользователю сама окажется операционной средой, организуя на свой лад унификацию, разделение и учет доступа к графическим ресурсам в объектной модели. Поэтому весь комплекс программ для работы с графическими устройствами принято называть графической подсистемой .

Неизбежно удвоение функций: система занимается аутентификацией и авторизацией – и графическая подсистема вынуждена делать то же самое, раз уж ей вменяется в обязанность "разделять". Более того, в отличие от той же файловой системы, само понятие разделения ресурса графического ввода или вывода представляется, мягко говоря, неочевидным. Как разделить между пользователями мышь ? экран монитора? Видимо, придется признать, что с этой стороны графической подсистемы находится один человек, а вот каким субъектам принадлежат программы , которые ею пользуются, графической подсистеме неизвестно. Об учете графических ресурсов говорить вообще странно, однако, как мы увидим в дальнейшем, некоторое рациональное зерно в этом есть, и подход UNIX позволяет его использовать.

Несмотря на то что в консоли работать можно (а иногда и нужно), большинство пользователей предпочитает графический интерфейс. Самый прагматичный подход, как водится, лежит где-то посередине. Для решения одних задач лучше подходит текстовый режим, других — многооконный. А предназначение системы — дать пользователю возможность выбирать между первым и вторым.

XWindow (именно Window, а не Windows: обратите на это внимание) — графическая среда для UNIX-систем. В ее основу легла клиент-серверная модель, только реализована она в пределах одной рабочей станции. Для передачи данных используется специальный протокол сетевой связи (X Network Protocol).

Первоначальный вариант XWindow был создан еще в 1987 г. Таким образом, считать, что Linux концепцией своего графического интерфейса только эксплуатирует идею, поданную Microsoft, неправильно. Другое дело, что корни Linux лежат очень глубоко, несмотря на то что эта ОС относительно молода. Традиции UNIX не позволяли навязывать пользователю какую-то одну концепцию, вследствие чего оконный режим востребован ровно настолько, насколько это соответствует реальным потребностям потребителя. Развитие свободного ПО идет по всем направлениям, поэтому успех какого-то одного не так бросается в глаза. Впрочем, именно многогранность и следует считать основным достоинством OpenSource.

Сама по себе система XWindow не является тем, что принято называть графическим интерфейсом пользователя. “Иксы” (так именуют XWindow в обиходе) — лишь его составная часть, которая не формирует изображение, а только предоставляет другим программам средства для работы с видеоподсистемой. X-сервер, запущенный “в чистом виде”, продемонстрирует пользователю серый экран, и на нем не будет ничего, кроме курсора мыши.

Кстати, этого более чем достаточно для работы одного приложения, нуждающегося в графическом интерфейсе. Например, довольно популярный в недавнем прошлом LiveCD MoviX вообще обходился без оконного менеджера (программы, отвечающей за отображение окон и предоставляющей пользователю механизм работы с ними), поскольку предназначался для запуска мультимедийного проигрывателя Mplayer и ни для чего более.

Аналогичный механизм можно использовать для организации рабочих мест сотрудников, которым не требуется разнообразное ПО. А заодно и убить второго зайца, значительно упростив работу подразделения техподдержки, ибо вероятность того, что пользователем случайно будет нажата не та кнопка и вызвана не та программа, минимизирована. Так что в некоторых случаях XWindow может выступать не как некий вспомогательный и незаметный инструмент, а как основной графический интерфейс. Но это скорее (и, видимо, к сожалению) исключение, а не правило.

В большинстве случаев

За настройку XWindow отвечает файл /etc/X11/xorg.conf. Он состоит из секций вида:

Section “Название секции”

Identifier “имя”

Каждая секция должна иметь уникальный идентификатор. Причем совершенно не обязательно наличие в файле всех возможных частей. Те, надобность в которых отсутствует, исключаются из его состава.

Секция ServerLayout содержит общую информацию о физических устройствах видеоподсистемы. Она имеет самый высокий приоритет — именно с нее система начинает анализ файла. В этой секции описывается оборудование, отвечающее за ввод информации и ее вывод.

В секции Files система ищет информацию о необходимых для работы XWindow файлах и путях к ним. Именно тут перечисляются все каталоги со шрифтами, используемыми в графическом режиме.

Секция Module предназначена для дополнительных подключаемых модулей, требуемых для нормального функционирования графической подсистемы. В частности, здесь расположены приказы загружать нужные шрифты.

Секция InputDevice содержит данные о порядке работы устройств ввода информации. Как правило, это клавиатура и мышь. Данный блок относится к категории часто редактируемых. Связано это с тем, что именно в нем описываются раскладки клавиатуры и способ их переключения, а не все дистрибутивы располагают удобным графическим инструментарием для изменения этих параметров.

А может быть, пользователям просто лень разбираться в баобабообразных меню, если речь идет о редактировании всего двух строк в одном-единственном файле. Судите сами. Если вдруг вы обнаружите, что точка с запятой находятся на цифровой панели клавиатуры, а не слева внизу от кнопки Enter, а раскладки переключаются не одновременным нажатием на Ctrl и Shift, а непонятно как, то самый простой путь — внести изменения в файл xorg.conf.

Нужная нам информация находится в секции InputDevice, описывающей устройство с идентификатором Keyboard0. Строки, указывающие, что в системе используются две раскладки — английская и русская (winkeys), переключение между которыми производится привычным для пользователя Windows способом, должны выглядеть так:

Option “XkbLayout” “us,ru(winkeys)”

Option “XkbOptions” “grp:ctrl_shift_toggle,grp_led:scroll”

Параметр led:scroll указывает, что индикатором переключения будет служить лампочка включения режима скроллинга, которая все равно не используется. А если вы считаете, что переключать раскладки двумя клавишами не очень удобно, то замените grp:ctrl_shift_toggle на caps_toggle, и доселе “лишняя” клавиша Caps Lock получит оправдание для своего существования.

Секция Device нужна для описания видеоадаптеров. Там явным образом указывается название используемого драйвера, поэтому самый простой способ получить информацию об этом модуле — посмотреть содержимое xorg.conf.

Например, на вашей машине установлена видеокарта nVidia и вы сомневаетесь, что система использует фирменный драйвер, поддерживающий трехмерную графику. Откройте конфигурационный файл и посмотрите параметр Driver секции Device. Если его значение — “nvidia”, то ваши сомнения напрасны, а если — “nv”, то они имеют под собой все основания.

В секции Monitor перечисляются характеристики монитора. При необходимости таких блоков может быть несколько, тем более что для показа режимов работы дисплея имеется другая секция. Она называется Screen, и в ней описываются настройки дисплея, работающего под управлением графического адаптера, идентификаторы которых указываются в строках Device и Monitor. Это хорошо видно из следующего примера:

Section “Screen”

Identifier “Screen0”

Device “Card0”

Monitor “Monitor0”

В данном случае задаются настройки графической подсистемы для видеокарты и монитора, обозначенных в секциях идентификаторами Card0 и Monitor0 соответственно. Раздел Screen устроен очень просто — в нем перечислены все разрешенные режимы работы.

Несмотря на простоту устройства конфигурационного файла, ряд дистрибутивов включают в себя графические инструменты для настройки XWindow. Таким образом, пользователю предоставляется еще одна степень свободы, ведь у таких утилит есть широкий круг поклонников, которые не собираются изменять своим привычкам.

Пользователям Linux XP следует запустить “Центр настройки”, где в разделе оборудования есть опция “Настройка видеосистемы”. В открывшемся окне ему предстоит выбрать модели видеоадаптера и дисплея. Со вторым всё довольно просто — достаточно знать тип монитора и поддерживаемые им разрешения. Конкретную модель указывать не нужно.

С видеокартой дела обстоят несколько сложнее. Выбирать из списка придется не по названию модели, а по имени драйвера. Что же делать пользователю, который не знает, как именно разработчики назвали модуль. Выход один: в общем случае внимательно просмотреть все предлагаемые программы и прочитать краткие пояснения к каждой из них.

Чтобы правильно выбрать драйвер видеокарты в центре управления Linux XP, недостаточно просто знать название модели

Традиционно функционально богатый инструмент предлагает пользователю дистрибутив SuSE. В центре управления YAST есть раздел “Оборудование”, где и можно найти соответствующую утилиту. Она позволит задать нужное разрешение экрана, раскладку клавиатуры и настроить некоторые дополнительные устройства — планшет и сенсорный дисплей. Для выбора драйвера графической платы пользователю придется воспользоваться программой обзора оборудования, также входящей в состав YAST.


SuSE традиционно предлагает пользователю инструмент настройки высокой функциональности

В дистрибутивах Fedora и ASPLinux конфигуратор графического режима находится в разделе “Администрирование”. Список поддерживаемых видеоадаптеров и мониторов достаточно широк — то, что пользователь найдет свою модель, практически гарантировано. В отдельной вкладке настраивается режим работы с двумя мониторами.


ASPLinux предлагает быстро сменить разрешение экрана

AltLinux также предлагает пользователю фирменный центр настройки, в котором есть инструмент для конфигурирования графического интерфейса. С его помощью можно сменить тип монитора, драйвер видеокарты, глубину цвета и разрешение экрана.


Центр настройки AltLinux позволяет сменить тип монитора и графического адаптера

Напоследок -- несколько важных замечаний. Существуют дистрибутивы, которые при неверной настройке графического режима сами пытаются загрузить заведомо работоспособную конфигурацию. Однако рассчитывать на это не следует. Лучше заранее принять необходимые меры предосторожности.

Во-первых, перед началом работы по настройке видеорежима сделайте резервную копию файла xorg.conf. Если что-то пойдет не так, как планировалось, то всегда можно будет восстановить предыдущую конфигурацию из консоли и запустить XWindow командой startx.

Во-вторых, если очень нужно запустить графический режим (хотя бы для того, чтобы выйти в Интернет и прочесть документацию), а перебрано уже с десяток моделей видеокарт и ни одна не подошла, то выбирайте универсальный драйвер vesa. Конечно, про оптимизацию XWindow в этом случае говорить не приходится, но что-то — это всё же лучше, чем совсем ничего.

В-третьих, большинство современных дистрибутивов автоматически создают конфигурационный файл, позволяющий получить если не оптимальные, то вполне приемлемые параметры графической подсистемы. А как известно, лучшее — враг хорошего. Не стоит сразу пытаться починить то, что и не ломалось.

Считается, что прадедушкой современной видеокарты является адаптер MDA (MonochromeDisplayAdapter), представленный в 1981 году для IBM PC. Видеокарта того времени имела 4Кбайт видеопамяти, работала только с текстовой информацией и с разрешением 720х350 точек и могла выдавать на дисплей 25 строк по 80 символов в строке. Цвет букв зависел от типа монитора: белые, изумрудные или янтарные, а сами буквы могли выводиться в обычном, подчеркнутом, инверсном (темные на светлом фоне) и мигающем режимах. Дальнейшее развитие MDA было выпущено в 1982 году известной тогда компаниейHerculesи называлосьHerculesGraphicsController(HGC). «Геркулес» отличался отMDAспособностью выводить текст в 132 колонки и 44 строки. Но и эта видеокарта не позволяла работать с графикой. Стоит заметить, что длина карты HGC была более 30 см.

Рисунок 7. Видеоадаптер HGC

И только с выходом видеоадаптера CGA (ColorGraphicsAdapter), который стал основой для последующих стандартов, появилась возможность работать с цветной графической информацией в разрешении 320х200 (4 цвета) и 640х200 (монохромный режим), при этом объём памяти видеокарты уже равнялся 16 Кбайт. Все упомянутые выше карты для соединения с ПК использовали шинуMultibus.

Следующий стандарт для видеокарт – EnhancedGraphicsAdapter(EGA), разработанный в 1984 году, позволял при разрешении 640x350 работать с 16 цветами из 64-цветной палитры одновременно. Ёмкость видеопамяти составляла теперь от 64 до 256 Кбайт, а также была заявлена совместимость с CGA и MDA. Начиная сEGA, видеоадаптеры начали использовать «широкую» шинуISA.

Все описанные выше видеокарты подключались к монитору через 9-контактный разъём и передавали информацию в цифровом виде. Только с выходом адаптера стандарта MCGA (MultiColorGraphicsAdapter– многоцветный графический адаптер) произошёл переход на аналоговый сигнал, так как палитра была увеличена до 262144 цветов (по 64 оттенка на каждый из базовых цветовRed/Green/Blue). Разрешение экрана, выдаваемое MCGA при работе с текстом, было 640х400 с 256 одновременно отображаемыми цветами, для графических приложений – 320х200 точек. Разъём для подключения к монитору приобретает привычный для нас вид – 15-контактный «D-Sub». Еще одна особенностьMCGA– точка на экране теперь сталаквадратной (раньше она была прямоугольной). Это означает, что окружность, выведенная на экран, будет действительно окружностью, а не эллипсом.

Следующим витком эволюции компьютерной видеоподсистемы является VGA (VideoGraphicsArray– графический видеомассив), который появился в 1987 году. Адаптеры VGA уже поддерживали разрешение 640х480 и 256 цветов (из палитры в 262144 цвета), объём памяти составлял 256-512 Кбайт, а соотношение сторон экрана равнялось привычным сейчас 4:3.

И наконец, в 1991 году появляются первые адаптеры SVGA (SuperVGA), позволяющие работать при разрешении 800х600 и 1024х768 точек, количество отображаемых цветов увеличилось до 65536 (HighColor) и 16,7 млн. (TrueColor). Также появляется возможность пользователю задать частоту обновления экрана монитора – до этого момента она была жёстко привязана к определённому значению. Память видеоадаптеров SVGA была уже более 1 Мбайт.

С развитием графических оболочек операционных систем (например, Windows) видеокарты взяли на себя часть вычислений по окончательному выводу изображения на экран, которые обычно производил центральный процессор: перемещение окон, рисование линий, шрифтов и другие. С появлением трёхмерных игр видеокарты обзавелись 3D-акселератором, который сначала имел вид отдельной карты, вставляемой в свободный разъём на материнской плате – до этого момента видеоадаптер позволял работать только с двухмерной графикой (2D). Акселератор, как правило, включался в разрыв кабеля между видеокартой и монитором и брал на себя видеовывод, когда этого требовала выполняющаяся на компьютере программа. Далее, с развитием технологий производства полупроводников, графический чип стал содержать в себе все необходимые блоки, отвечающие как за 2D-, так и 3D-графику.

Именно тогда доминирующая на тот момент компания 3dfx (все активы 3dfx после банкротства перешли к NVIDIA) представляет технологию SLI (ScanLineInterleave– чередование строчек), благодаря которой появилась возможность объединить две подобные видеокарты с шиной PCI для формирования изображения методом чередования строк, что увеличивало быстродействие графической подсистемы и разрешение экрана.

Рисунок 8. Спаренный видеоускоритель (SLI)

На рисунке 7 показана видеокарта Quantum3D ObsidianX-24 на базе двух Voodoo2 в режиме SLI

Действительно, всё новое – это хорошо (в данном случае – очень хорошо) забытое старое: спустя почти 15 лет NVIDIA возродила SLI в видеокартах для шины PCIe.

Рисунок 9. Видеокарта с шиной AGP

Ближе к концу 90-х прошлого века видеоадаптеры получили собственную шину – AGP (AcceleratedGraphicsPort– ускоренный графический порт) и приобрели черты современных видеокарт: объём локальной видеопамяти достиг десятков мегабайт, появилась возможность выводить видеоизображение на ещё один приёмник, например, телевизор. На рисунке 8 изображена видеокарта на базе SiS315 с шиной AGP.

Практически все современные видеокарты состоят из следующих основных компонентов:

    Видеопамять.

    Набор микросхем, (видеочипсет).

    Видео BIOS.

    Тактовые генераторы.

Принцип работы видеокарт (при формировании двумерного изображения) не сильно отличается от принципов, на которых была основана работа адаптера CGA. Центральный процессор компьютера формирует изображение (кадр) в виде массива данных и записывает его в видеопамять, а конкретно - в кадровый буфер. После этого видеочипсет последовательно, бит за битом, строка за строкой, считывает содержимое кадрового буфера и передает его RAMDAC (цифро-аналоговый преобразователь данных, хранящихся в памяти). Он в свою очередь формирует аналоговый RGB-сигнал, который вместе с сигналами синхронизации передаётся на монитор. Сканирование видеопамяти осуществляется синхронно с перемещением луча по экрану монитора, сигналы синхронизации вырабатывают встроенные в видеокарту тактовые генераторы.



Загрузка...