sonyps4.ru

Новый российский компьютер эльбрус. "Эльбрус" - процессор российского производства

Ранее уже началось производство первой серии серверов «Эльбрус 4.4», которые были разработаны организацией МЦСТ с участием процессоров «Эльбрус-4С». Теперь же производитель расширил свой ассортимент первым персональным компьютером - Эльбрус-401.

В продаже первый российский компьютер Эльбрус-401 появится уже летом. Стоить он будет, по словам помощника гендиректора по маркетингу МЦСТ Константина Трушкина, 400 тыс. рублей. Предназначен этот компьютер по цене автомобиля для тех покупателей, у кого имеются «перспективные проекты».

К. Трушкин объясняет ценник следующим образом: « Сейчас мы производим одну из первых опытных партий. Она, к сожалению, получается достаточно дорогой, но мы видим спрос, большой интерес даже на этих условиях. Мы пока не видим возможности, скажем так, и, может быть, даже не видим большого смысла для, таких, рядовых покупателей, для частных лиц, для энтузиастов обращаться к нам с просьбой продать эту машину просто потому, что она достаточно дорогая ».

То, что компьютер с отечественным процессором появился именно сейчас, имеет неплохую перспективу в будущем. По мнению представителей МЦСТ, в скором времени подобные устройства значительно подешевеют. К 2020 году планируется сделать компьютеры более массовым, что отлично совпадает с планами Минпромторга по импортозамещению, касающихся не только программного обеспечения, но и электроники.

Работает процессор Эльбрус-4С на тактовой частоте 800 МГц, оперативная память - 24 Гб, при чем ее можно увеличить до 96 ГБ. Жесткий диск имеет объем 1ТБ, mSATA - 128ГБ. Материнская плата также имеет набор периферийных интерфейсов. Видеокарта здесь не отечественного производства - штатная AMD Radeon 6000. Операционная система собственная - ОС Эльбрус, построенная на основе Linux. Некоторые приложения имеют открытый исходный код. Также есть возможность установки других операционных систем - Windows XP и вариации Linux. Сейчас идет прием заявок на приобретение компьютера, но только от юридических лиц.

Характеристики :

    четырехъядерный микропроцессор Эльбрус-4С (800 МГц, 2 МБ кэша) с производительностью до 50 Гфлопс;

  • 24 ГБ (3x 8 ГБ) оперативной памяти DDR3-1600;
  • жесткий диск SATA 3 Гбит/с объемом 1 ТБ;
  • mSATA SSD объемом 128 ГБ;
  • интегрированное видеоядро Silicon Motion SM718 16 МБ (2D, 1920x1080);
  • дискретная видеокарта Radeon серии HD 6000;
  • пишущий DVD-привод;
  • 450 Вт блок питания;
  • корпус форм-фактора Mini-Tower.

Мнение Байон

Компьютер построен на различной с компьютерами Intel архитектуре и предназначен в большей степени для решения узкоспециализированных задач. Поэтому предлагаем не смущаться невысоким на первый взгляд показателем частоты процессора - 800МГц. Недостающие характеристики российского процессора с успехом компенсируются преимуществами в архитектуре отечественного устройства.

Всем нам знакомы процессоры Intel Pentium. Существует мнение, что свое название он получил в честь российского ученого Владимира Мстиславовича Пентковского, который руководил разработкой архитектуры процессора Pentium III, а ранее работал в МЦСТ и разрабатывал советский суперкомпьютер Эльбрус.

Эльбрус Бабаяна и Pentium Пентковского

Перспективный микропроцессор E2k (Эльбрус-2000), разрабатываемый российской компанией Эльбрус, получил широкую известность лишь недавно, после статьи Кита Дифендорффа "Русские Идут" в февральском выпуске ведущего западного издания в области микропроцессорных архитектур "Microprocessor Report".

Основные тезисы статьи:

  • новый процессор должен показывать в 3-5 раз более высокую производительность, потреблять меньше электроэнергии и быть дешевле в производстве, чем Intel Merced;
  • команда Эльбрус имеет достаточно хорошую репутацию и опыт, чтобы действительно выпустить такой процессор;
  • компьютеры Эльбрус, реализующие основные современные архитектурные принципы, начали выпускаться задолго до того, как идеи на эту тему начали только обсуждаться на Западе;
  • процессор Эльбрус-3 был изготовлен в 1991 году по очень старой, даже по тем временам, кристальной технологии, но по производительности в два раза превосходил Cray.;
  • технологические новшества E2K столь же впечатляющи, как и архитектурные: E2K реализует лучшую схемотехнику, чем та, которая используется в рекордсмене последнего времени, процессоре Alpha 21264;
  • КМОП технология E2K с низким энергопотреблением позволит в ближайшие 2-3 года иметь "суперкомпьютер в карманном электронном блокноте ";
  • в области компиляторов команда Эльбрус не менее квалифицирована, чем в разработке архитектуры или электронном проектировании: распараллеливающий компилятор E2K в настоящее время достигает показателя 10-ти операций за такт, что почти в три раза выше, чем лучший в отрасли компилятор Alpha;
  • в режиме интерпретации E2K исполняет код микропроцессоров Intel и Sun всего на 10-30% медленнее, чем свой собственный (для сравнения, пакет FX!32, исполняющий код процессоров Intel на компьютерах Alpha, замедляет исполнение в 3 раза); при этом E2K позволяет достичь 100% двоичной совместимости для любых кодов процессоров Intel для любой операционной системы, что выгодно отличает E2K от того же FX!32;
  • важным свойством E2k является "непробиваемая" защита исполняемых кодов и данных от вирусов; развитие подобного направления оборвалось на Западе вместе с провалом микропроцессора Intel 432.

О том, что в России разрабатывается процессор, по своим возможностям потенциально превосходящий Merced, поведали средства массовой информации всего мира. В Internet не стихают обсуждения этой темы. Об Эльбрус E2k очень высоко отзываются многие признанные Западные специалисты по микропроцессорам. По их мнению, в российский микропроцессор заложены уникальные идеи с большим будущим.

В начале этого года Эльбрус завершил логическое проектирование процессора и все системное программное обеспечение. На точной модели E2k были получены оценки производительности. Теперь предстоит завершающий этап — перенос архитектуры на кристалл.

В этой статье кратко изложена история компьютеров семейства Эльбрус, рассказано об отечественных приоритетах на некоторые архитектурные решения, широко используемые в современных микропроцессорах. Ведь изучение истории часто позволяет яснее увидеть будущее.

Эльбрус

С именем Эльбрус связана история всей мировой вычислительной отрасли. Компания Эльбрус была образована на базе ИТМиВТ имени С.А. Лебедева (Института Точной Механики и Вычислительной Техники, коллектив которого на протяжении более 40 лет разрабатывал суперкомпьютеры для оборонных систем Советского Союза). В процессоре E2k воплощены и развиваются идеи российского суперкомпьютера Эльбрус-3, построенного в 1991г. Сегодня архитектуру Эльбрус-3 принято относить к EPIC (Explicitly Parallel Instruction Computing — вычисления с явным параллелизмом команд).

По словам Бориса Арташесовича Бабаяна, главного архитектора суперкомпьютеров линии Эльбрус, суперскалярная архитектура была изобретена в России: "В 1978-ом году мы сделали первую суперскалярную машину, Эльбрус-1. Сейчас на Западе делают суперскаляры только такой архитектуры. Первый суперскаляр на Западе появился в 92-ом году, наш в 78-ом. Причем тот вариант суперскаляра, который сделали мы, аналогичен Pentium Pro, который Intel сделал в 95-ом году ".

Подтверждают историческое первенство Эльбрус и в Америке. В той же статье из Microprocessor Report Кит Дифендорфф, разработчик Motorola 88110, одного из первых западных суперскалярных процессоров, пишет: "В 1978 году, почти на 15 лет раньше, чем появились первые западные суперскалярные процессоры, в Эльбрус-1 использовался процессор, с выдачей двух команд за один такт, изменением порядка исполнения команд, переименованием регистров и исполнением по предположению ".

В 1991г в Эльбрус (тогда еще ИТМиВТ) побывал г-н Розенбладт (Peter Rosenbladt) из фирмы Hewlett-Packard, и получил исчерпывающую документацию на Эльбрус-3. Позже выяснилось, что именно тогда HP начала проект, приведший к совместной с Intel разработке EPIC-процессора Merced. Его архитектура очень схожа с Эльбрус-3, а отличия в основном связаны с упрощениями сделанными в микропроцессоре от Intel.

По словам Б.А. Бабаяна, Петер Розенбладт предлагал сотрудничество с HP. Но Бабаян выбрал Sun (первая встреча с руководством Sun состоялась еще в 1989г). И в 1991г с Sun был заключен контракт. От официальных представителей Sun известно, что Эльбрус принимал участие в разработке микропроцессора UltraSPARC, оптимизирующих компиляторов, операционных систем (в том числе Solaris), инструментария Java, библиотек мультимедиа.

Первоначально проект E2k финансировался фирмой Sun. Сейчас проект полностью независим, вся интеллектуальная собственность на него принадлежит Эльбрус и защищена примерно 70-ю патентами США. Б.А. Бабаян поясняет "Если бы мы и дальше работали с Sun в этой области, то все принадлежало бы Sun. Хотя 90% работы было выполнено еще до появления Sun ".

В Sun с 1992 по 1995 Эльбрус работал вместе с известным микропроцессорным архитектором Дэйвом Дитцелом. Как рассказывает Б.А. Бабаян, "Потом Дэйв образовал собственную фирму — Transmeta и начал работать над машиной, очень похожей на нашу. Мы по-прежнему поддерживаем с Дитцелом тесные контакты. Да и он очень хочет с нами сотрудничать ". Про будущий продукт Transmeta пока известно мало. Известно, что это VLIW/EPIC микропроцессор с низким энергопотреблением, двоичная совместимость с x86 обеспечивается динамической трансляцией объектного кода.

А совсем недавно я выяснил, что разработки Эльбрус имеют непосредственное отношение и к самым распространенным сейчас универсальным микропроцессорам — семейству x86 фирмы Intel.

Пентиум

Отечественные суперкомпьютерные ноу-хау реализованы в микропроцессорах Pentium. Бывший сотрудник ИТМиВТ Владимир Пентковский в настоящее время является ведущим разработчиком микропроцессоров фирмы Intel. Вместе с Пентковским в Intel попали огромный опыт и совершенные технологии, разработанные в ИТМиВТ. По словам Кита Дифендорффа, компьютеры Эльбрус, в которых реализованы основные принципы современных архитектур, такие как SMP, суперскалярная и EPIC архитектуры, начали выпускаться задолго до того, как идеи на эту тему начали только обсуждаться на Западе.

Все системное программное обеспечение Эльбрус-1 и Эльбрус-2 было создано с использованием языка программирования высокого уровня Эль-76, а не традиционного ассемблера. Эль-76 напоминает язык Algol-68, принципиальное отличие, пожалуй, состоит в динамическом связывании типов в Эль-76, которое поддержано на аппаратном уровне. Эль-76 является одновременно языком прикладного программирования, управления заданиями, системного программирования. Ассемблер в Эльбрус не использовался — только высокоуровневое программирование. Эль-76 перед исполнением переводился в байткод на манер Java. Этот байткод "на ходу" аппаратно транслировался в простые машинные команды.

В ИТМиВТ Владимир Пентковский принимал участие в разработке суперкомпьютеров Эльбрус-1 (1978) и Эльбрус-2 (1984). В 1986 году он возглавил проект 32-разрядного микропроцессора Эль-90. К 1987 году логический дизайн будущего микропроцессора был завершен, а в 1990г произведены первые прототипы. В Эль-90 сочетались концепция RISC и архитектура Эльбрус-2.

Основные характеристики Эль-90:

  • выдача до трех команд за такт
  • 32-разрядная архитектура
  • упрощенный набор команд (по сравнению с Эльбрус-2), большинство команд исполняются за один такт
  • аппаратная поддержка языков программирования высокого уровня
  • исполнение по предположению
  • изменение порядка исполнения команд
  • предсказание ветвлений
  • переименование регистров
  • раздельные кэши команд и данных по 32KB
  • конвейеризованное устройство вещественной арифметики
  • поддержка мультипроцессорности (до 10 процессоров)
  • режим "сверхнадежных вычислений" (несколько процессоров независимо производят вычисления и сравнивают результаты, а если результаты расходятся, считают заново). Этот режим требовался, потому что используемая в Эльбрус элементная база была недостаточно надежной для некоторых военных приложений.

В 1990г Пентковский начал работу над Эль-91С, последователем Эль-90. Но после изменения в России политической и экономической системы, финансирование разработки прекратилось. На период с 1991 по 1999 год Пентковский теряется из нашего поля зрения. Вновь его имя появляется в Intel Technology Journal. Согласно приложению "биографии разработчиков" к статье, посвященной архитектуре микропроцессора Pentium III (http://developer.intel.com/technology/itj/q21999/articles/art_2who.htm#pentkovski), Владимир Пентковский является главным архитектором Pentium III.

Хочется также напомнить, что в 1993 году Intel представила свой принципиально новый 32-разрядный процессор Pentium. Вот некоторые из его характеристик:

  • декодер команд Pentium заменяет команды x86 простыми RISC-подобными, которые процессор способен эффективно обрабатывать
  • суперскалярная архитектура с выдачей до двух команд за такт
  • предсказание ветвлений
  • раздельные кэши команд и данных
  • конвейеризованный блок операций с вещественными числами
  • поддержка многоуровневой иерархии памяти, кэш первого и второго уровня
  • поддержка мультипроцессорности (2 процессора)
  • поддержка отладки, мониторинг производительности
  • режим "сверхнадежных вычислений" — два процессора Pentium независимо производят вычисления и сравнивают результаты — если результаты расходятся, считают по-новому.

Не правда ли, между Pentium и Эль-90 очень много общего?

Может статься, что процессор Pentium назван по фамилии своего разработчика Владимира Пентковского. Действительно, в 1995 году фирма Intel выпустила более совершенный процессор Pentium Pro, который уже вплотную приблизился по своим возможностям к Российскому микропроцессору 1990 года. В Pentium Pro был улучшен декодер команд x86, совершенствовано суперскалярное ядро, добавлено исполнение по предположению, изменение порядка исполнения команд, переименование регистров, улучшен блок операций с вещественными числами.

Сегодня предыдущий начальник Пентковского, Борис Бабаян, намерен противопоставить Intel новейшу разработку компании Эльбрус, процессор E2k.

E2k

Микропроцессор Эльбрус E2k с архитектурой EPIC разрабатывает отечественная компания Эльбрус Интернэшнл (www.elbrus.ru). Руководит проектом член-корреспондент РАН Б.А. Бабаян. Серийное производство начнется в 2001 году, при условии достаточного финансирования. Можно предположить, что в начале 2000г будет реализован прототип E2k. Причем возможно, что он будет произведен на мини-заводе в Москве. Сейчас процессор существует в виде описания на специализированном языке Verilog, такое описание является финальным этапом логического проектирования, на следующем этапе Verilog-описание переносят на кристалл. Уже готов весь набор системного программного обеспечения E2k. Он включает в себя распараллеливающий компилятор и двоичный транслятор кода x86. Примерно два года назад Эльбрус демонстрировал исполнение MS Windows 95 и игры MS FlightSimulator на рабочей станции Sun с процессором UltraSPARC. По всем показателям Эльбрус E2k должен превзойти американские разработки. Е2k будет иметь более высокую производительность при меньшем энергопотреблении и меньших размерах кристалла. При этом программной двоичной трансляцией обеспечивается полная совместимость с кодом x86 почти без потерь производительности по сравнению с собственным кодом E2k. Кстати, языки программирования C и C++ со статическими типами на E2k могут обрести новые интересные свойства — аппаратно поддержанные динамику типов и контекстную защиту.

Российской разработкой заинтересовалась корпорация Microsoft, для операционных систем которой, вероятно, очень бы пригодилась производительность E2k. Легенда компьютерного мира Гордон Бэлл (Gordon Bell), который, работая в DEC, создавал компьютеры линий PDP и VAX, а сейчас возглавляет исследовательское подразделение Microsoft (Telepresence Research Group), популяризирует проект Эльбрус E2k на международных конференциях.

Его лекция с названием "Следующее десятилетие супервычислений" (The Next Ten Years in Supercomputing) 26 мая 1999 г открывала Международный Симпозиум по Высокопроизводительным Вычислениям (International Symposium on High Performance Computing) в Японии, а 10 июня — четырнадцатую Манхеймовскую Конференцию по Суперкомпьютерам (Mannheim Supercomputer Conference) в Германии. Оба раза доктор Бэлл часть лекции посвятил рассказу о E2k. В слайде под названием "Russian Elbrus E2K" он приводит таблицу, где оценивает E2k и Merced. Причем сравнение свидетельствует явно не в пользу детища Intel.

Ниже приведена таблица из доклада Гордона Бэлла.

Микропроцессор E2K Merced
Тактовая частота, ГГц 1.2 0.8
Производительность, SPECint95 / SPECfp95 135 / 350 45 / 70
Размер кристалла, мм 2 126 300
Энергопотребление, Ватт 35 60
Пропускная способность шины, Гбайт/сек 15 н/д
Кэши (Кбайт) 64 / 256 н/д
Пиковая производительность, GFLOPS 10.2 н/д
Планируемое время начала поставок 4-ый квартал 2001г н/д

Гордон Бэлл (www.research.microsoft.com/users/gbell/bio.htm) является не только высокопоставленным сотрудником Microsoft, но и влиятельным в компьютерном мире консультантом и предпринимателем. Он создал несколько частных фирм, занимающихся разработкой перспективных технологий.

Заключение

Проект Эльбрус E2k уже имеет научный и технический вес — ведь разработано много новых интересных архитектурных решений, созданы совершенные компиляторы нового поколения. А еще E2k означает, что в России сохранились специалисты высшего класса. Профессор Б.А. Бабаян и другие сотрудники Эльбрус преподают в российских вузах, следовательно, специалистов еще прибавится.

Поэтому мне кажется, что проект уже удался, вне зависимости от реализации в железе. Хотя, наверно, Эльбрус со мной не согласится по части реализации — и реализует.

Про десктопные процессоры от Intel и AMD слышали и пользуются ими многие. Олдфаги помнят, что порядка 10 лет назад у них был конкурент - процессоры от VIA (которые, увы, конкуренции не выдержали). Ну и уж совсем гики знают про советско-российские процессоры Эльбрус (хотя, впрочем, в свете последних новостей, о них знают достаточно много людей). Поэтому в этой статье мы и поговорим об этих процессорах: как они создавались, на какой архитектуре работали, и что из себя представляют сейчас.


В СССР отлично понимали, что за процессорами будущее. При этом брать разработки других компаний было нехорошо - нужно, чтобы и элементная база, и теоретические разработки происходили на территории страны (что, впрочем, не помешало с помощью reverse engineering создать множество клонов процессоров от Intel вплоть до 286). В результате, в 1980 году, был представлен вычислительный комплекс Эльбрус-1, который был построен по нормам ТТЛ (транзисторно-транзисторной логика - микросхемы, состоящие из биполярных транзисторов и резисторов, где транзисторы играли роль не только логических элементов, но и использовались для усиления выходного сигнала) и включал в себя 10 ЦП. Итоговая производительность была на уровне 12 млн операций в секунду: для примера, процессор Intel 8086, с которого, собственно, и пошли х86 процессоры, мог выполнять 330 тыс оп/с, и только Intel i486DX, вышедший 10 лет спустя, мог тягаться с этим вычислительным комплексом.



В 1985 году был представлен новый вычислительный комплекс - Эльбрус-2. Он также имел 10 ЦП, но построены они были на основе интегральных схем ИС-100 (полученными с помощью reverse engineering из процессоров Motorola 10000ой серии). Каждый процессор имел частоту в 20 МГц, и суммарно кластер мог оперировать со 144 МБ ОЗУ. Внешней памятью выступала магнитная лента, а адресуемый объем достигал 700 МБ (столько же, сколько на обычной CD-болванке). Итоговая производительность была уже 125 млн оп/с - это сравнимо с процессорами архитектуры Cortex M3 с частотой в 100 МГц, которые, к примеру, играют роль сопроцессоров для датчиков в iPhone (и называются Apple M7-M10): да, производительность целого вычислительного кластера, который занимал не одну комнату и требовал серьезного охлаждения, теперь помещается в крохотном чипе в смартфоне.


Новый виток развития Эльбрус пришелся на смутные времена, 1989-1994 годы: заниматься обратной разработкой было уже нельзя: во-первых, Россия - не СССР, и патенты иностранных фирм нарушать было уже нельзя. Во-вторых, одно дело - заниматься reverse engineering процессора с 100 тыс транзисторов, а другое - с десятком миллионов: это гораздо сложнее. В итоге пришлось переходить на VLIW-архитектуру (она специально создана для многопроцессорных систем: одна инструкция процессора содержит несколько операций, выполняемых параллельно, причем известно, какой вычислительный блок выполняет какую операцию). Очевидно, что совместимости с Эльбрус-2 не было, как не было и денег на производство, так что Эльбрусы «похоронили» до начала нулевых.


Новейшее время, разработки ЗАО МЦСТ

В начале нулевых, когда основные проблемы в стране были решены, правительство снова обратило внимание на отечественные процессоры. Увы - время было упущено: с 1994 по 2000 год Intel сделали огромный скачок: процессоры нарастили частоты на порядок, техпроцесс также уменьшился на порядок. А Эльбрусы по сути так и остались на уровне начала 90ых, и нужно было что-то решать.

И тут, на мой взгляд, МЦСТ сделали серьезную ошибку: поняв, что архитектуру нужно менять, они выбрали SPARC. Разумеется, х86-процессоры для них были закрыты, но ведь был же стабильно развивающийся ARM, который также, как и SPARC, свободен для лицензирования. И если последний прекратил свое развитие аж в 1993 году на девятой версии, то ARM развивается дальше. К счастью, в МЦСТ достаточно быстро поняли тупиковость этого пути, и уже в 2005 году представили первый процессор на собственной архитектуре «Эльбрус», и эта архитектура продолжает развиваться. Но все еще 5 лет были потеряны, что для процессоров достаточно серьезный срок.


Поговорим о «Эльбрусе» подробнее. Эта архитектура основана на все той же VLIW и разработках Эльбрус-3 90ых годов. Основное отличие от привычных нам RISC (это ARM и SPARC) и CISC (x86) заключается в принципах анализа зависимостей и порядка выполнения поступающего потока инструкций: в традиционных архитектурах именно процессор находит независимые операции и запускает их параллельно на разных ядрах, и этот динамический анализ зависимостей и поддержка внеочередного выполнения команд приводит к тому, что современные процессоры могут выполнять 4-6 команд за такт. В архитектуре «Эльбрус» основную работу по анализу зависимостей и оптимизации порядка операций берет на себя компилятор. Процессору на вход поступают т.н. «широкие команды», в каждой из которых закодированы инструкции для всех исполнительных устройств процессора, которые должны быть запущены на данном такте. От процессора не требуется анализировать зависимости между операндами или переставлять операции между широкими командами: все это делает компилятор, исходя из анализа исходного кода и планирования ресурсов процессора. В результате аппаратура процессора может быть проще и экономичнее, а процессоры способны выполнять до 23 (и даже 33 в некоторых случаях) команд за такт!

В итоге архитектура «Эльбрус» успешно исправляет основную проблему современных вычислительных систем - распараллеливание задачи на большое число потоков: если у Intel или AMD с этим проблемы (самый банальный пример - в играх 4ядерные i7 оказываются на уровне или даже лучше 8ядерных Ryzen), то МЦСТ это проблему преодолели.

Производительность Эльбрус

Еще одной важной особенностью Эльбрусов является то, что они в режиме динамичной двоичной трансляции способны «крутить» х86-код - то есть на них можно запускать Windows и полноценные программы для нее. Динамическая двоичная трансляция позволяет «на лету» преобразовывать двоичные коды х86 инструкций в машинные коды «Эльбруса», то есть по сути запускается виртуальная машина с полноценным BIOS, и уже на ней запускается х86-код.

В итоге оценить производительность мы можем сразу по двум параметрам: во-первых, в GFLOPS - это чисто математическая производительность, которая позволяет приблизительно оценить возможности процессоров на любых архитектурах. Эльбрус 4С, который сейчас является самым производительным из тех, что можно купить, имеет 4 ядра с частотой в 800 МГц, построен на 65 нм техпроцессе, имеет 8 МБ кэша L2 и производительность с двойной точностью на уровне 25 Гфлопс. Для оценки - Intel Core 2 Quad Q6600, 4ядерный мощный процессор, выпущенный в конце нулевых, имеет производительность в 35 Гфлопс. i7-4770, предтоповый процессор 2013-2014 года, имеет производительность уже 250 Гфлопс. Правда, они оба имеют тепловыделение в 65 Вт против 45 у Эльбруса, но разница в производительности гораздо существенней.

Второй способ оценки производительности - это запуск Windows, что и было сделано: на Эльбрус-4С запустили Windows 7 и игру GTA: Vice City (которой уже больше 10 лет):

Самый интересный момент происходит на 10:07 - на экране видно, что эмулируется процессор Pentium 4 с частотой в 800 МГц, а объем доступной ОЗУ - 2.5 ГБ:


Что нам это говорит? То, что каждое ядро по своим возможностям сравнимо с Pentium 4, то есть поддерживает все те же инструкции, что и процессор почти 15-летней давности - никаких AVX, только MMX и старые версии SSE (правда, тут 4 ядра, но и случай не тот, где количество превращается в качество). Поэтому нормально будет работать софт лишь до середины нулевых - все, что новее, уже требует как минимум SSE 4, а вообще говоря уже и AVX. И второе - виртуальная машина требует 1 ГБ ОЗУ (так как всего из 4 ГБ на х86-системе доступно должно быть 3.5, а тут - 2.5), что достаточно мало. В общем и целом все это здорово, но все же хуже разработок конкурентов: так, Windows 10 была запущена и нормально работала на ARM-процессоре, причем запускали там не игрушку 15-летней давности, а достаточно тяжелый Photoshop.

Причем небольшая производительность даже не основная проблема: для Эльбруса создана ОС на основе Linux, и там производительность более чем хорошая - проблем с запуском офисных программ и браузеров нет, а большинству пользователей (и офисных работников) большего и не нужно. Основная проблема в стоимости - так как производство небольшое, то стоимость каждого чипа оказывается заоблачной, а полностью готовый ПК стоит больше 100 тысяч рублей: за такие деньги сейчас можно собрать или хороший игровой ПК, или среднестатистическую рабочую станцию. МЦСТ же предлагает за ту же сумму по сути обычный офисный ПК, цена которого не превышает 15 тысяч рублей даже при покупке РСТ-комплектующих. Поэтому единственный очевидный сценарий использования - в госпредприятиях, где цена не имеет значения. Обычным же людям пока приходится пользоваться «басурманской» техникой, но кто знает - может быть, лет через 10, Эльбрусы станут конкурентоспособными.

Одним из проектов компании стала разработка первого российского настольного компьютера на базе процессора «Эльбрус-4С». Он получил название «АРМ Эльбрус-401» (где АРМ расшифровывается, как автоматизированное рабочее место). Модель разработана под офис в корпусе стандарта MiniTower. Но может применяться в разных сферах с повышенными требованиями к информационной безопасности.

У компьютера есть технологический процесс 65 нм с тактовой частотой 800 Гц, порты SATA-2 и USB 2.0 , предустановленный SSD 120 ГБ с интерфейсом mSATA и поддержкой DDR3-1600 с ECC. Базовая конфигурация предлагается 24 ГБ оперативной памяти (с возможностью расширения до 96 ГБ). Среди особенностей архитектуры «АРМ Эльбрус-401» можно выделить следующие: наличие 6 параллельно работающих каналов арифметико-логических устройств; регистровый файл из 256 84-разрядных регистров; аппаратную поддержку циклов; поддержку спекулятивных вычислений и однобитовых предикатов; команду, которая может задать в одном такте до 23 операций при максимальном заполнении. Также в компьютер установлена видеокарта AMD Radeon серии 6000.

Компьютер «АРМ Эльбрус-401»

Процессор нового поколения - «Эльбрус-8С»

Разрабатывает процессор «Эльбрус-8С» компания МЦСТ при участии Институт электронных управляющих машин (ИНЭУМ) им. И.С. Брука. Архитектура, схемотехника и топология микропроцессора были созданы российскими специалистами. У процессора восемь ядер с улучшенной 64-разрядной архитектурой «Эльбрус». Тактовая частота достигает 1,3 ГГц, объем кеш-памяти второго и третьего уровня - 4 и 16 МБ. Предполагаемая производительность достигает 250 GFLOPS.

Технические характеристики «Эльбрус-8С»

У компьютера присутствует своя архитектура «Эльбрус», которая разработана в ЗАО «МЦСТ». Векторные ускорители систем команд помогают сделать шифрование и обработку сигналов более быстрым.

Взаимодействие аппаратной части с ОС происходит через собственный микрокод BIOS. Процессор совместим с дистрибутивами Linux, FreeBSD, QNX, Windows XP , но рекомендованная операционная система «Эльбрус» на базе ядра Linux 2.6.33. Применение специализированных средств разработки (оптимизирующие компиляторы с языков C и C++, Фортран, Java и т.д.) дает возможность оптимизировать код программы с учетом архитектуры «Эльбрус».

Процессор «Эльбрус-8С»

Компанией уже разрабатываются служебные программы и вспомогательные компоненты, оптимизированные для работы на процессорах. Это все - средства для работы с сетью и периферийными устройствами (утилиты, библиотеки общего назначения, сервисы, поддержка баз данных, графическая подсистема).

«Эльбрус-8С» должен работать в паре с КПИ 2 - контроллером периферийных интерфейсов российского производства.

  • Обработка изображений ,
  • Программирование
  • В этой статье мы покажем, как работают технологии распознавания образов на Эльбрус-4С и на новом Эльбрус-8С: рассмотрим несколько задач машинного зрения, немного расскажем об алгоритмах их решения, приведем результаты бенчмаркинга и наконец покажем видео.



    Эльбрус-8С - новый 8-ядерный процессор МЦСТ с VLIW-архитектурой. Мы тестировали инженерный образец с частотой 1.3 ГГц. Возможно, в серийном выпуске она еще возрастет.



    Приведем сравнение характеристик Эльбрус-4С и Эльбрус-8С.


    Эльбрус-4С Эльбрус-8С
    Тактовая частота, МГц 800 1300
    Число ядер 4 8
    Число операций за такт (на ядро) до 23 до 25
    L1 кэш, на ядро 64 Кб 64 Кб
    L2 кэш, на ядро 2 Мб 512 Кб
    L3 кэш, общая - 16 Мб
    Организация оперативной памяти До 3 каналов DDR3-1600 ECC До 4 каналов DDR3-1600 ECC
    Технологический процесс 65 нм 28 нм
    Количество транзисторов 986 млн. 2730 млн.
    Ширина SIMD инструкции 64 бита 64 бита
    Поддержка многопроцессорных систем до 4 процессоров до 4 процессоров
    Год начала производства 2014 2016
    Операционная система ОС “Эльбрус” 3.0-rc27 ОС “Эльбрус” 3.0-rc26
    Версия компилятора lcc 1.21.18 1.21.14

    В Эльбрус-8С более чем в полтора раза повысились тактовая частота, вдвое увеличилось число ядер, а также произошло усовершенствование самой архитектуры.


    Так, например, Эльбрус-8С может исполнять до 25 инструкций за 1 такт без учета SIMD (против 23 у Эльбрус-4С).


    Важно : нами не проводилось никакой специальной оптимизации под Эльбрус-8С. Была задействована библиотека EML, однако объем оптимизаций под Эльбрус в наших проектах сейчас явно меньше, чем под другие архитектуры: там он постепенно наращивался в течение нескольких лет, а платформой Эльбрус мы занимаемся не так давно и не столь активно. Основные времязатратные функции, конечно же, были оптимизированы, но вот до остальных пока не дошли руки.

    Распознавание паспорта РФ

    Разумеется, начать освоение новой для нас платформы мы решили с запуска нашего продукта Smart IDReader 1.6 , предоставляющего возможности по распознавания паспортов, водительский прав, банковских карт и других документов. Необходимо отметить, что стандартная версия этого приложения может эффективно задействовать не более 4 потоков при распознавании одного документа. Для мобильных устройств этого более чем достаточно, а вот при бенчмаркинге десктоп-процессоров это может приводить к занижению оценок производительности многоядерных систем.


    Предоставленная нам версия ОС Эльбрус и компилятора lcc не потребовали никаких специальных изменений в исходном коде и мы без каких-либо трудностей собрали наш проект. Отметим, что в новой версии появилась полная поддержка С++11 (она также появилась и в свежих версиях lcc для Эльбрус-4С), что не может не радовать.


    Для начала мы решили проверить, как работает распознавание паспорта РФ, о котором мы уже писали , на Эльбрус-8С. Мы провели тестирование в двух режимах: поиск и распознавание паспорта на отдельном кадре (anywhere-режим) и на видеоролике, снятом с веб-камеры (webcam-режим). В anywhere режиме распознавание разворота паспорта выполняется на одном кадре, причем паспорт может находиться в любой части кадра и быть произвольным образом ориентированным. В режиме webcam выполняется распознавание только страницы паспорта с фото, причем обрабатывается серия кадров. При этом предполагается, что строки паспорта горизонтальны и паспорт слабо смещается между кадрами. Полученная с разных кадров информация интегрируется для повышения качества распознавания.


    Для тестирования мы взяли по 1000 изображений для каждого из режимов и замеряли среднее время работы распознавания (т.е. время без учета загрузки картинки) при запуске в 1 поток и запуске с распараллеливанием. Полученное время работы приведено ниже в таблице.



    Результаты для однопоточного режима вполне соответствуют ожидаемым: помимо ускорения за счет повышения частоты (а кратность частот 4С и 8С равна 1300 / 800 = 1.625), заметно небольшое ускорение за счет усовершенствования архитектуры.


    В случае запуска на максимальном числе потоков ускорение для обоих режимов составило 1.7. Казалось бы, число ядер в Эльбрус-8С вдвое больше, чем в 4С. Так где же ускорение за счет дополнительных 4 ядер? Дело в том, что наш алгоритм распознавания активно задействует только 4 потока и слабо масштабируется дальше, поэтому прирост производительности совсем незначительный.


    Далее мы решили добиться полной загрузки всех ядер обоих процессоров и запустили несколько процессов распознавания паспорта. Каждый вызов распознавания был распараллелен так же, как и в предыдущем эксперименте, однако здесь время обработки паспорта включало загрузку изображения из файла. Замеры времени выполнялись на все той же тысяче паспортов. Результаты при полной загрузке Эльбрусов приведены ниже:



    Для anywhere-режима полученное ускорение приблизилось к ожидаемому ускорению в ~3.6 раза, не дотянув до него из-за того, что мы учитывали время загрузки картинки из файла. В случае с webcam-режимом влияние времени загрузки еще больше и поэтому ускорение получилось более скромным - 2.5 раза.

    Детекция автомобилей

    Детекция объектов заданного типа - одна из классических задач технического зрения. Это может быть детекция лиц, людей, оставленных предметов или любого другого типа объектов, обладающих явными отличительными признаками.


    Для нашего примера мы решили взять задачу детекции автомобилей, движущихся в попутном направлении. Подобный детектор может использоваться в системах автоматического управления транспортными средствами, в системах распознавания автомобильных номеров и т.д. Не долго думая, мы отсняли видео для обучения и тестирования с помощью авторегистратора неподалеку от нашего офиса. В качестве детектора мы использовали каскадный классификатор Виолы-Джонса . Дополнительно мы применили экспоненциальное сглаживание положений найденных автомобилей для тех из них, которые мы наблюдаем несколько кадров подряд. Стоит отметить, что детектирование выполняется только в прямоугольнике ROI (region of interest), который занимает не весь кадр, поскольку малоосмысленно пытаться детектировать внутренности нашего автомобиля, а также машины, не полностью попадающие в кадр.


    Таким образом, наш алгоритм состоял из следующих шагов:

    1. Вырезание прямоугольника ROI по центру кадра.
    2. Преобразование цветного изображения ROI в серое.
    3. Предпосчет признаков Виолы-Джонса.
      На этом этапе изображение подвергается масштабированию, строятся карты вспомогательных признаков (например, направленных границ), а также вычисляются кумулятивные суммы по всем признакам для быстрого подсчета хааровских вэйвлетов.
    4. Запуск классификатора Виолы-Джонса на множестве окон.
      Здесь с некоторым шагом перебираются прямоугольные окна, на которых запускается классификатор. Если классификатор выдал положительный ответ, то произошла детекция объекта, т.е. изображение внутри окна соответствует автомобилю. В этом случае выполняется уточнение области изображения, в которой находится объект: в окрестности первичной детекции выделяются окна того же размера, но с меньшим шагом и также подаются на вход классификатора. Все найденные объекты сохраняются для дальнейшей обработки. Данная процедура повторяется для нескольких масштабов входного изображения.
      Этот этап собственно и составляет основную вычислительную сложность задачи и распараллеливание было произведено именно для него. Мы использовали библиотеку tbb для автоматического выбора эффективного числа потоков.
    5. Обработка массива детекций, полученного после применения детектора. Поскольку ряд полученных детекций могут быть очень близкими и отвечать одному и тому же объекту, мы объединяем детекции, имеющие достаточно большую площадь пересечения. В результате получаем массив прямоугольников, которые указывают положение обнаруженных автомобилей.
    6. Сопоставление детекций на предыдущем и текущем кадрах. Мы считаем, что был задетектирован один и тот же объект, если площадь пересечения прямоугольников составляет больше половины от площади текущего прямоугольника. Выполняем сглаживание положения объекта по формулам:
      x i = x i + (1-α)x i -1
      y i = y i + (1-α)y i -1
      w i = w i + (1-α)w i -1
      h i = h i + (1-α)h i -1
      где (x , y )--- координаты верхнего левого угла прямоугольника, w и h - его ширина и высота соответственно, а α - постоянный коэффициент, подобранный экспериментально.


    Здесь и далее для оценки fps (frame per second) использовалось среднее время работы по 10 запускам программы. При этом учитывалось только время обработки изображений, поскольку сейчас мы работали с записанным роликом, и изображения просто загружались из файла, а в реальной системе они могут, например, поступать с камеры. Оказалось, что детекция работает с весьма приличной скоростью, выдавая 15.5 fps на Эльбрус-4С и 35.6 fps на Эльбрус-8С. На Эльбрус-8С загрузка процессора оказывается далеко не полной, хотя в пике задействованы все ядра. Очевидно, это связано с тем, что не все вычисления в этой задаче были распараллелены. Например, перед применения детектора Виолы-Джонса мы выполняем достаточно тяжеловесные вспомогательные преобразования каждого кадра, а эта часть системы работает последовательно.


    Теперь пришло время демонстрации. Интерфейс приложения и отрисовка выполнены с помощью стандартных средств Qt5. Никакой дополнительной оптимизации не проводилось.


    Эльбрус-4С



    Эльбрус-8С


    Визуальная локализация

    В этом приложении мы решили продемонстрировать визуальную локализацию на основе особых точек. Использовав панорамы Google Street View с GPS-привязкой, мы научили нашу систему узнавать местонахождение камеры без использования данных о её GPS-координатах или другой внешней информации. Такая система может использоваться для беспилотников и роботов в качестве резервной системы навигации, для уточнения текущего местоположения или для работы в системах без GPS.


    Сначала мы обработали базу панорам с GPS-координатами. Мы взяли 660 изображений, покрывающих приблизительно 0.4 км^2 московских улиц:




    Затем мы создали описание изображений с помощью особых точек. Для каждого изображения мы:

    1. Нашли особые точки для 3 масштабов кадра (сам кадр, уменьшенный в 4/3 раза кадр и уменьшенный вдвое кадр) алгоритмом YAPE (Yet Another Point Detector) и посчитали для них RFD-дескрипторы .
    2. Сохранили его координаты, набор особых точек, их дескрипторы. Поскольку затем мы будем сравнивать дескрипторы особых точек текущего кадра со значениями дескрипторов из нашей базы, удобно хранить дескрипторы в дереве, используя расстояние Хэмминга в качестве метрики. Общий размер сохраненных данных оказался чуть больше 15 Мб.

    На этом приготовления закончены, теперь перейдем к тому, что происходит непосредственно во время работы программы:

    1. Преобразование цветного изображения в серое.
    2. Выполнение автоконтраста.
    3. Поиск особых точек для трех масштабов кадра (также с коэффициентами 1, 0.75 и 0.5) с помощью алгоритма YAPE и подсчет для них RFD-дескрипторов. Эти алгоритмы частично распараллелены, однако довольно большая часть вычислений осталась последовательной. Кроме того, они пока не оптимизировались под платформу Эльбрус.
    4. Для полученного набора дескрипторов выполняется поиск похожих дескрипторов среди сохраненных в дереве, и происходит определение несколько наиболее похожих кадров. Для различных дескрипторов поиск в дереве распараллелен с помощью tbb. При этом для первых 5 кадров видео мы выбираем 10 ближайших кадров, а затем берем только 5 кадров.
    5. Выбранные кадры проходят дополнительную фильтрацию, чтобы убрать “выбросы”, ведь траектория транспортного средства обычно непрерывна.

    Входные данные: последовательность цветных кадров размера 800х600 пикселей.


    Такая система выдает 3.0 fps на Эльбрус-4С и 7.2 fps на Эльбрус-8С.


    Покажем, как же оно работает:


    Эльбрус-4С



    Эльбрус-8С


    Заключение

    Для удобства основные характеристики Эльбрусов и полученные результаты по нашим программам собраны в таблице:



    Результаты для распознавания паспорта получились довольно скромные, поскольку наше приложение в своем текущем виде не может эффективно задействовать более 4 потоков. Похожая ситуация с детекцией автомобилей и визуальной локацией: алгоритмы имеют нераспараллеленные участки, поэтому не приходится ожидать линейного масштабирования при росте числа ядер. Однако там, где нет ограничений на загрузку приложениями всех ядер процессора, мы наблюдаем рост в 3.2 раза, это близко к теоретическому пределу в 3.6 раз. В среднем разница производительности между поколениями процессоров МЦСТ на нашем наборе задач составляет порядка 2-3 раз, и это очень радует. Только за счёт увеличения частоты и совершенствования архитектуры мы наблюдаем выигрыш более чем в 1.7 раза. МЦСТ быстро нагоняет Intel с ее стратегией в добавлении 5% в год.


    В процессе тестов под полной нагрузкой мы не испытывали проблем с зависаниями и падениями, что говорит о зрелости процессорной архитектуры. Подход VLIW, развиваемый в Эльбрусах-8С, позволяет добиваться работы в реальном времени различных алгоритмов компьютерного зрения, а библиотека EML содержит весьма солидный набор математических функций, которые позволяют экономить время тем, кто не собирается оптимизировать код сам. В заключение мы провели еще один эксперимент, запустив сразу 3 демонстрации (локализацию, поиск машин и поиск лиц) на одном процессоре Эльбрус-8С и получив среднюю загрузку процессора около 80%. Тут уж без комментариев.



    Хотим сказать большое спасибо компании и сотрудникам МЦСТ и ИНЭУМ Брука за возможность попробовать Эльбрус-8С и поздравить их - восьмерка более чем достойный процессор и пожелать им успехов!

  • ocr-технологии
  • Добавить метки

    Загрузка...