Самый мощный суперкомпьютер в мире. Самые мощные суперкомпьютеры мира. Приложение Text Editing

Время прочтения: 2 мин.

До сих пор человечество так и не достигло терриконов Марса, не изобрело эликсир молодости, авто еще не могут взмыть над землей, но есть несколько сфер, в которых мы все таки преуспели. Создание мощных суперкомпьютеров – именно такая сфера. Чтобы оценить мощность компьютера, нужно определить какой ключевой параметр отвечает за эту характеристику. Этим параметром является флопс — величина, которая показывает, сколько операций может выполнить ПК за одну секунду. Именно, на основании этой величины, наш журнал Большой Рейтинг и расставил самые мощные компьютеры в мире на 2017 год.

Мощность суперкомпьютера — 8,1 Пфлоп/сек

Этот компьютер хранит данные, которые отвечают за безопасность военной структуры Соединенных Штатов, также он отвечает за состояние готовности ядерной атаки, в случае необходимости. Два года назад эта машина была одной из самых мощных и дорогих в мире, но на сегодня Trinity вытеснили более новые аппараты. Система, на которой работает этот суперкомпьютер — Cray XC40, благодаря ей, аппарат и может «выдавать» такое количество операций в секунду.

Mira

Мощность суперкомпьютера – 8,6 Пфлоп/сек

Компания Cray выпустила еще один суперкомпьютер – Mira. Министерство энергетики США заказало выпуск этой машины, для координации своей работы. Сфера, в которой работает Mira – промышленность и развитие научно-исследовательского потенциала. В секунду этот суперкомпьютер может рассчитать 8,6 петафлопс.

Мощность суперкомпьютера – 10,5 Пфлоп/сек

Название этого аппарата сразу описывает мощность, японское слово «кей» (К) означает десять квадриллионов. Эта цифра почти точно описывать его производительную мощность – 10,5 петафлопс. «Фишкой» этого суперкомпьютера является его система охлаждения. Используют водное охлаждение, которое снижает потребление энергетических запасов и снижает показатели скорости компоновки.

Мощность суперкомпьютера – 13,6 Пфлоп/сек

Fujitsu – компания из страны Восходящего Солнца, не остановилась в работе, выпустив суперкомпьютер K Computer, они сразу же принялись за новый проект. Этим проектом стал суперкомпьютер Oakforest-Pacs, который относят к машинам нового поколения (поколение Knights landing). Его разработку заказали Токийский и Цукубский университеты. По первоначальному плану, память аппарата должна была быть 900 Тбайт, а производительность Oakforest-Pacs составляла бы 25 квадраллионов операций в секунду. Но при нехватке финансирования, не было доработано множество аспектов, поэтому мощность суперкомпьютера составила 13,6 петафлопс в секунду.

Cori

Мощность суперкомпьютера – 14 Пфлоп/сек

Еще в прошлом году Cori был на шестой строчке в списке самых мощных суперкомпьютеров в мире, но при сумасшедшей скорости развития технологий, он уступил одну позицию. Этот суперкомпьютер находится в Соединенных Штатах, в Национальной лаборатории имени Лоуренса и Беркли. Ученые из Швейцарии, с помощью Cori смогли разработать 45-кубитную квантовую вычислительную машину. Производственная мощность этого суперкомпьютера – 14 петафлопс в секунду.

Мощность суперкомпьютера – 17,2 Пфлоп/сек

Ученые со всего мира долго время сходились во мнении, что Sequoia – самый быстрый суперкомпьютер на планете. И это не просто так, ведь он способен произвести арифметические расчеты, на которые бы людям в количестве 6,7 млрд. понадобилось бы 320 лет, за одну секунду. Поистине, поражают размеры машины – она занимает более чем 390 квадратных метра и в ее состав входит 96 стоек. Шестнадцать тысяч триллионов операций или другими словами 17,2 петафлопс – производственная мощность этого суперкомпьютера.

Titan

Мощность суперкомпьютера – 17,6 Пфлоп/сек

Кроме того, что этот суперкомпьютер один из самых быстрых на планете, он еще и очень энергоэффективен. Показатель энергоэффективности составляет 2142,77 мегафлопс на Ватт энергии, необходимой для потребления. Причиной такой низкой энергопотребляемости является ускоритель Nvidia, который обеспечивает до 90% мощности, необходимой для вычислений. Кроме этого, ускоритель Nvidia значительно сократил площадь, которую занимал этот суперкомпьютер, теперь ему нужно всего лишь 404 квадратных метра.

Мощность суперкомпьютера – 19,6 Пфлоп/сек

Первый запуск этого аппарата состоялся в 2013 году, в Швейцарии, в городе Лугано. Сейчас геолокация этого суперкомпьютера – Швейцарский национальный центр суперкомпьютеров. Piz Daint – это сочетание всех лучших характеристик вышеперечисленных машин, у него очень высокий показатель энергоэффективности и он очень быстр в вычислениях. Только одна характеристика оставляет желать лучшего – габариты этого суперкомпьютера, он занимает 28 огромных стоек. Piz Daint способен работать с вычислительной мощностью 19,6 петафлопс в секунду.

Мощность суперкомпьютера – 33,9 Пфлоп/сек

Этот аппарат имеет романтическое название Tianhe, что с китайского, в переводе, значит «Млечный Путь». Tianhe-2 был самым быстрым компьютером в списке 500-ти самых быстрых и мощных суперкомпьютеров. Он может рассчитать 2507 арифметических операций, что в переводе на петафлопсы составит 33,9 Пфлоп/сек. Специализация, в которой используют этот компьютер – строительство, он рассчитывает операции связанные с застройкой и прокладкой дорог. Еще с первого запуска в 2013 году, этот компьютер не теряет свои позиции в списках, что доказывает, что это одна из лучших машин в мире.

Мощность суперкомпьютера – 93 Пфлоп/сек

Sunway TaihuLight – самый быстрый суперкомпьютер в мире, кроме своей огромной скорости вычислений, он славится еще и своими огромными габаритами – он занимает площадь более 1000 квадратных метров. Международная конференция 2016 года, которая проходила в Германии, признала этот суперкомпьютер самым быстрым в мире и он до сих пор не имеет серьезного конкурента в этом плане. Его скорость в три раза превышает показатели Tianhe-2, ближайший к нему суперкомпьютер в этом плане!

Технический прогресс не стоит на месте, он развивается с космической скоростью, влияет на множество аспектов человеческой жизни, имеет множество как позитивных, так и негативных сторон. Для человека сейчас доступной стала техника самых разных типов: компьютеры, роботы и приборы. Но главной целью любой аппаратуры является упрощение жизни человека, техника не должна стать бессмысленным развлечением, которое будет только тратить ваше время.

На Марс люди так и не летают, рак еще не вылечили, от нефтяной зависимости не избавились. И все же существуют области, где человечество достигло невероятного прогресса за последние десятилетия. Вычислительная мощь компьютеров – как раз одна из них.

Два раза в год специалисты из Национальной лаборатории имени Лоуренса в Беркли и Университета Теннесси публикуют Top-500, в котором предлагают список самых производительных суперкомпьютеров мира.

В качестве ключевого критерия в этом рейтинге используется характеристика, которая уже давно считается одной из наиболее объективных в оценке мощности суперкомпьютеров – флопс, или число операций с плавающей точкой в секунду.

Немного забегая вперед, предлагаем вам заранее попробовать на вкус эти цифры: производительность представителей первого десятка топа измеряется десятками квадриллионов флопс. Для сравнения: ЭНИАК, первый компьютер в истории, обладал мощностью в 500 флопс; сейчас средний персональный компьютер имеет мощность в сотни гигафлопс (миллиардов флопс), iPhone 6 обладает производительностью приблизительно в 172 гигафлопса, а игровая приставка PS4 – в 1,84 терафлопса (триллиона флопс).

Вооружившись последним «Топ-500» от ноября 2014 года, редакция Naked Science решила разобраться, что из себя представляют 10 самых мощных суперкомпьютеров мира, и для решения каких задач требуется столь грандиозная вычислительная мощь.

10. Cray CS-Storm

Местоположение: США
Производительность: 3,57 петафлопс
Теоретический максимум производительности: 6,13 петафлопс
Мощность: 1,4 МВт

Как и практически все современные суперкомпьютеры, включая каждый из представленных в данной статье, CS-Storm состоит из множества процессоров, объединенных в единую вычислительную сеть по принципу массово-параллельной архитектуры. В реальности эта система представляет собой множество стоек («шкафов») с электроникой (узлами, состоящими из многоядерных процессоров), которые образуют целые коридоры.

Cray CS-Storm – это целая серия суперкомпьютерных кластеров, однако один из них все же выделяется на фоне остальных. В частности, это загадочный CS-Storm, который использует правительство США для неизвестных целей и в неизвестном месте.

Известно лишь то, что американские чиновники купили крайне эффективный с точки зрения потребления энергии (2386 мегафлопс на 1 Ватт) CS-Storm с общим количеством ядер почти в 79 тысяч у американской компании Cray.

На сайте производителя, впрочем, сказано, что кластеры CS-Storm подходят для высокопроизводительных вычислений в области кибербезопасности, геопространственной разведки, распознавания образов, обработки сейсмических данных, рендеринга и машинного обучения. Где-то в этом ряду, вероятно, и обосновалось применение правительственного CS-Storm.

CRAY CS-STORM / © Cray

9. Vulcan – Blue Gene/Q

Местоположение: США
Производительность: 4,29 петафлопс
Теоретический максимум производительности: 5,03 петафлопс
Мощность: 1,9 МВт

«Вулкан» разработан американской компанией IBM, относится к семейству Blue Gene и находится в Ливерморской национальной лаборатории имени Э. Лоуренса. Принадлежащий Министерству энергетики США суперкомпьютер состоит из 24 стоек. Функционировать кластер начал в 2013 году.

В отличие уже упомянутого CS-Storm, сфера применения «Вулкана» хорошо известна – это различные научные исследования, в том числе в области энергетики, вроде моделирования природных явлений и анализа большого количества данных.

Различные научные группы и компании могут получить доступ к суперкомпьютеру по заявке, которую нужно отправить в Центр инноваций в области высокопроизводительных вычислений (HPC Innovation Centre), базирующийся в той же Ливерморской национальной лаборатории.

Суперкомпьютер Vulcan / © Laura Schulz and Meg Epperly/LLNL

8. Juqueen – Blue Gene/Q

Местоположение: Германия
Производительность: 5 петафлопс
Теоретический максимум производительности: 5,87 петафлопс
Мощность: 2,3 МВт

С момента запуска в 2012 году Juqueen является вторым по мощности суперкомпьютером в Европе и первым – в Германии. Как и «Вулкан», этот суперкомпьютерный кластер разработан компанией IBM в рамках проекта Blue Gene, причем относится к тому же поколению Q.

Находится суперкомпьютер в одном из крупнейших исследовательских центров Европы в Юлихе. Используется соответственно – для высокопроизводительных вычислений в различных научных исследованиях.

Суперкомпьютер Juqueen / © Jülich Supercomputing Centre (JSC)

7. Stampede – PowerEdge C8220

Местоположение: США
Производительность: 5,16 петафлопс
Теоретический максимум производительности: 8,52 петафлопс
Мощность: 4,5 МВт

Находящийся в Техасе Stampede является единственным в первой десятке Top-500 кластером, который был разработан американской компанией Dell. Суперкомпьютер состоит из 160 стоек.

Этот суперкомпьютер является мощнейшим в мире среди тех, которые применяются исключительно в исследовательских целях. Доступ к мощностям Stampede открыт научным группам. Используется кластер в самом широком спектре научных областей – от точнейшей томографии человеческого мозга и предсказания землетрясений до выявления паттернов в музыке и языковых конструкциях.

Суперкомпьютер Stampede / © Texas Advanced Computing Center

6. Piz Daint – Cray XC30

Местоположение: Швейцария
Производительность: 6,27 петафлопс
Теоретический максимум производительности: 7,78 петафлопс
Мощность: 2,3 МВт

Швейцарский национальный суперкомпьютерный центр (CSCS) может похвастаться мощнейшим суперкомпьютером в Европе. Piz Daint, названный так в честь альпийской горы, был разработан компанией Cray и принадлежит к семейству XC30, в рамках которого является наиболее производительным.

Piz Daint применяется для различных исследовательских целей вроде компьютерного моделирования в области физики высоких энергий.

Суперкомпьютер Piz Daint / © blogs.nvidia.com

5. Mira – Blue Gene/Q

Местоположение: США
Производительность: 8,56 петафлопс
Теоретический максимум производительности: 10,06 петафлопс
Мощность: 3,9 МВт

Суперкомпьютер «Мира» был разработан компанией IBM в рамках проекта Blue Gene в 2012 году. Отделение высокопроизводительных вычислений Аргонской национальной лаборатории, в котором располагается кластер, было создано при помощи государственного финансирования. Считается, что рост интереса к суперкомпьютерным технологиям со стороны Вашингтона в конце 2000-х и начале 2010-х годов объясняется соперничеством в этой области с Китаем.

Расположенный на 48 стойках Mira используется в научных целях. К примеру, суперкомпьютер применяется для климатического и сейсмического моделирования, что позволяет получать более точные данные по предсказанию землетрясений и изменений климата.

Суперкомпьютер Mira / © Flickr

4. K Computer

Местоположение: Япония
Производительность: 10,51 петафлопс
Теоретический максимум производительности: 11,28 петафлопс
Мощность: 12,6 МВт

Разработанный компанией Fujitsu и расположенный в Институте физико-химических исследований в городе Кобе K Сomputer является единственным японским суперкомпьютером, присутствующим в первой десятке Top-500.

В свое время (июнь 2011) этот кластер занял в рейтинге первую позицию, на один год став самым производительным компьютером в мире. А в ноябре 2011 года K Computer стал первым в истории, которому удалось достичь мощности выше 10 петафлопс.

Суперкомпьютер используется в ряде исследовательских задач. К примеру, для прогнозирования природных бедствий (что актуально для Японии из-за повышенной сейсмической активности региона и высокой уязвимости страны в случае цунами) и компьютерного моделирования в области медицины.

Суперкомпьютер K / © Fujitsu

3. Sequoia – Blue Gene/Q

Местоположение: США
Производительность: 17,17 петафлопс
Теоретический максимум производительности: 20,13 петафлопс
Мощность: 7,8 МВт

Мощнейший из четверки суперкомпьютеров семейства Blue Gene/Q, попавших в первую десятку рейтинга, расположен в США в Ливерморской национальной лаборатории. IBM разработали Sequoia для Национальной администрации ядерной безопасности (NNSA), которой требовался высокопроизводительный компьютер для вполне конкретной цели – моделирования ядерных взрывов.

Стоит упомянуть, что реальные ядерные испытания запрещены еще с 1963 года, и компьютерная симуляция является одним из наиболее приемлемых вариантов для продолжения исследований в этой области.

Однако мощности суперкомпьютера использовались для решения и других, куда более благородных задач. К примеру, кластеру удалось поставить рекорды производительности в космологическом моделировании, а также при создании электрофизиологической модели человеческого сердца.

Суперкомпьютер Sequoia / © Bob Hirschfeld/LLNL

2. Titan – Cray XK7

Местоположение: США
Производительность: 17,59 петафлопс
Теоретический максимум производительности: 27,11 петафлопс
Мощность: 8,2 МВт

Наиболее производительный из когда-либо созданных на Западе суперкомпьютеров, а также самый мощный компьютерный кластер под маркой компании Cray находится в США в Национальной лаборатории Оук-Ридж. Несмотря на то, что находящийся в распоряжении американского Министерства энергетики суперкомпьютер официально доступен для любых научных исследований, в октябре 2012 года, когда Titan был запущен, количество заявок превысило всякие пределы.

Из-за этого в Оукриджской лаборатории была созвана специальная комиссия, которая из 50 заявок отобрала лишь 6 наиболее «передовых» проектов. Среди них, к примеру, моделирование поведения нейтронов в самом сердце ядерного реактора, а также прогнозирование глобальных климатических изменений на ближайшие 1-5 лет.

Несмотря на свою вычислительную мощь и впечатляющие габариты (404 квадратных метра), Titan недолго продержался на пьедестале. Уже через полгода после триумфа в ноябре 2012 года гордость американцев в области высокопроизводительных вычислений неожиданно потеснил выходец с Востока, беспрецедентно обогнав предыдущих лидеров рейтинга.

Суперкомпьютер Titan / © olcf.ornl.gov

1. Tianhe-2 / Млечный путь-2

Местоположение: Китай
Производительность: 33,86 петафлопс
Теоретический максимум производительности: 54,9 петафлопс
Мощность: 17,6 МВт

С момента своего первого запуска «Тяньхэ-2», или «Млечный-путь-2», вот уже около двух лет является лидером Top-500. Этот монстр почти в два раза превосходит по производительности №2 в рейтинге – суперкомпьютер TITAN.

Разработанный Оборонным научно-техническим университетом Народно-освободительной армии КНР и компанией Inspur «Тяньхэ-2» состоит из 16 тысяч узлов с общим количеством ядер в 3,12 миллиона. Оперативная память всей это колоссальной конструкции, занимающей 720 квадратных метров, составляет 1,4 петабайт, а запоминающего устройства – 12,4 петабайт.

«Млечный путь-2» был сконструирован по инициативе китайского правительства, поэтому нет ничего удивительного в том, что его беспрецедентная мощь служит, судя по всему, нуждам государства. Официально было заявлено, что суперкомпьютер занимается различными моделированиями, анализом огромного количества данных, а также обеспечением государственной безопасности Китая.

Учитывая секретность, свойственную военным проектам КНР, остается лишь догадываться, какое именно применение время от времени получает «Млечный путь-2» в руках китайской армии.

Суперкомпьютер Tianhe-2 / © Popsci.com

Ранее занимавший первое место суперкомпьютер K Computer отодвинут на третье место. Его производительность составляет 11,28 Пфлопс (см. Рисунок 1). Напомним, что флопс (FLoating-point Operations Per Second, FLOPS) - это единица измерения производительности компьютеров, которая показывает, сколько операций с плавающей запятой в секунду способна выполнить данная вычислительная система.

K Computer является совместной разработкой Института физико-химических исследований Рикагаку Кенкийо (RIKEN) и Fujitsu. Он создавался в рамках инициативы High-Performance Computing Infrastructure (Инфраструктура высокопроизводительных компьютерных вычислений), возглавляемой японским министерством образования, культуры, спорта, науки и технологий (MEXT). Суперкомпьютер установлен на территории Института передовых вычислительных наук в японском городе Кобе.

В основу суперкомпьютера положена архитектура распределенной памяти. Система состоит из более чем 80 000 вычислительных узлов и размещается в 864 стойках, каждая из которых вмещает 96 вычислительных узлов и 6 узлов ввода/вывода. Узлы, содержащие по одному процессору и по 16 Гбайт оперативной памяти, соединяются между собой в соответствии с топологией «шестимерная петля / тор». В общей сложности в системе используется 88 128 восьмиядерных процессоров SPARC64 VIIIfx (705 024 ядра), произведенных Fujitsu по технологии 45 нм.

Этот суперкомпьютер общего назначения обеспечивает высокий уровень производительности и поддержку широкого ряда приложений. Система используется для проведения исследований в области климатических изменений, предотвращения стихийных бедствий и медицины.

Уникальная система водяного охлаждения позволяет снизить вероятность отказа оборудования и сократить общее энергопотребление. Экономия энергии достигается за счет применения высокоэффективного оборудования, системы когенерации тепло- и электроэнергии и массива солнечных батарей. Кроме того, механизм повторного использования отработанной воды из охладителя позволяет снизить негативное влияние на окружающую среду.

Здание, в котором расположен K Computer, является сейсмоустойчивым и способно выдерживать землетрясения магнитудой 6 и более баллов по японской шкале (0–7). Для более эффективного размещения стоек с оборудованием и кабелей третий этаж размером 50 × 60 м полностью освобожден от несущих колонн. Современные технологии строительства позволили обеспечить допустимый уровень нагрузки (до 1 т/м 2) для установки стоек, вес которых может достигать 1,5 т.

СУПЕРКОМПЬЮТЕР SEQUOIA

Суперкомпьютер Sequoia, установленный в Ливерморской национальной лаборатории им. Лоуренса, обладает производительностью 16,32 Пфлопс и занимает вторую строчку рейтинга (см. Рисунок 2).

Этот петафлопсный суперкомпьютер, разработанный компанией IBM на базе Blue Gene/Q, создан для Национальной администрации по ядерной безопасности США (NNSA) в рамках реализации программы Advanced Simulation and Computing (Высокотехнологичное моделирование и компьютерные вычисления).

Система состоит из 96 стоек и 98 304 вычислительных узлов (1024 узла на стойку). Каждый узел включает в себя 16-ядерный процессор PowerPC A2 и 16 Гбайт оперативной памяти DDR3. В целом используется 1 572 864 процессорных ядра и 1,6 Пбайт памяти. Узлы соединяются между собой в соответствии с топологией «пятимерный тор». Занимаемая системой площадь равна 280 м2. Общее энергопотребление составляет 7,9 МВт.

На суперкомпьютере Sequoia впервые в мире были проведены научные вычисления, для которых требовалась вычислительная мощность более 10 Пфлопс. Так, системе космологического моделирования HACC потребовалось около 14 Пфлопс при запуске в режиме 3,6 трлн частиц, а во время запуска кода проекта Cardiod для моделирования электрофизиологии человеческого сердца производительность достигла почти 12 Пфлопс.

СУПЕРКОМПЬЮТЕР TITAN

Самым быстрым в мире суперкомпьютером был признан суперкомпьютер Titan, установленный в Окриджской национальной лаборатории (ORNL) в США. В тестовых испытаниях Linpack его производительность составила 17,59 Пфлопс.

В Titan реализована гибридная архитектура CPU-GPU (см. Рисунок 3). Система состоит из 18 688 узлов, каждый из которых оснащен 16-ядерным процессором AMD Opteron и графическим ускорителем Nvidia Tesla K20X. В общей сложности используется 560 640 процессоров. Titan представляет собой обновление ранее эксплуатировавшегося в ORNL суперкомпьютера Jaguar и занимает те же серверные шкафы (общей площадью 404 м 2).

Возможность использования уже существующих систем питания и охлаждения позволила сэкономить в ходе строительства около 20 млн долларов. Энергопотребление суперкомпьютера составляет 8,2 МВт, что на 1,2 МВт больше показателей Jaguar, при этом его производительность при выполнении операций с плавающей точкой выше почти в 10 раз.

Titan в первую очередь будет использоваться для проведения исследований в области науки о материалах и ядерной энергетики, а также исследований, касающихся повышения эффективности работы двигателей внутреннего сгорания. Кроме того, с его помощью будут выполняться моделирование климатических изменений и анализ потенциальных стратегий по устранению связанных с ними негативных последствий.

САМЫЙ «ЗЕЛЕНЫЙ» СУПЕРКОМПЬЮТЕР

Помимо рейтинга Top500, нацеленного на определение наиболее высокопроизводительной системы, существует рейтинг Green500, где отмечены самые «зеленые» суперкомпьютеры. Здесь за основу принят показатель энергоэффективности (Мфлопс/Вт). На данный момент (последний выпуск рейтинга - ноябрь 2012 года) лидером Green500 является суперкомпьютер Beacon (253-е место в Top500). Показатель его энергоэффективности составляет 2499 Мфлопс/Вт.

Beacon работает на базе сопроцессоров Intel Xeon Phi 5110P и процессоров Intel Xeon E5-2670, поэтому пиковая производительность может достигать 112 200 Гфлопс при общем энергопотреблении в 44,9 кВт. Сопроцессоры Xeon Phi 5110P обеспечивают высокую производительность при низком энергопотреблении. Каждый сопроцессор обладает мощностью в 1 Тфлопс (при выполнении операций с двойной точностью) и поддерживает до 8 Гбайт памяти класса GDDR5 с пропускной способностью в 320 Гбит/с.

Пассивная система охлаждения Xeon Phi 5110P рассчитана на TDP 225 Вт, что является идеальным показателем для серверов высокой плотности.

СУПЕРКОМПЬЮТЕР EURORA

Однако в феврале 2013 года появились сообщения о том, что суперкомпьютер Eurora, расположенный в городе Болонья (Италия), по энергоэффективности превзошел Beacon (3150 Мфлопс/ватт против 2499 Мфлопс/Вт).

Eurora построен компанией Eurotech и состоит из 64 узлов, каждый из которых включает в себя два процессора Intel Xeon E5-2687W, два ускорителя Nvidia Tesla K20 GPU и другое оборудование. Габариты подобного узла не превышают габаритов ноутбука, однако их производительность выше в 30 раз, а энергопотребление ниже в 15 раз.

Высокая эффективность энергопотребления в Eurora достигнута путем использования нескольких технологий. Наибольший вклад вносит водяное охлаждение. Так, каждый узел суперкомпьютера представляет собой своеобразный бутерброд: центральное оборудование снизу, водяной теплообменник в середине и еще один блок электроники сверху (см. Рисунок 4).

Столь высокие результаты обеспечиваются благодаря применению материалов с хорошей теплопроводностью, а также разветвленной сетью охлаждающих каналов. При установке нового вычислительного модуля его каналы совмещаются с каналами системы охлаждения, что позволяет менять конфигурацию суперкомпьютера в зависимости от конкретных потребностей. По заверению производителей, риск протечек исключен.

Электропитание элементов суперкомпьютера Eurora осуществляется посредством 48-вольтовых источников постоянного тока, внедрение которых позволило сократить число преобразований энергии. Наконец, отводимая от вычислительного оборудования теплая вода может использоваться и в других целях.

ЗАКЛЮЧЕНИЕ

Отрасль суперкомпьютеров активно развивается и ставит все новые и новые рекорды производительности и энергоэффективности. Следует отметить, что именно в этой отрасли, как нигде более, сегодня широко применяются технологии жидкостного охлаждения и 3D-моделирования, так как перед специалистами стоит задача скомпоновать сверхмощную вычислительную систему, которая была бы способна функционировать в ограниченном объеме при минимальных потерях энергии.

Юрий Хомутский - главный инженер проектов компании «Ай-Теко». С ним можно связаться по адресу: [email protected] . В статье использованы материалы интернет-портала о центрах обработки данных «www.AboutDC.ru - Решения для ЦОД».

Доктор физико-математических наук В. ВОЕВОДИН

У большинства людей слово "компьютер" ассоциируется в первую очередь с персоналкой, которую можно увидеть сегодня не только в любом офисе, но и во многих квартирах. В самом деле, мы живем в эпоху, когда персональный компьютер вошел буквально в каждый дом. Однако не стоит забывать, что ПК - это лишь часть компьютерного мира, где существуют гораздо более мощные и сложные вычислительные системы, недоступные рядовому пользователю. Многие, наверно, слышали о компьютере по имени Deep Blue, который в 1997 году обыграл самого Гарри Каспарова. Интуитивно понятно, что такая машина не могла быть простой персоналкой. Другой пример - отечественный компьютер МВС-1000 производительностью 200 миллиардов операций в секунду, недавно установленный в Межведомственном суперкомпьютерном центре в Москве. Кроме того, в прессе время от времени появляются сообщения о нелегальных поставках в Россию вычислительной техники, попадающей под эмбарго американского правительства.

Открытие межведомственного суперкомпьютерного центра в Президиуме Российской академии наук. На переднем плане 16-процессорный суперкомпьютер Hewlett-Packard V2250.

ASCI RED, детище программы Accelerated Strategic Computing Initiative, - самый мощный на сегодняшний день компьютер.

CRAY T3E - массивно-параллельный компьютер фирмы Тега Computer Company.

Наука и жизнь // Иллюстрации

Подобные компьютеры для многих так и остаются тайной за семью печатями, окруженной ореолом ассоциаций с чем-то очень большим: огромные размеры, сверхсложные задачи, крупные фирмы и компании, невероятные скорости работы и т.д. Одним словом, супер-ЭВМ, что-то далекое и недоступное. Между тем, если вам хотя бы раз приходилось пользоваться услугами серьезных поисковых систем в Интернете (см. "Наука и жизнь" № 11, 1999 г.), вы, сами того не подозревая, имели дело с одним из приложений суперкомпьютерных технологий.

Доктор физико-математических наук В. ВОЕВОДИН, заместитель директора Научно-исследовательского вычислительного центра МГУ им. М. В. Ломоносова.

ЧТО ТАКОЕ СУПЕРКОМПЬЮТЕР

Считается, что супер-ЭВМ - это компьютеры с максимальной производительностью. Однако быстрое развитие компьютерной индустрии делает это понятие весьма и весьма относительным: то, что десять лет назад можно было назвать суперкомпьютером, сегодня под это определение уже не подпадает. Производительность первых супер-ЭВМ начала 70-х годов была сравнима с производительностью современных ПК на базе традиционных процессоров Pentium. По сегодняшним меркам ни те, ни другие к суперкомпьютерам, конечно же, не относятся.

В любом компьютере все основные параметры взаимосвязаны. Трудно себе представить универсальный компьютер, имеющий высокое быстродействие и мизерную оперативную память либо огромную оперативную память и небольшой объем дисков. Отсюда простой вывод: супер-ЭВМ - это компьютер, имеющий не только максимальную производительность, но и максимальный объем оперативной и дисковой памяти в совокупности со специализированным программным обеспечением, с помощью которого этим монстром можно эффективно пользоваться.

Суперкомпьютерам не раз пытались давать универсальные определения - иногда они получались серьезными, иногда ироничными. Например, как-то предлагалось считать суперкомпьютером машину, вес которой превышает одну тонну. Несколько лет назад был предложен и такой вариант: суперкомпьютер - это устройство, сводящее проблему вычислений к проблеме ввода/вывода. В самом деле, задачи, которые раньше вычислялись очень долго, на супер-ЭВМ выполняются мгновенно, и почти все время теперь уходит на более медленные процедуры ввода и вывода данных, производящиеся, как правило, с прежней скоростью.

Так что же такое современный суперкомпьютер? Самая мощная ЭВМ на сегодняшний день - это система Intel ASCI RED, построенная по заказу Министерства энергетики США. Чтобы представить себе возможности этого суперкомпьютера, достаточно сказать, что он объединяет в себе 9632 (!) процессора Pentium Pro, имеет более 600 Гбайт оперативной памяти и общую производительность в 3200 миллиардов операций в секунду. Человеку потребовалось бы 100000 лет, чтобы даже с калькулятором выполнить все те операции, которые этот компьютер делает всего за 1 секунду!

Создать подобную вычислительную систему - все равно, что построить целый завод со своими системами охлаждения, бесперебойного питания и т.д. Понятно, что любой суперкомпьютер, даже в более умеренной конфигурации, должен стоить не один миллион долларов США: ради интереса прикиньте, сколько стоят, скажем, лишь 600 Гбайт оперативной памяти? Возникает естественный вопрос: какие задачи настолько важны, что требуются компьютеры стоимостью в несколько миллионов долларов? Или еще один: какие задачи настолько сложны, что хорошего Pentium III для их решения недостаточно?

НУЖНЫ ЛИ НАМ СУПЕРКОМПЬЮТЕРЫ?

Оказывается, существует целый ряд жизненно важных проблем, которые просто невозможно решать без использования суперкомпьютерных технологий.

Возьмем, к примеру, США, по территории которых два раза в год проходят разрушительные торнадо. Они сметают на своем пути города, поднимают в воздух автомобили и автобусы, выводят реки из берегов, заливая тем самым гигантские территории. Борьба с торнадо - существенная часть американского бюджета. Только штат Флорида, который находится недалеко от тех мест, где эти смерчи рождаются, за последние годы потратил более 50 миллиардов долларов на экстренные меры по спасению людей. Правительство не жалеет денег на внедрение технологий, которые позволили бы предсказывать появление торнадо и определять, куда он направится.

Как рассчитать торнадо? Очевидно, что для этого надо решить задачу о локальном изменении погоды, то есть задачу о движении масс воздуха и распределении тепла в неком регионе. Принципиально это несложно, однако на практике возникают две проблемы. Проблема первая: чтобы заметить появление смерча, надо проводить расчет на характерных для его образования размерах, то есть на расстояниях порядка двух километров. Вторая трудность связана с правильным заданием начальных и граничных условий. Дело в том, что температура на границах интересующего вас региона зависит от того, что делается в соседних регионах. Рассуждая дальше, легко убедиться, что мы не можем решить задачу о смерче, не имея данных о климате на всей Земле. Климат на планете рассчитать можно, что и делается каждый день во всех странах для составления среднесрочных прогнозов погоды. Однако имеющиеся ресурсы позволяют вести расчеты лишь с очень большим шагом - десятки и сотни километров. Ясно, что к предсказанию смерчей такой прогноз не имеет никакого отношения.

Необходимо совместить две, казалось бы, плохо совместимые задачи: глобальный расчет, где шаг очень большой, и локальный, где шаг очень маленький. Сделать это можно, но лишь собрав в кулаке действительно фантастические вычислительные ресурсы. Дополнительная трудность состоит еще и в том, что вычисления не должны продолжаться более 4 часов, так как за 5 часов картина погоды смазывается совершенно, и все, что вы считаете, уже не имеет никакого отношения к реальности. Нужно не только обработать гигантский объем данных, но и сделать это достаточно быстро. Такое под силу лишь суперкомпьютерам.

Предсказание погоды - далеко не единственный пример использования суперкомпьютеров. Сегодня без них не обойтись в сейсморазведке, нефте- и газодобывающей промышленности, автомобилестроении, проектировании электронных устройств, фармакологии, синтезе новых материалов и многих других отраслях.

Так, по данным компании Ford, для выполнения crash-тестов, при которых реальные автомобили разбиваются о бетонную стену с одновременным замером необходимых параметров, со съемкой и последующей обработкой результатов, ей понадобилось бы от 10 до 150 прототипов для каждой новой модели. При этом общие затраты составили бы от 4 до 60 миллионов долларов. Использование суперкомпьютеров позволило сократить число прототипов на одну треть.

Известной фирме DuPont суперкомпьютеры помогли синтезировать материал, заменяющий хлорофлюорокарбон. Нужно было найти материал, имеющий те же положительные качества: невоспламеняемость, стойкость к коррозии и низкую токсичность, но без вредного воздействия на озоновый слой Земли. За одну неделю были проведены необходимые расчеты на суперкомпьютере с общими затратами около 5 тысяч долларов. По оценкам специалистов DuPont, использование традиционных экспериментальных методов исследований потребовало бы 50 тысяч долларов и около трех месяцев работы - и это без учета времени, необходимого на синтез и очистку требуемого количества вещества.

ПОЧЕМУ СУПЕРКОМПЬЮТЕРЫ СЧИТАЮТ ТАК БЫСТРО?

Итак, мы видим, что без суперкомпьютеров сегодня действительно не обойтись. Осталось прояснить еще один вопрос: почему они считают так быстро? Это может быть связано, во-первых, с развитием элементной базы и, во-вторых, с использованием новых решений в архитектуре компьютеров.

Попробуем разобраться, какой из этих факторов оказывается решающим для достижения рекордной производительности. Обратимся к известным историческим фактам. На одном из первых компьютеров мира EDSAC, появившемся в 1949 году в Кембридже и имевшем время такта 2 микросекунды (2·10 -6 секунды), можно было выполнить 2n арифметических операций за 18n миллисекунд, то есть в среднем 100 арифметических операций в секунду. Сравним с одним вычислительным узлом современного суперкомпьютера Hewlett-Packard V2600: время такта приблизительно 1,8 наносекунды (1,8·10 -9 секунды), а пиковая производительность - около 77 миллиардов арифметических операций в секунду.

Что же получается? За полвека производительность компьютеров выросла более чем в семьсот миллионов раз. При этом выигрыш в быстродействии, связанный с уменьшением времени такта с 2 микросекунд до 1,8 наносекунды, составляет лишь около 1000 раз. Откуда же взялось остальное? Ответ очевиден - за счет использования новых решений в архитектуре компьютеров. Основное место среди них занимает принцип параллельной обработки данных, воплощающий идею одновременного (параллельного) выполнения нескольких действий.

Различают два способа параллельной обработки: собственно параллельную и конвейерную. Оба способа интуитивно абсолютно понятны, поэтому сделаем лишь небольшие пояснения.

Параллельная обработка

Предположим для простоты, что некое устройство выполняет одну операцию за один такт. В этом случае тысячу операций такое устройство выполнит за тысячу тактов. Если имеется пять таких же независимых устройств, способных работать одновременно, то ту же тысячу операций система из пяти устройств может выполнить уже не за тысячу, а за двести тактов. Аналогично система из N устройств ту же работу выполнит за 1000/N тактов. Подобные примеры можно найти и в жизни: если один солдат выкопает траншею за 10 часов, то рота солдат из пятидесяти человек с такими же способностями, работая одновременно, справится с той же работой за 12 минут- принцип параллельности в действии!

Кстати, пионером в параллельной обработке потоков данных был академик А. А. Самарский, выполнявший в начале 50-х годов расчеты, необходимые для моделирования ядерных взрывов. Самарский решил эту задачу методом сеток, посадив несколько десятков барышень с арифмометрами за столы (узлы сетки). Барышни передавали данные одна другой просто на словах и откладывали необходимые цифры на арифмометрах. Таким образом, в частности, была рассчитана эволюция взрывной волны. Работы было много, барышни уставали, а Александр Андреевич ходил между ними и подбадривал. Так создали, можно сказать, первую параллельную систему. Хотя расчеты водородной бомбы провели мастерски, точность их оказалась очень низкой, потому что узлов в используемой сетке было мало, а время счета получалось слишком большим.

Конвейерная обработка

Что необходимо для сложения двух вещественных чисел, представленных в форме с плавающей запятой? Целое множество мелких операций, таких, как сравнение порядков, выравнивание порядков, сложение мантисс, нормализация и т.п. Процессоры первых компьютеров выполняли все эти "микрооперации" для каждой пары слагаемых последовательно, одну за другой, до тех пор, пока не доходили до окончательного результата, и лишь после этого переходили к обработке следующей пары слагаемых.

Идея конвейерной обработки заключается в расчленении операции на отдельные этапы, или, как это принято называть, ступени конвейера. Каждая ступень, выполнив свою работу, передает результат следующей ступени, одновременно принимая новую порцию входных данных. Получается очевидный выигрыш в скорости обработки. В самом деле, предположим, что в операции сложения можно выделить пять микроопераций, каждая из которых выполняется за один такт работы компьютера. Если есть одно неделимое последовательное устройство сложения, то 100 пар аргументов оно обработает за 500 тактов. Если теперь каждую микрооперацию преобразовать в отдельную ступень конвейерного устройства, то на пятом такте на разной стадии обработки будут находиться первые пять пар аргументов, и далее конвейерное устройство будет выдавать результат очередного сложения каждый такт. Очевидно, что весь набор из ста пар слагаемых будет обработан за 104 единицы времени - ускорение по сравнению с последовательным устройством почти в пять раз (по числу ступеней конвейера).

Идеи параллельной обработки появились очень давно. Изначально они внедрялись в самых передовых, а потому единичных компьютерах своего времени. Затем после должной отработки технологии и удешевления производства они спускались в компьютеры среднего класса, и наконец сегодня все это в полном объеме воплощается в рабочих станциях и персональных компьютерах. Все современные микропроцессоры, будь то Pentium III или РА-8600, Е2К или Power2 SuperChip, используют тот или иной вид параллельной обработки.

Для того чтобы лишний раз убедиться, что все новое - это хорошо забытое старое, достаточно лишь нескольких примеров. Уже в 1961 году создается компьютер IBM STRETCH, имеющий две принципиально важные особенности: опережающий просмотр вперед для выборки команд (при котором одновременно с текущей считываются команды, выполняемые позднее) и расслоение памяти на два банка - реализация параллелизма при работе с памятью. В 1963 году в Манчестерском университете разработан компьютер ATLAS, использующий конвейерный принцип выполнения команд. Выполнение команд разбито на четыре стадии: выборка команды, вычисление адреса операнда, выборка операнда и выполнение операции. Это позволило уменьшить время выполнения команд в среднем с 6 до 1,6 микросекунды. В1969 году Control Data Corporation выпускает компьютер CDC-7600 с восемью независимыми конвейерными функциональными устройствами.

СОВРЕМЕННЫЕ СУПЕРКОМПЬЮТЕРЫ

А что же сейчас используют в мире? По каким направлениям идет развитие высокопроизводительной вычислительной техники? Таких направлений четыре.

Векторно-конвейерные компьютеры

Две главные особенности таких машин: наличие конвейерных функциональных устройств и набора векторных команд. В отличие от обычных команд векторные оперируют целыми массивами независимых данных, то есть команда вида А=В+С может означать сложение двух массивов, а не двух чисел. Характерный представитель данного направления - семейство векторно-конвейерных компьютеров CRAY, куда входят, например, CRAY EL, CRAY J90, CRAY T90 (в марте этого года американская компания TERA перекупила подразделение CRAY у компании Silicon Graphics, Inc.).

Массивно-параллельные компьютеры с распределенной памятью

Идея построения компьютеров этого класса тривиальна: серийные микропроцессоры соединяются с помощью сетевого оборудования - вот и все. Достоинств у такой архитектуры масса: если нужна высокая производительность, то можно добавить процессоры, а если ограничены финансы или заранее известна требуемая вычислительная мощность, то легко подобрать оптимальную конфигурацию. К этому же классу можно отнести и простые сети компьютеров, которые сегодня все чаще рассматриваются как дешевая альтернатива крайне дорогим суперкомпьютерам. (Правда, написать эффективную параллельную программу для таких сетей довольно сложно, а в некоторых случаях просто невозможно). К массивно-параллельным можно отнести компьютеры Intel Paragon, ASCI RED, IBM SP1, Parsytec, в какой-то степени IBM SP2 и CRAY T3D/T3E.

Параллельные компьютеры с общей памятью

Вся оперативная память в таких компьютерах разделяется несколькими одинаковыми процессорами, обращающимися к общей дисковой памяти. Проблем с обменом данными между процессорами и синхронизацией их работы практически не возникает. Вместе с тем главный недостаток такой архитектуры состоит в том, что по чисто техническим причинам число процессоров, имеющих доступ к общей памяти, нельзя сделать большим. В данное направление суперкомпьютеров входят многие современные SMP-компьютеры (Symmetric Multi Processing), например сервер НР9000 N-class или Sun Ultra Enterprise 5000.

Кластерные компьютеры

Этот класс суперкомпьютеров, строго говоря, нельзя назвать самостоятельным, скорее, он представляет собой комбинации предыдущих трех. Из нескольких процессоров, традиционных или векторно-конвейерных, и общей для них памяти формируется вычислительный узел. Если мощности одного узла недостаточно, создается кластер из нескольких узлов, объединенных высокоскоростными каналами. По такому принципу построены CRAY SV1, HP Exemplar, Sun StarFire, NEC SX-5, последние модели IBM SP2 и другие. В настоящее время именно это направление считается наиболее перспективным.

Два раза в год составляется список пятисот самых мощных вычислительных установок мира (его можно посмотреть в Интернете по адресу http://parallel.ru/top500.html). Согласно последней редакции списка top500, вышедшей в ноябре прошлого года, первое место занимает массивно-параллельный компьютер Intel ASCI Red. На второй позиции стоит компьютер ASCI Blue-Pacific от IBM, объединяющий 5808 процессоров PowerPC 604e/332MHz. Оба эти суперкомпьютера созданы в рамках американской национальной программы Advanced Strategic Computing Initiative, аббревиатура которой и присутствует в названии. Производительность компьютера, стоящего на последнем, 500-м, месте в списке самых мощных, составляет 33,4 миллиарда операций в секунду.

Если мощность существующих компьютеров поражает, то что говорить о планах. В декабре 1999 года корпорация IBM сообщила о новом исследовательском проекте общей стоимостью около 100 миллионов долларов, цель которого - построение суперкомпьютера, в 500 раз превосходящего по производительности самые мощные компьютеры сегодняшнего дня. Компьютер, имеющий условное название Blue Gene, будет иметь производительность порядка 1 PETAFLOPS (10 15 операций в секунду) и использоваться для изучения свойств белковых молекул. Предполагается, что каждый отдельный процессор Blue Gene будет иметь производительность порядка 1 GFLOPS (10 9 операций в секунду). 32 подобных процессора будут помещены на одну микросхему. Компактная плата размером 2x2 фута будет вмещать 64 микросхемы, что по производительности не уступает упоминавшимся ранее суперкомпьютерам ASCI, занимающим площадь 8000 квадратных метров. Более того, 8 таких плат будут помещены в 6-футовую стойку, а вся система будет состоять из 64 стоек с суммарной производительностью 1 PFLOPS. Фантастика!

Вычислительный кластер Московского государственного университета им. М. В. Ломоносова - минимальная стоимость, суперкомпьютерная производительность. В настоящий момент это самая мощная вычислительная система, установленная в вузе России.

СУПЕРКОМПЬЮТЕРЫ В РОССИИ

Идеи построения собственных суперкомпьютерных систем существовали в России всегда. Еще в 1966 году М.А.Карцев выдвинул идею создания многомашинного вычислительного комплекса М-9 производительностью около миллиарда операций в секунду. В то время ни одна из машин мира не работала с такой скоростью. Однако, несмотря на положительную оценку министерства, комплекс М-9 промышленного освоения не получил.

Работы по созданию суперкомпьютерных систем и суперкомпьютерных центров ведутся в России и сейчас. Наиболее известна линия отечественных суперкомпьютеров МВС-1000, создаваемая в кооперации научно-исследовательских институтов Российской академии наук и промышленности. Супер-ЭВМ линии МВС-1000 - это мультипроцессорный массив, объединенный с внешней дисковой памятью, устройствами ввода/вывода информации и управляющим компьютером. Компьютеры МВС-1000 используют микропроцессоры Alpha 21164 (разработка фирмы DEC-Compaq) с производительностью до 1-2 миллиардов операций в секунду и оперативной памятью объемом 0,1-2 Гбайта.

Спектр научных и практических задач, решаемых на таком компьютере, может быть очень велик: расчет трехмерных нестационарных течений вязкосжимаемого газа, расчеты течений с локальными тепловыми неоднородностями в потоке, моделирование структурообразования и динамики молекулярных и биомолекулярных систем, решение задач линейных дифференциальных игр, расчет деформаций твердых тел с учетом процессов разрушения и многие другие. Одна из самых мощных систем линии МВС-1000, установленная в Межведомственном суперкомпьютерном центре, содержит 96 процессоров.

В последнее время в России, также как и во всем мире, активно используется кластерный подход к построению суперкомпьютеров. Покупаются стандартные компьютеры и рабочие станции, которые с помощью стандартных сетевых средств объединяются в параллельную вычислительную систему. По такому пути пошел, и, надо сказать, успешно, Научно-исследовательский вычислительный центр Московского государственного университета им. М.В.Ломоносова, создавший кластер из 12 двухпроцессорных серверов "Эксимер" на базе Intel Pentium III/500MHz (в сумме 24 процессора, более 3 Гбайт оперативной памяти, 66 Гбайт дисковой памяти). Сегодня это крупнейшая вычислительная установка в вузе России, предназначенная для поддержки фундаментальных научных исследований и образования. При минимальной стоимости вычислительный кластер НИВЦ МГУ показывает производительность 5,7 миллиарда операций в секунду при решении системы линейных алгебраических уравнений с плотной матрицей размером 16000x16000! В будущем планируется значительно увеличить мощность кластера как за счет добавления новых процессоров, так и за счет модернизации вычислительных узлов.

ВМЕСТО ЗАКЛЮЧЕНИЯ

К сожалению, чудеса в нашей жизни случаются редко. Гигантская производительность параллельных компьютеров и супер-ЭВМ с лихвой компенсируется сложностью их использования. Да что там использование, иногда даже вопросы, возникающие вокруг суперкомпьютеров, ставят в тупик. Как вы думаете, верно ли утверждение: чем мощнее компьютер, тем быстрее на нем можно решить данную задачу? Ну, конечно же, нет... Простой бытовой пример. Если один землекоп выкопает яму за 1 час, то два землекопа справятся с задачей за 30 мин - в это еще можно поверить. А за сколько времени эту работу сделают 60 землекопов? Неужели за 1 минуту? Конечно же, нет! Начиная с некоторого момента они будут просто мешать друг другу, не ускоряя, а замедляя процесс. Так же и в компьютерах: если задача слишком мала, то мы будем дольше заниматься распределением работы, синхронизацией процессов, сборкой результатов и т. п., чем непосредственно полезной деятельностью.

Но все вопросы, сопровождающие суперкомпьютер, конечно же, решаются. Да, использовать суперкомпьютеры сложнее, чем персоналку: нужны дополнительные знания и технологии, высококвалифицированные специалисты, более сложная информационная инфраструктура. Написать эффективную параллельную программу намного сложнее, чем последовательную, да и вообще создание программного обеспечения для параллельных компьютеров - это центральная проблема суперкомпьютерных вычислений. Но без супер-ЭВМ сегодня не обойтись, и отрадно, что в нашей стране есть понимание необходимости развития этих технологий. Так, в ноябре прошлого года в Президиуме Российской академии наук состоялось открытие межведомственного суперкомпьютерного центра. В процессе становления суперкомпьютерные центры в Дубне, Черноголовке, Институте прикладной математики РАН им. М. В. Келдыша, Институте математического моделирования РАН, Московском государственном университете им. М. В. Ломоносова. Создана и развивается линия отечественных суперкомпьютеров МВС-1000. Активно разворачивает свою деятельность Информационно-аналитический центр по параллельным вычислениям в сети Интернет WWW.PARALLEL.RU, осуществляющий информационную поддержку многих российских проектов. А иначе и нельзя. Параллельные вычисления и параллельные компьютеры - это реальность, и это уже навсегда.

ПОДРОБНОСТИ ДЛЯ ЛЮБОЗНАТЕЛЬНЫХ

ЗАКОН АМДАЛА

Представьте себе ситуацию: у вас есть программа и доступ, скажем, к 256-процессорному суперкомпьютеру. Вы, вероятно, ожидаете, что программа будет выполняться в 256 раз быстрее, чем на одном процессоре? А вот этого, скорее всего, и не произойдет.

Предположим, что в вашей программе доля операций, которые нужно выполнять последовательно, равна f, причем 0 ≤ f ≤ 1 (эта доля определяется не по числу строк кода, а по числу операций в процессе выполнения). Крайние случаи в значениях f соответствуют полностью параллельным (f=0) и полностью последовательным (f=1) программам. Так вот, для того, чтобы оценить, какое ускорение S можно получить на компьютере, состоящем из р процессоров, при данном значении f, воспользуемся законом Амдала:

S ≤ 1/{f+(1- f)/p}.

Если вдуматься как следует, то закон на самом деле страшный. Предположим, что в вашей программе лишь 10% последовательных операций, т.е. f=0,1. В этом случае закон утверждает: сколько бы процессоров вы ни использовали, ускорения работы программы более чем в десять раз никак не получите. Да и то десять - это теоретическая оценка сверху самого лучшего случая, когда никаких других отрицательных факторов нет...

Отсюда первый вывод - прежде, чем переходить на параллельный компьютер (а любой суперкомпьютер именно таков), надо оценить заложенный в программе алгоритм. Если доля последовательных операций в нем велика - на значительное ускорение рассчитывать явно не приходится.

В ряде случаев последовательный характер алгоритма изменить не так сложно. Допустим, что в программе есть следующий фрагмент для вычисления суммы п чисел:

Этот алгоритм строго последовательный, так как на i-той итерации цикла требуется результат (i-1)-вой, и все итерации выполняются одна за другой. В данном случае f=1, и, стало быть, никакого эффекта от использования параллельных компьютеров для выполнения этого алгоритма мы не получим. Вместе с тем выход очевиден. Поскольку в большинстве реальных случаев нет существенной разницы, в каком порядке складывать числа, выберем иную схему сложения. Сначала найдем сумму пар соседних элементов: а(1)+а(2), а(3)+а(4), а(5)+а(6) и т. д. Заметим, что при такой схеме все пары можно складывать одновременно. На следующих шагах будем действовать аналогично, получив вариант параллельного алгоритма.

Казалось бы, в данном случае все проблемы удалось разрешить. Но остается еще множество других трудностей, связанных с разной производительностью процессоров, скоростью передачи данных и т. д. Но это уже тонкости параллельного программирования, с азами которого вы в скором времени сможете познакомиться в интернетовском курсе по адресу

http://parallel.ru/vvv/.

РАСПРЕДЕЛЕНИЕ ПЯТИСОТ САМЫХ МОЩНЫХ КОМПЬЮТЕРОВ МИРА ПО СТРАНАМ, ГДЕ ОНИ РАСПОЛОЖЕНЫ, И ФИРМАМ-ПРОИЗВОДИТЕЛЯМ

2 15 10 10 2 57

	США-Канада	Европа	Япония	Остальные	ВСЕГО
IBM	67	67	2	5	141
SGI/CRAY	92	27	12	2	133
SUN	76	29	4	4	113
Hewlett-Packard	33	10		45
Fujitsu	1	9	1	26
NEC	2	7	2	21
Hitachi		1		11
Остальные	6	2		10
ВСЕГО	277	152	14	500

В последние годы компании по созданию и производству компьютеров работают не покладая рук. В результате количество техники в мире растет в геометрической прогрессии.

Самые мощные компьютеры

Еще недавно назад мир не знал о DirectX10, а графика FarCry или NFS Underground 2 казалась вершиной компьютерных возможностей. Когда-то диск, способный вместить 600 мегабайт информации, казался чудом техники, а сейчас в свободном доступе продаются карты памяти на терабайт.

В области суперкомпьютеров происходит почти то же самое. В 1993 году профессор университета Теннесси Джек Донгарра выдвинул идею создания рейтинга самых мощных компьютеров в мире. С тех пор этот список, именуемый TOP500, обновляется дважды в год: в июне и в ноябре.

Время идет, и лидеры рейтинга суперкомпьютеров начала 90-х уже безбожно устарели даже по меркам рядовых пользователей ПК. Так, первым в 1993 году был CM-5/1024, собранный компанией Thinking Machines: 1024 процессора с тактовой частотой 32МГц, вычислительная скорость 59,7 гигафлопс – чуть быстрее обыкновенного 8-ядерного ПК под вашим столом. А какой компьютер самый лучший сегодня?

Sunway TaihuLight

Еще пять лет назад пальму первенства по мощности стабильно держали супер-ЭВМ производства США. В 2013 году лидерство перехватили китайские ученые и, судя по всему, не собираются его отдавать.

В настоящий момент самым сильным компьютером в мире считается Sunway TaihuLight (в переводе – «Божественная сила света озера Тайху»), грандиозная машина со скоростью вычислений 93 петафлопс (максимальная скорость – 125,43 петафлопс). Это в 2,5 раза мощнее предыдущего рекордсмена – суперкомпьютера Тяньхэ-2, который считался самым мощным до июня 2016 года.

В «Санвей Тайхулайт» встроено 10,5 миллионов ядер (40 960 процессора, в каждом из которых по 256 вычислительных и 4 управляющих ядра).

Так выглядит самый мощный компьютер 2016 года

Все оборудование разработано и произведено в Китае, тогда как процессоры прошлого мощнейшего компьютера были произведены американской компанией Intel. Стоимость Sunway TaihuLight оценивают в $270 миллионов. Находится суперкомпьютер в Национальном суперкомпьютерном центре округа Уси.

Рекордсмены прошлых лет

До июня 2016 года (а список TOP500 обновляется каждый июнь и ноябрь) самым мощным и быстрым компьютером являлась супермашина Tianhe-2 (в переводе с китайского «Млечный путь»), разработанная в КНР на базе Оборонного научно-технического университета в Чанша при помощи компании Inspur.

Мощность Тяньхэ-2 обеспечивает выполнение 2507 триллионов операций в секунду (33,86 петафлопс в секунду), пиковая производительность – 54,9 Петафлопс. Китайская разработка возглавляла этот рейтинг с момента запуска в 2013 году – невероятно внушительный показатель!

Суперкомпьютер Тяньхэ-2

Характеристики Тяньхэ-2 таковы: 16 тысяч узлов, 32 тысячи 12-ядерных процессоров Intel Xeon E5-2692 и 48 тысяч 57-ядерных ускорителей Intel Xeon Phi 31S1P, а значит, 3120000 ядер в сумме; 256 тысяч планок оперативной памяти DDR3 по 4 Гб каждая и 176000 планок GDDR5 по 8 Гб – 2432000 Гб оперативной памяти в общей сложности. Объем жесткого диска – более 13 миллионов Гб. Однако поиграть на нем не выйдет – он предназначен исключительно для вычислений, на «Млечный путь-2» не установлена видеокарта. В частности, он помогает при расчетах для прокладки метро и городской застройки.

Jaguar

Долгое время на вершине рейтинга располагался Jaguar – суперкомпьютер из США. Чем он отличается от остальных и в чем его технические преимущества?

Суперкомпьютер под названием Jaguar состоит из большого количества независимых ячеек, разделенных на два раздела - XT4 и XT5. В последнем разделе находится ровно 18688 вычислительных ячеек. В каждой ячейке расположились два шестиядерных процессора AMD Opteron 2356. частотой 2.3 Ггц, 16 Гб оперативной памяти DDR2, а так же роутер SeaStar 2+. Даже одной ячейки из этого раздела хватило бы для того, чтобы создать самый мощный компьютер для игр. В разделе же содержится всего 149504 вычислительных ядер, огромное количество оперативной памяти – более 300 ТБ, а так же производительность 1.38 Петафлопс и больше 6 Петабайт дискового пространства.

Сборка компьютерного монстра

В разделе XT4 находится 7832 ячеек. У них характеристики поскромнее, чем у предыдущего раздела XT5: каждая ячейка содержит один шестиядерный процессор частотой 2,1 Ггц, 8 Гб оперативной памяти и роутер SeaStar 2. Всего в разделе 31328 вычислительных ядер и более 62 Тб памяти, а так же пиковая производительность 263 TFLOPS и более 600 ТБ дискового пространства. Суперкомпьютер Jaguar работает на собственной операционной системе Cray Linux Environment.

В спину Jaguar дышит еще один компьютер, детище компании IBM – Roadrunner. Мощнейший вычислительный монстр способен высчитывать до 1000.000.000.000 операций в секунду. Он был разработан специально для энергетического департамента Национальной администрации по ядерной безопасности в Лос-Аламосе (или Department of Energy’s National Nuclear Security Administration). С помощью этого суперкомпьютера планировали контролировать работу всех ядерных установок, расположенных на территории США.

Пиковая скорость обработки данных у «Дорожного бегуна» составляет около 1,5 петафлопсов. Речь идет об общей мощности 3456 оригинальных серверов tri-blade, каждый из которых способен выполнять около 400 миллиардов операций в секунду (то есть 400 гигафлопов). Внутри Roadrunner расположились около 20 тысяч высокопроизводительных двухъядерных процессоров - 12 960 Cell Broadband Engine и 6948 AMD Opteron, детище самой компании IBM. У такого суперкомпьютера системная память равна 80 терабайтам.

Так сколько же пространства занимает такое чудо техники? Машина расположилась на площади равной 560 квадратным метрам. А упаковано все хозяйство департамента в сервера оригинальной архитектуры. Все оборудование весит около 23 тонн. Так что для его транспортировки сотрудникам национальной администрации по ядерной безопасности потребуется как минимум 21 крупногабаритный тягач.

Пару слов о том, что же такое петафлопс. Один петафлопс примерно равен общей мощности 100 тысяч современных ноутбуков. Если попробовать представить, то ими можно выстлать дорогу длинной практически в два с половиной километра. Еще одно доступное сравнение: все население планеты в течение 46 лет будет с помощью калькуляторов делать вычисления, которые под силу сделать Roadrunner за один день. А представьте, как ничтожно мало потребуется Sunway TaihuLigh, лидеру нашего рейтинга?

Titan

В 2012 году Оукриджская национальная лаборатория Министерства энергетики США запустила суперкомпьютер Titan, рассчитанный на 20 петафлопсов, другими словами, он сможет сделать за одну секунду квадриллион операций с плавающей запятой.

Разработкой Titan занималась компания Cray. Кроме «Титана» американские специалисты за последние годы разработали еще два суперкомпьютера. Один из них - Mira – предназначен для промышленных и научно-исследовательских нужд, а с помощью другого – Sequoia – моделируют испытания ядерного оружия. За всеми этими разработками стоит корпорация IBM.

Самый мощный компьютер в России

Увы, российская разработка «Ломоносов-2», признанная самым мощным компьютером России, находится лишь на 41-м месте в ТОР500 (по состоянию на июнь 2016 года). Он базируется в научно-вычислительном центре МГУ. Мощность отечественного суперкомпьютера – 1,849 петафлопс, пиковая – около 2,5 петафлопс. Количество ядер: 42 688.

Подпишитесь на наш канал в Яндекс.Дзен