abramov

Инфраструктура цифровой экономики

С.М. Абрамов, член.-корр. РАН

Чем в первую очередь характеризуется тот или иной технологический уклад? Чем каждый технологический уклад зримо и осязаемо отличается от остальных? Ответ простой — инфраструктурой! Именно паровое судоходство стало лицом второго экономического уклада, а широкая, всеохватывающая сеть железных дорог — третьего. Причём каждый раз инфраструктура нового уклада вырастала из ключевых достижений предыдущего. Так, основой инфраструктуры третьего технологического уклада стали железные дороги, невозможные без основного символа второго уклада — парового двигателя.

Сегодня мы находимся в начале шестого экономического уклада, ключевыми факторами которого должны стать нанобиотехнологии, когнитивные науки, наносистемная техника, нанофотоника и др. Всё перечисленное невозможно без широкого доступа всех субъектов экономики к огромным вычислительным ресурсам. Отсюда можно сделать уже осознанный во многих странах мира вывод о том, что инфраструктурой шестого технологического уклада станет инфраструктура высокопроизводительных вычислений, призванная открыть доступ к вычислительным ресурсам не только для государств и крупнейших корпораций, которые могут себе позволить иметь суперкомпьютер, но и для средних и небольших предприятий и научных коллективов — для всех без исключения субъектов новой экономики. И, как и полагается, вырасти эта инфраструктур должна из ключевого достижения предыдущего технологического уклада – микроэлектроники.

Работы по созданию инфраструктуры высокопроизводительных вычислений сегодня ведутся практически во всех развитых регионах мира: в США создаётся и эксплуатируется система INCITE (The Innovative and Novel Computational Impact on Theory and Experiment), в Японии — HPCI (High Performance Computing Infrastructure), в Евросоюзе — PRACE (Partnership for Advanced Computing in Europe). Также реализуются подобные инфраструктурные проекты в Китайской Народной Республике и в Республике Корея. В США эта деятельность осуществляется правительством в лице министерства энергетики (DOE), в Японии — также правительством в лице министерства образования, культуры, спорта, науки и технологий (MEXT). В Евросоюзе эту работу координирует Еврокомиссия.

Для нас наиболее интересен опыт Евросоюза, т.к., в отличие от остальных, это межгосударственный проект, в котором участвуют 26 стран. Рассмотрим его чуть подробнее.

Миссия PRACE[1]: обеспечить всемерное использование последних достижений науки в инженерных изысканиях и междисциплинарных разработках для повышения конкурентоспособности Европы на благо общества путём предоставления вычислительной инфраструктуры мирового класса всем предприятиям, учебным заведениям и другим субъектам инновационного процесса в Европе.

Ключевыми отправными точками для проекта являются следующие факторы:

  • суперкомпьютеры сегодня являются инструментом для решения самых сложных проблем промышленности, науки и оборонной отрасли;
  • доступ к мощным вычислительным ресурсам мирового класса является важнейшим условием международной конкурентоспособности в области науки и машиностроения;
  • для того чтобы получить желаемый эффект, сервис доступа к ресурсам должен быть реализован на долгосрочной, постоянной основе;
  • именно такой подход обеспечил технологический рывок Японии и США в 90-ые годы.

Общая идея PRACE состояла в построении единой европейской суперкомпьютерной сети, состоящей из вычислительных установок трёх уровней.

Уровень 0 — три-пять европейских центров — установок топового класса (в первой десятке–двадцатке рейтинга «Топ-500»);

Уровень 1 — национальные центры в странах-участницах — установки уровня первой сотни «Топ-500»;

Уровень 2 — региональные или университетские центры — установки класса «Топ-500».

На базе этих установок (и вокруг них) создавалась «европейская вычислительная экосистема» на следующих принципах:

  • все сервисы предоставляются всем клиентам, подключённым к любому уровню;
  • вся система объединена единой грид-сетью, на базе которой строятся облачные и иные сервисы;
  • на базе системы создаются научные и промышленные сообщества;
  • на базе системы развивается европейская индустрия аппаратного и программного обеспечения.

Бизнес модель предполагала продажу определённого количества ресурсов с целью получить средства на поддержание функционирования центров и предоставление остальных ресурсов в безвозмездное пользование предприятиям, организациям и научным учреждениям на конкурсной основе.

PRACE — весьма дорогостоящая система. Затраты на обновление техники «уровня 0», которое происходит каждые 2–3 года, составляют порядка 200–400 миллионов евро. Ежегодные затраты на эксплуатацию (running cost) составляют порядка 100–200 миллионов евро.

Последнее замечание очень важно для понимания сути дела. PRACE — это инфраструктурный проект, и, как всякий инфраструктурный проект, он не может рассматриваться в парадигме «сделали и теперь у нас есть». Создание инфраструктуры — это не акт, это процесс. И если кто-то решил создавать инфраструктуру, он должен быть готов к постоянным плановым затратам на её поддержание и обеспечение её функционирования.

Так же, как и любая другая инфраструктура, PRACE, в первую очередь, финансируется Евросоюзом из бюджета. Внебюджетные средства привлекаются только на стадиях подготовки проектов, но и там исчисляются единицами процентов. Так, из €132 млн., потраченных на эти цели в период 2010–2019, Еврокомиссия профинансировала €125 млн.

Наконец, надо сказать, что PRACE не предполагает прямой окупаемости. Окупаемость системы ожидается за счёт оживления, развития и большей конкурентоспособности европейской экономики в целом.

Создание PRACE началось в 2004 году, а с 2010 она начала предоставлять услуги потребителям. За это время было поддержано почти семьсот проектов в сорока двух странах, а суммарное машинное время, безвозмездно предоставленное потребителям, составило 21 миллиард ядро-часов. За это же время было проведено 640 различных школ, семинаров и других учебных мероприятий, на которых более 16 тысяч специалистов прошли бесплатное обучение использованию высокопроизводительных вычислений для решения стоящих перед ними задач.

Чтобы понять, какие именно проекты получают поддержку PRACE, приведём несколько примеров.

  • Моделирование стихийных бедствий.

Глобальный подход к моделированию позволяет предсказывать развитие таких природных катаклизмов, как ураганы, засухи, наводнения, а также отступление и таяние полярных льдов. На проведение расчётов затрачено 144 565 862 ядро-часа. Чтобы читатель мог лучше предстваить масштаб затраченных ресурсов, скажем, что современному мощному персональному компьютеру для этих вычислений потребовалось бы более тысячи лет непрерывной работы. Полученные результаты востребованы не только климатологами, но и службами по чрезвычайным ситуациям и страховым бизнесом.

  • Моделирование процессов поглощения биоматериалами тяжёлых металлов из воды.

В 2018 году было замечено, что при помощи кофейной гущи можно извлекать до 90% свинца из загрязнённой воды, а чайная заварка удаляет четыре различных тяжёлых металла. На моделирование происходящих при этом процессов и создание промышленной технологии очистки воды было выделено 63,7 миллиона ядро-часов системы PRACE.

  • Оптимизация конструкции подвесных мостов.

В результате расчётов, которые заняли 27 миллионов ядро-часов, удалось уменьшить вес пролёта моста на 28%, что позволило существенно снизить металлоемкость, а значит, и стоимость постройки моста.

  • Моделирование распространения пыли в атмосфере Земли.

Ежегодно ветер поднимает сотни миллионов тон пыли из пустынь. Это оказывает существенное влияние на климат, безопасность полётов и здоровье людей. Группа проф. Цекери с использованием мощностей PRACE пытается построить модель распространения пыли, что позволит не только отслеживать ежегодные «плановые пыльные бури» но и прогнозировать влияние на атмосферу таких явлений, как извержение вулканов и землетрясения.

Вообще же на построение климатических моделей высокого разрешения было потрачено 184 миллиона ядро-часов, и работа продолжается.

  • Моделирование белков.

Проф. Зои Курния моделирует процессы, происходящие в раковых клетках. Рак, по её мнению, это не одно заболевание. Например, рак груди состоит из более, чем тысячи различных заболеваний. Построенные модели должны позволить лечить конкретные заболевания, а не «бить по площадям» химиотерапией, у который множество разрушительных побочных эффектов. По словам Курния, моделирование, которое её группа провела за месяц с использованием ресурсов PRACE, заняло бы 490 лет непрерывной работы настольного компьютера.

  • Молекулярное моделирования процессов получения «голубой энергии».

Когда соленая вода контактирует с пресной (например, в месте впадения реки в море), происходит процесс, называемый химиками осмосом, что означает одностороннюю диффузию через проницаемую мембрану. А поскольку при этом перемещаются электрически заряженные ионы соли, это позволяет получать экологически чистую «голубую энергию». При запуске в обратном порядке этот процесс может стать эффективным способом опреснения воды — как емкостная деионизация.

Исследователи из группы проф. Ротенберга (Сорбонна) показали, что молекулярное моделирование может реалистично предсказать емкость устройств, которые содержат нанопористые углеродные материалы в качестве электродов и соленую воду в качестве электролита.

А что же у нас?

Если отвечать коротко, то «ничего». Вычислительной инфраструктуры в Евразийском Союзе нет. Как нет её и ни в одной из стран — членов Союза. Более того, не ведётся никаких целостных, скоординированных работ по её созданию.

К чему это может привести? Вернее, уже привело? Например, к практически стопроцентной импортозависимости в вычислительном обеспечении нефтегазового сервиса, к заметному отставанию в современной фармакологии, к тому, что цифровое моделирование краш-тестов в проекте президентского автомобиля «Кортеж» проводилось при помощи импортного программного обеспечения и такие примеры можно продолжать бесконечно.

Что можно и нужно делать? Ответ простой — работать. Всем, кто заявляет, что «мы отстали навсегда», что «надо смириться и покупать, а свои преимущества искать в других областях» рекомендуется посмотреть, где был Китай на рубеже веков, и где он сейчас. Навсегда отстали те, кто не работает и не хочет работать. Тем более, что если мы отказываемся от вычислительной инфраструктуры, никаких преимуществ ни в каких «других областях» у нас не будет.

В мае 2021 года Евразийская суперкомпьютерная технологическая платформа (ЕСТП) обратилась в Евразийскую Экономическую комиссию с предложением разработать и реализовать межгосударственную программу «Евразийская информационно-вычислительная инфраструктура». Главной целью программы является построение информационно-вычислительной инфраструктуры ЕАЭС для предоставления доступа к высокопроизводительным вычислительным ресурсам мирового класса всем предприятиям, научным учреждениям, учебным заведениям, органам государственной власти и другим субъектам инновационного развития. Предусматривается три основных направления работ: технологическое — разработка технологии построения суперкомпьютеров, систем телекоммуникаций, систем хранения данных; организационная — разработка технологий эффективного использования создаваемой инфраструктуры, доведения её возможностей до всех субъектов инновационной экономики; и институциональное — разработка комфортной для потребителя среды, включая бизнес-модель функционирования, необходимую нормативно-правовую базу, стандарты, систему сертификации, создание экспертного сообщества и образовательной сети. Достижение указанных целей, по замыслу инициаторов, должно превратить создаваемую информационно-вычислительную инфраструктуру в эффективный и востребованный инструмент преодоления отставания и обеспечения технологической независимости и конкурентоспособности стран-участниц ЕАЭС.

Рассмотрим три перечисленные направления работ чуть подробнее.

Технологическое направление включает в себя разработку:

  • вычислительных ресурсов на базе перспективных суперкомпьютеров различного уровня производительности;
  • сетевых ресурсов — межгосударственную сеть с характеристиками, позволяющими не только передавать большие объемы данных, но и перераспределять нагрузку и объединять (частично или полностью) вычислительные ресурсы различных суперкомпьютеров при решении отдельных задач;
  • ресурсов хранения данных — емкости хранения данных и базы данных, адекватные потребностям промышленности и научно-исследовательского сообщества государств ЕАЭС;
  • сервисов и средств эффективного доступа к данным и вычислительным ресурсам.

Организационное направление включает в себя разработку программного обеспечения, адекватного масштабам создаваемой инфраструктуры для:

  • планирования, управления ресурсами и балансирования нагрузок;
  • виртуализации и динамического построения виртуальных архитектур;
  • мониторинга и контроля работоспособности и эффективности использования аппаратных и программных средств;
  • автоматического распараллеливания, отладки и трассировки программ;
  • защиты и раннего обнаружения угроз как предумышленных, так и непредумышленных;
  • анализа функционирования системы и моделирования изменений в ней.

Институциональное направление включает в себя создание:

  • осознанного спроса на услуги информационно-вычислительной инфраструктуры;
  • бизнес-модели функционирования системы;
  • правил доступа к системе и работы в ней;
  • системы подготовки и сертификации специалистов;
  • пакета проектов нормативно-правовых актов для обеспечения эффективной и безопасной работы системы;
  • новых и пакета поправок к действующим стандартам и регулирующим документам;
  • эффективно действующей экспертной среды, включающей в себя центры компетенции, призванные помогать предприятиям в решении их задач, как это делается в системах PRACE и INCITE, когда клиент приходит не со своей программой, а со своей проблемой, а представить её в виде эффективной программы ему помогают специалисты центров компетенции, входящих в информационно-вычислительную инфраструктуру.

Особенно следует отметить направление работ: «Формирование осознанного спроса». Дело в том, что опыт внедрения суперкомпьютерных технологий показывает, что не все предприятия готовы к их использованию. И дело даже не в отсутствии вычислительной техники, а в ментальности руководства предприятий. Кто-то не нуждается в инновациях в силу своего монопольного положения на рынке, а кто-то в принципе нуждается, но уверен, что это чрезвычайно дорого, рискованно и трудоёмко, наконец, есть третьи, которые просто не знают, какие возможности таят в себе высокопроизводительные вычисления и как это может помочь их бизнесу. Если подвигнуть монополистов к внедрению инноваций могут только меры общеэкономического характера, то остальных вполне можно мотивировать к использованию ресурсов инфраструктуры, создавая удобную, понижающую порог вхождения сеть центров компетенции и проводя широкую разъяснительную работу через выставочные мероприятия, семинары, школы и т.п.

Первую очередь системы предполагается создать в течение шести лет. Вряд ли это возможно сделать быстрее (кстати, PRACE начала создаваться в 2004, а первые проекты пошли в 2010). За это время предстоит проделать огромный объём работы технического, юридического и организационного плана.

Но инфраструктурную систему мало построить. Для того чтобы она исправно исполняла свои функции, её необходимо постоянно развивать, расширять и обновлять. По скорости устаревания вычислительная техника уступает разве что парному молоку. Уже через три года любая система нуждается в модернизации, а если её не проводить, то через пять лет она устаревает безнадёжно.

Для понимания скорости, с которой устаревает вычислительная техника, можно привести такое наблюдение: если у вас на столе стоит относительно современный персональный компьютер за среднюю цену (например, такой, как HP 290 G4), то можете гордиться — менее, чем 20 лет назад, в 2003 году, Ваш ПК попал бы в список пятисот самых мощных компьютеров мира[2] и по праву считался бы суперкомпьютером. А ещё девятью годами ранее, в 1994 году, так просто возглавил бы этот список и был бы самым мощным мировым вычислителем.

Почему всё это нужно делать прямо сейчас? На самом деле, не сейчас. Это нужно было делать позавчера. И каждый день раскачки увеличивает и увеличивает наше отставание, которое некоторые «эксперты» и без того называют непреодолимым.

[1] https://prace-ri.eu/about/introduction/

[2] Пиковая производительность приведённого в пример ПК составляет 301ГФлопс. Машина VPP5000/31от Fujitsu с производительностью 297,6ГФлопс занимала 424 строчку в июльском списке 2003 года

Метки: нет меток

Комментарии закрыты.