Абсолютное большинство (1095) программных продуктов на платформе — открытые; и, что интересно, платформа позволяет исследователям загружать собственные исследовательские коды — как готовые, так и находящиеся в процессе разработки. Таких комплексов на CSTCloud сейчас совсем немного (всего 43), но — с учетом имеющегося там же ПО для дебаггинга (процесса отладки, проверки) кода — перспективы у этого направления, кажется, есть.
Помимо универсальных решений и сервисов, связанных с данными, планированием и пр., в рамках CSTCloud созданы несколько специализированных доменов, соответствующих актуальным государственным приоритетам в области науки и технологий: новые материалы, вычислительная химия, life science и здравоохранение, ИИ, энергетика, физика высоких энергий, лесное дело, арктические исследования. Для каждого домена / каждой приоритетной области знаний развернуты собственные дата-центры, созданы репозитории данных, платформы поддержки профессиональной коммуникации, подборки программного обеспечения и пр.
В похожей, хотя и не полностью аналогичной логике идет цифровая трансформация науки в США.
На общесистемном уровне государство вкладывается в цифровые исследовательские инфраструктуры, которые нужны для достижения заявленных целей в области доступности, интероперабельности, воспроизводимости, прозрачности данных / результатов исследований; в абсолютном большинстве случаев речь идет о внедрении принципов управления исследовательскими данными в парадигме «открытой науки» (в частности, соответствующие цели и задачи зафиксированы в Приоритетах федеральных агентств в области исследований и разработок).
Собственно, даже само понятие исследовательских инфраструктур в США с 2021 года включает не только научное оборудование, необходимое для экспериментов / наблюдений, но также инфраструктуру для управления знаниями (данные, репозитории, архивы, стандарты, протоколы, алгоритмы, цифровые платформы и пр.), а также так называемую исследовательскую кибер-инфраструктуру (вычислительные мощности; инфраструктуры, необходимые для работы ПО и хранения/обработки данных; сети и пр.). А свежий стратегический доклад Национального совета по науке и технологиям, посвященный развитию инфраструктур для науки, прямо утверждает, что современные цифровые исследовательские инфраструктуры — это то, что может и должно обеспечить «превращение информации и данных в открытия и инновации».
Что касается адресного развития цифровых инфраструктур и инструментов, то лучше всего этот подход виден в новых материалах и биотехнологиях — исследовательских и технологических направлениях, которые входят в официальный перечень критичных и перспективных технологий США.
В части разработки новых передовых материалов к критичным технологиям относятся технологии дизайна материалов, создания материалов с новыми свойствами и/или улучшения имеющихся, а также технологии характеризации и управления жизненным циклом.
Приоритетным это направление стало не вчера — новые материалы появляются в американских стратегических документах и программах финансирования уже 20 лет; самая заметная государственная инициатива США по развитию цифрового материаловедения — Materials Genome Initiative — тоже не нова. С 2011 года федеральное правительство финансирует создание инфраструктуры и разработку ПО, которые позволили бы радикально — на порядок — сократить время от разработки нового материала до его внедрения в промышленность/экономику: базы данных о материалах (унифицированные, снабженные тегами и метаданными, с детализированной онтологией понятий), цифровые модели материалов (от нано- до макроуровня).
Что характерно, эта инициатива — детище Департамента обороны, а также армии и ВВС США — и это помимо остальных 15 департаментов и ведомств, кровно заинтересованных в том, чтобы в стране появлялись новые материалы с новыми свойствами.
История с биотехнологиями — более молодая; с 2021 года к критичным для США относятся технологии синтеза белков, геномные, мультиомика, разнообразные технологии биоинжиниринга и биопроизводства/биопроцессинга, а также все виды биоинформатики с ее предиктивным моделированием и аналитическими инструментами.
Для обеспечения развития биотеха в сентябре 2022 года указом «О развитии биотехнологий и инноваций в области биопроизводства для устойчивой и безопасной американской биоэкономики» были утверждены планы реализации инициативы «Данные для биоэкономики», в рамках которой будут созданы и/или собраны качественные и защищенные дата-сеты по максимально широкому перечню направлений, прямо или косвенно связанных с биотехнологиями и их применениями. Ядром этого массива станут данные из сферы геномики/ мультиомики, поскольку именно они, по мнению администрации США, могут дать стране научные и инновационные прорывы в здравоохранении, фармацевтике, энергетике, сельском хозяйстве.
Отдельное направление в рамках инициативы — обеспечение кибербезопасности данных, как в связи с их чувствительностью (особенно это касается медицинских данных граждан США), так и в связи с их стратегической важностью для развития направления.
О технологиях моделирования и симулирования в биотехе речь пока не идет, и понятно почему: основная «цифровая» проблема биотехнологий — не в моделировании, а в разрозненности и недоступности данных (это верно и для многих других научных/ технологических направлений, в том числе для уже упомянутого материаловедения).
Поэтому ряд других стран, реализующих масштабные программы научно-технологического развития, тоже работает над решением именно этой проблемы — проблемы данных.
Германия создала 30 специализированных консорциумов исследовательских институтов для организации общих репозиториев научных данных, соответствующих международным принципам FAIR; консорциумы объединены по научным направлениям, как естественным (биология, химия и т. д.), так и гуманитарным и общественным (социология, экономика). Помимо датасетов, речь идет о создании всех необходимых инфраструктур (облачное хранение, комплаенс и мониторинг соответствия данных стандартам качества, системы распределенных вычислений/анализа).
Великобритания (Агентство по исследованиям и инновациям) вкладывается в создание защищенных и безопасных дата-центров и репозиториев исследовательских данных со всеми необходимыми инфраструктурами (наращивание вычислительных мощностей, включая суперкомпьютерные и облачные решения; исследовательское ПО и репозитории кода) в рамках единой программы развития исследовательских инфраструктур.
Норвегия, как и Великобритания, в рамках единой стратегии финансирования научной инфраструктуры (National Financing Initiative for Research Infrastructure) планирует развивать цифровые инфраструктуры, находящиеся под управлением единой государственной компании UNINETT, в том числе решения для хранения данных и обменов ими.
Список можно продолжать, но суть всех этих инициатив одна — обеспечить концентрацию исследовательских данных на защищенных и безопасных платформах, дать исследователям доступ к ПО, необходимому для работы с этими данными, и, не в последнюю очередь, позволить им дорабатывать и развивать собственные программные продукты (исследовательский код).