
Одна из проблем, стоящих перед исследователями, специализирующимися в области биомедицины, заключается в возможности интеграции детализированных молекулярных механизмов различных болезней с конструированием эффективных средств соответствующей терапии. В идеале, было бы хорошо иметь в арсенале симуляторы, позволяющие проводить оценку развития болезней на различных уровнях (клеточном, отдельных органов и организма в целом). В Чикагском университете была разработана модель эпителия кишечника с использованием агент-ориентированного подхода и параллельных вычислений, позволяющая имитировать процесс воспаления подвздошной кишки в случае язвенного колита. Хотя это исследование напрямую не относится к общественным наукам, однако, разработанное высокопроизводительное программное обеспечение может быть использовано для реализации агентных моделей в других областях (в частности, при моделировании социальных систем).
По мнению ученых, использование агентного подхода как нельзя лучше подходит для отображения деятельности миллиардов клеток, содержащих ДНК и РНК, но с другой стороны обработка такого массива информации требует использования суперкомпьютеров и в этой связи исследователями была разработана пространственная модель общего назначения для исследования кишечной ткани (Spatially Explicit General-purpose Model of Enteric Tissue (SEGMEnT)).
SEGMEnT разработана на языке C++ с использованием программного интерфейса MPI для выполнения межпроцессорных коммуникаций. Можно выделить следующие ключевые особенности приложения:
1. Использование набора двухмерных сеток, которые затем преобразуются в трехмерную конструкцию, имитирующую поверхность исследуемой ткани (рис. 1). В ходе симуляции используемые сетки могут расти или сжиматься для большего соответствия реальным физиологическим процессам.
2. SEGMEnT использует ряд неблокирующих коммуникационных операций, позволяющих эффективно масштабировать систему.
3. Несмотря на изначальную направленность SEGMEnT в качестве инструмента для исследования кишечной ткани, это программное средство может использоваться для разработки агентных моделей и для других областей.
Рис. 1. Симуляция работы илеоанального резервуара типа J (J-pouch)
При распараллеливании модели в SEGMEnT, вся площадь исследуемой ткани делится равномерно числу используемых процессоров (рис. 1). На панели A изображен илеоанальный резервуар типа J (J-pouch). Панель B представляет собой виртуальную проекцию J-pouch в виде цилиндра, распределяемую между процессорами суперкомпьютера. Панель C показывает, как крипты (crypt) и ворсинки (villus) представлены на одном процессоре, а на панели D показывается как они преобразуются в двумерную сетку, где коричневым цветом обозначены ворсинки, а синим – крипты. И, наконец, на панели E изображена часть биологической системы, обрабатываемой с помощью SEGMEnT, причем в верхней части рисунка – результат гистологического анализа, а в нижней – изображение, полученное с помощью сканирующего электронного микроскопа.
Сигнальные молекулы и пример передающей их сети приведены на рис. 2. Морфогены окрашены синим цветом, а воспалительные компоненты – оранжевым. В свою очередь стимулирующие контакты изображены зелеными стрелками, а подавляющие – красными. Сети включают в себя сигнальный путь Wnt (от англ. wingless – бескрылый и int – ген), костные морфогенетические белки (BMP, bone morphogenetic proteins), фосфатазу и гомолог тензина / фосфоинозитид-3-киназы (phosphotase and tensin homolog / phosphoinositide 3-kinase (PTEN/PI3K)) и др.
Виртуальные проекции криптов и ворсинок, расположенные на границе обслуживаемого процессорами пространства содержат дополнительные буфера для сохранения связи с соседними процессорами.
Рис 2. Передающая сеть в SEGMEnT
Расчеты проводились на суперкомпьютерах Beagle и Midway, расположенных в Чикагском университете, а на рис. 3 показаны результаты масштабирования.
Рис. 3. Результаты масштабирования
На Панели A показано время выполнения итерации в зависимости от количества используемых процессорных ядер, при этом каждый процессор рассчитывал результат для 100 000 агентов. По мере увеличения используемых процессорных ядер от 4 до 12 672 среднее время выполнения итераций увеличилось примерно на 25%, и, как видно, по мере приближения к 10 000 ядрам, кривая начинает постепенно выравниваться. В свою очередь на панели B показана производительность приложения для 350 000 агентов в зависимости от количества используемых процессорных ядер (1, 4, 16 и 64), при этом каждое ядро рассчитывало 256, 64, 16 и 4 конструкций из криптов и ворсинок.
Рис. 4. Масштабируемость в зависимости от размеров кишечной ткани
На рис. 4 приведены другие результаты масштабируемости модели – время расчетов в зависимости от числа используемых процессоров для конструкций из криптов и ворсинок размерности 4, 16 и 64. Как видно, по мере увеличения размера ткани эффективность масштабируемости приближается к идеальной (панель C). Максимальное число используемых ядер составляло 12 672, но, по мнению разработчиков у SEGMEnT есть отличный потенциал для масштабирования на суперкомпьютерах с числом ядер более 100 000.
На рис. 5 показана зависимость общего количества моделируемых клеток (агентов) для образца ткани размером 1 129 мм2 от расчетного времени с использованием 7 056 процессоров. Соотношение ворсинок к криптам составляет примерно 4 к 1, что соответствует результатам гистологии. Максимальное количество моделируемых клеток в рамках проведенной симуляции составило 1 038 136 974, причем первоначальный рост клеточной популяции связан с процедурой инициализации модели.
Рис. 5. Общее количество клеток моделируемой ткани
На рис. 6 показан результат визуализации фрагмента выходных данных SEGMEnT. Панель A демонстрирует здоровую ткань, B – небольшое воспаление, C – восстановленную ткань после тяжелого воспаления, а D – ткань с уменьшенной высотой ворсинок.
Рис. 6. Рендеринг ткани
Успешная реализация и использование модели SEGMEnT позволяет рассчитывать на дальнейшее развитие системы для исследования других органов человеческого организма. Разработчики проанализировали аналогичные инструментальные средства, позволяющие разрабатывать агент-ориентированные модели для суперкомпьютеров. Среди протестированных программ:
1) FLAME, позволяющая распараллеливать агентные модели для систем с несколькими сотнями процессоров. В настоящее время это ПО используется не только для анализа биологических систем (для чего была разработана изначально), но и для построения моделей больших социально-экономических систем.
2) RepastHPC – разработка Аргоннской национальной лаборатории, изначально используемая для симуляций систем в социальных науках, но может быть адаптирована и для анализа биологических систем. Тестирование этого ПО со стороны ученых Чикагского университета показало возможность масштабирования до реализации на 32 678 процессорных ядрах.
3) Biocellion – средство для реализации агентных моделей биологических систем на системах с 4 000 ядрами (также по оценкам чикагских ученых).
В свою очередь, исследователи отмечают, что все эти средства не лишены недостатков, главный из которых – недостаточная масштабируемость. Если речь идет о моделировании более сложных процессов, к примеру, имитации работы всех клеток толстой кишки в течение одного года, то по оценкам разработчиков SEGMEnT потребуется задействование 450 000 процессоров в течение 30 часов. Для имитации работы всех клеток тонкого и толстого кишечников в течение года по мнению разработчиков потребуется работа уже 2,4 млн. процессорных ядер в течение 40 часов. А если моделировать работу клеток всего организма с учетом развития различных заболеваний, то исследовательская группа увязывает эту возможность с появлением суперкомпьютеров эксафлопсной производительностью, причем теоретически SEGMEnT к этому уже готова.
Более подробно про сегмент написано в статье: [Cockrell RC, Christley S, Chang E, An G (2015) Towards Anatomic Scale Agent-Based Modeling with a Massively Parallel Spatially Explicit General-Purpose Model of Enteric Tissue (SEGMEnT_HPC). PLoS ONE 10(3): e0122192. doi:10.1371/journal.pone.0122192].