Исследователи собираются "разогнать" самые мощные в мире суперкомпьютеры при помощи нового эффективного программного обеспечения

Основная идея заключается в реализации управления аппаратными средствами вычислительных систем таким образом, что их компоненты работают при напряжении, немного превышающем допустимое пороговое значение (near-threshold voltage, NTV).

В таких условиях все компоненты работают не очень надежно, часто совершая ошибки. Предполагается, что специализированное программное обеспечение и параллелизм вычислений позволят выявить и устранить возникающие вычислительные ошибки несколькими различными методами.

«Мы исследуем сценарии, в которых программы разделяются на критические и несущественные участки. И эти участки выборочно выполняются суперкомпьютером на тех аппаратных средствах, которые обеспечивают требующийся уровень надежности, но не более того» – пишут исследователи, – «Сейчас мы формируем наборы правил, по которым будут определяться участки алгоритмов, которые невосприимчивы к возникающим ошибкам. Остальные участки алгоритмов являются критическими, возникновение ошибок при их исполнении чревато проведением повторных вычислений и, следовательно, к перерасходу энергии».

Кроме определения наборов правил, по которым участки кода будут разделяться на несколько категорий, исследователи работают над разработкой вычислительных методов, повышающих устойчивость программы к возникновению ошибок.

Более того,

ведется разработка алгоритмов расстановки контрольных точек, в которых производится анализ исходных данных и результатов вычислений, что позволяет выявить возникновение «тихих» ошибок вычислений или повреждения данных.

«Использование таких программных решений позволит производить обработку больших наборов данных или сложнейших математических моделей гораздо быстрее и с меньшими затратами энергии, нежели бы над этим работал тот же самый суперкомпьютер, функционирующий в обычном режиме» – рассказывает профессор Димитриос Николопулос (Dimitrios Nikolopoulos), научный руководитель проекта SERT.

Следует отметить, что

реализация проекта SERT была начата только в этом месяце с момента получения финансирования в размере одного миллиона фунтов стерлингов от британского совета EPSRC (Engineering and Physical Sciences Research Council). А первыми программами, которые испытают на себе всю мощь «разогнанных» суперкомпьютеров, станут детализированные модели природных явлений, таких, как океанские течения, модели систем и органов человеческого организма, климатические модели и многое другое из области энергетики, метеорологии, транспорта, науки и т.п.

"

<h4>Другие новости:</h4>