Новая библиотека NAG для Intel Xeon Phi была недавно запущена в преддверии Международной конференции по суперкомпьютерам в этом году, которая проходит на этой неделе в Лейпциге, Германия. NAG демонстрирует Марк 24 библиотеки NAG для SMP и многоядерных процессоров в ISC13.
Группа численных алгоритмов (NAG) первоначально анонсировала версию своих численных процедур, настроенных на использование преимуществ производительности Xeon Phi в ноябре прошлого года на конференции Super Computing conference, SC12. Библиотека теперь доступна как раз к ISC ’13.
Согласно объявлению НАГА:
Библиотека NAG для Intel Xeon Phi содержит более 1700 числовых процедур, некоторые из которых были распараллелены и настроены для использования преимуществ производительности Xeon Phi. Процедуры NAG автоматически разгружают, когда это выгодно, интенсивные вычислительные операции в Xeon Phi, тем самым позволяя пользователям прозрачно использовать производительность Xeon Phi. Для более продвинутых пользователей новая библиотека NAG для Intel Xeon Phi также поддерживает явные модели разгрузки и собственного выполнения Intel. В дополнение к новой библиотеке NAG предоставляет услуги по параллельной разработке программного обеспечения и оптимизации производительности для консультирования и оказания помощи в переносе кодов приложений, чтобы они эффективно использовали потенциал сопроцессора Xeon Phi.
Более трети подпрограмм в библиотеке NAG для SMP & Multicore, которая имеет тот же математический и статистический контент, что и стандартная библиотека NAG Fortran, теперь могут использовать несколько ядер.
Существуют новые распараллеленные процедуры для глобальной оптимизации, матричных функций и статистики, включая модель гауссовой смеси, броуновский мост и одномерные неоднородные временные ряды. Это последнее обновление библиотеки (отметка 24) поможет численным программистам использовать потенциал производительности многоядерных систем без необходимости изучать тонкости параллельного программирования.
На этой диаграмме показаны примеры библиотеки NAG для SMP и многоядерной производительности на отметке 24. Каждая строка представляет разный размер проблемы. (Платформа: процессоры AMD Opteron 6174. Каждое ядро работает на частоте 2,2 ГГц.)