Новый CUDA Toolkit значительно ускоряет матричные операции, БПФ и генерацию случайных чисел.
Стоит знать о новом выпуске CUDA Toolkit от nvidia. Он имеет значительное увеличение скорости для графических процессоров Fermi (GeForce 400/500). Обработка матриц выполняется до 300% быстрее, быстрое преобразование Фурье быстрее в 2–10 раз, как и генерация случайных чисел. Библиотека кодирования / декодирования H.264 теперь также включена в Toolkit. Поддержка отладки также была расширена до настроек с несколькими графическими процессорами в gdb и Parallel Nsight.
Также есть несколько новых примеров кода SDK:
Несколько примеров кода, демонстрирующих использование новой библиотеки CURAND, включая MonteCarloCURAND, EstimatePiInlineP, EstimatePiInlineQ, EstimatePiP, EstimatePiQ, SingleAsianOptionP и randomFog
Сопряжение Gradient Solver, демонстрирующее использование CUBLAS и CUSPARSE в одном приложении
Указатели на функции, пример, показывающий, как использовать указатели на функции для реализации фильтра Sobel Edge Detection для 8-битных монохромных изображений.
Интервальные вычисления, демонстрирующие использование интервальных арифметических операторов с использованием шаблонов C ++ и рекурсии
Simple Printf, демонстрирующий лучшие практики использования printf и cuprintf в вычислительных ядрах.
Двусторонний фильтр, сохраняющий края нелинейный сглаживающий фильтр для восстановления изображений и шумоподавления, реализованный в CUDA C с рендерингом OpenGL
SLI с Direct3D Texture, простой пример, демонстрирующий использование SLI и взаимодействия Direct3D с CUDA C
cudaEncode, показывающий, как использовать библиотеку кодирования NVIDIA H.264 с использованием кадров YUV в качестве входных данных.
Vflocking Direct3D / CUDA, который имитирует и визуализирует стайку птиц в полете.
simpleSurfaceWrite, демонстрирующий, как ядра CUDA могут писать на 2D-поверхности на графических процессорах Fermi.
CUDA Toolkit 3.2 доступен для загрузки для Windows, Mac OS X и Linux.