Характеристики NVIDIA GT300/Fermi.(TESLA)
После представления архитектуры Fermi на официальном сайте NVIDIA для разработчиков появилось подробное описание характеристик этого нового флагманского графического процессора.
Чип имеет 3 млрд. транзисторов и 512 шейдерных процессоров, которые NVIDIA теперь называет ядрами CUDA. Чип, как и в архитектуре GT200 состоит из кластеров, поэтому компании относительно легко будет создавать чипы для среднего и начального уровня, уменьшая количество этих блоков на кристалле. Fermi имеет 16 кластеров, каждый из которых имеет 32 ядра CUDA.
512 ядер CUDA поддерживают вычисления с плавающей точкой в стандарте IEEE 754-2008, превосходя в этом отношении даже центральные процессоры. При этом скорость исполнения арифметических операций с двойной точностью до 8 раз превосходит предыдущее поколение графических процессоров NVIDIA в лице GT200.
Следующая инновация — 1 Мб кэш-памяти L1, разделенного по 16 Кб, а также распределённая кэш-память L2 объёмом 768 Кб. Иерархическая кэш-память в GPU ускоряет алгоритмы вроде расчётов физических процессов, трассировки лучей и умножения разряжённых матриц, где адреса данных заранее не известны.
Видеопамять работает через 384-битную шину данных. Чип поддерживает память GDDR5 объёмом 1,5 Гб, 3 Гб и 6 Гб. Процессор понимает код C++ без необходимости его обработки драйвером и, конечно, поддерживает DirectX 11. Fermi поддерживает память с ECC (кодом корректировки ошибок), что критично для центров данных и суперкомпьютеров, развёртывающих большие массивы GPU
Движок GigaThread Engine будет поддерживать одновременное исполнение задач нескольких программных ядер в рамках одного приложения (к примеру, одновременный расчёт физики жидкостей и твёрдых тел).
В результате можно сказать, что новый графический процессор NVIDIA очень похож на центральный процессор. Компания идёт путём, обратным подходу AMD Fusion, который предполагает интеграцию GPU
Исходно понятие введено NVIDIA как обозначение графических процессоров с функцией аппаратного ускорения геометрических вычислений (Geometric Processing Unit), но в такой форме трактовка не прижилась.
на кристалл центрального процессора.