Количество вычислительных блоков в графическом процессоре AMD и их структура зависит от семейства устройств, а так же от обозначений устройств в семействе. Каждый из этих векторных единиц обладает АЛУ(обрабатывающие элементы). Для устройств в Северных островах (AMD Radeon HD 69XX) и Южных островах (AMD Radeon HD 7XXX) семейства — эти АЛУ расположены в четырех(в вечнозеленых семействах их пять) SIMD массивах, состоящих из 16 процессорных элементов каждый.(См. Раздел 1.3 - «Обзор аппаратных средств для устройств Вечнозеленых и Северных островов»). Каждый из этих SIMD массивов выполняет по одной инструкции на каждой полосе для каждого блока из 16 рабочих элементов. Эта инструкция обрабатывается всеми четырьмя циклами одновременно — в итоге получается 64-элементный вектор и называется волновым фронтом. На устройствах в Южной части Островов семейства, данные массивы обрабатывают четыре потоковых ядра и образуют четыре различных волновых фронтов.
1.3 Обзор оборудования для устройств Evergreen и Northern Islands
Общее устройство OpenCL состоит из вычислительных блоков, каждый из которых может иметь несколько процессорных элементов. Каждый рабочий блок(или экземпляр ядра SPMD) выполняется на одном элементе обработки. Процессорные элементы внутри вычислительного блока исполняют замок-шаг, используя выполнение SIMD. Однако вычислительные единицы работают самостоятельно.(см. Рис. 1.3).
Графические процессоры AMD состоят из нескольких вычислительных блоков. Количество и позиционирование зависят от семейства прибора, так же как обозначение прибора внутри семейства. Каждый из этих вычислительных блоков обладает ALUs. Для устройств в северных и южных островах семейства, эти ALUs аранжированы в четырех (в семействе Evergreen их пять) элементах обработки с массивами из 16 ALUs. Каждый из этих массивов выполняет по одной инструкции на каждой полосе для каждого блок из 16 элементов. Эта инструкция повторяется и обрабатывается в течении четырех циклов, чтобы сделать 64-элементный вектор и называется волновым фронтом. В северных и вечнозеленых семействах устройств, 4 цикла выполняют инструкции от одного волнового фронта, таким образом, каждый рабочий элемент выдает четыре (для северных островов) или пять (для вечнозеленых) инструкции в very-longinstruction-word (VLIW) пакет.