Что примечательно, AMD удалось сохранить сопоставимый уровень задержки обращений к памяти между поколениями CPU: 118 нс против 108 нс, из которых только 3 нс приходится на IO-блок, а 10 нс уже на саму память. Embedded in the A10 is the M10 motion coprocessor.[17] The A10 also includes a new image processor which Apple says has twice the throughput of the prior image processor.[18]. В итоге пользователи, которые приобретут процессор AMD FX-8350, всего за 195 долларов (аналог от компании Intel – i5 3570K, стоимостью 235 долларов), получат 8 процессорных ядер, работающих с частотой до 4,2 ГГц!!! и 8 Мбайт кеш-памяти уровня L3.
Обзор и рейтинг Amd a10-7800
Внутри AOKZOE A1 Pro установлен выполненный по 4-нм техпроцессу восьмиядерный (16-поточный) процессор AMD Ryzen 7 7040U с ядрами Zen 4, работающими на частоте до 5,1 ГГц. Корпорация AMD анонсирует процессор AMD Alchemy Au1550. Процессоры AMD А-серии под кодовым названием «Kaveri» с графикой AMD Radeon R7 обладают целым рядом удивительных преимуществ, которые значительно повысят производительность ПК и сделают игровой процесс еще более захватывающим. Процессор AMD a10-4600m для ноутбука. Линейка процессора: A10 Тип: Процессор Архитектура: Trinity Сокет процессора: Socket FS1 Базовая частота, ГГц: 2.3. Тепловыделение AMD A10-7890K составляет 95 Вт, и он поставляется в комплекте с новой улучшенной системой охлаждения Wraith, которая отличается пониженным уровнем шума и светодиодной подсветкой логотипа AMD.
Видеокарта в подарок. Обзор нового процессора AMD A10 5800K Trinity
Первое число — это Data A, которое имеет адрес 1, а второе число — Data D, имеющее адрес 4. Пусть Data A хранится в первом модуле памяти, а Data В — во втором. В случае использования 128-битного контроллера памяти придется сначала загрузить 64 бита данных по адресу 1 Data A из первого модуля памяти и одновременно с этим 64 бита данных по адресу 2 Data B , которые процессору не нужны. Далее будут загружены 64 бита данных по адресу 3 Data C , которые также не нужны процессору, и 64 бита данных по адресу 4 Data D.
Как видите, применение 128-битного контроллера памяти в данном случае малоэффективно. Если же используются два независимых 64-битных контроллера памяти, то за один такт загружается 64 бита данных по адресу 1 Data A и 64 бита данных по адресу 4 Data D. Кроме применения двух независимых 64-битных контроллеров памяти вместо одного 128-битного, имеются и другие улучшения контроллера памяти.
Операции чтения имеют преимущество перед операциями записи, а данные, предназначенные для записи, откладываются в специальном буфере. Кроме того, контроллер памяти умеет анализировать последовательности запросов и делать соответствующую предвыборку. Ядро процессора Как известно, процесс обработки данных процессором включает несколько этапов.
В простейшем случае можно выделить четыре этапа обработки команды: выборка из кэша; выполнение; запись результатов. Сначала инструкции и данные забираются из кэша L1, который разделен на кэш данных D-cache и кэш инструкций I-cache, — этот процесс называется выборкой. Затем выбранные из кэша инструкции декодируются в понятные для данного процессора примитивы машинные команды — такой процесс называется декодированием.
Далее декодированные команды поступают на исполнительные блоки процессора, выполняются, а результат записывается в оперативную память. Процесс выборки инструкций из кэша, их декодирование и продвижение к исполнительным блокам осуществляются в предпроцессоре Front End , а процесс выполнения декодированных команд — в постпроцессоре, называемом также блоком исполнения команд Execution Engine. Стадии обработки команд принято называть конвейером обработки команд, а рассмотренный нами конвейер является четырехступенчатым.
Заметьте, что каждую из этих ступеней команда проходит за один процессорный такт. Соответственно для примитивного четырехступенчатого конвейера на выполнение одной команды отводится четыре такта. Конечно, рассмотренный нами процессор является гипотетическим.
В реальных процессорах конвейер обработки команд сложнее и включает большее количество ступеней. Причина увеличения длины конвейера заключается в том, что многие команды являются довольно сложными и не могут быть выполнены за один такт процессора, особенно при высоких тактовых частотах. Поэтому каждая из четырех стадий обработки команд выборка, декодирование, выполнение и запись может состоять из нескольких ступеней конвейера.
Собственно, длина конвейера — это одна из наиболее значимых характеристик любого процессора. Итак, разобрав схему гипотетического классического процессора, давайте перейдем к рассмотрению нового ядра. Структурная блок-схема одного ядра процессора на базе микроархитектуры AMD K10 показана на рис.
Структурная блок-схема одного ядра процессора на базе микроархитектуры AMD K10 Изучая структурную схему нового ядра и сравнивая ее со схемой легендарного K8, можно заметить, что общих черт у них больше, чем различий. Собственно, микроархитектура K10 наследует черты микроархитектуры K8, являясь ее логическим развитием. Используется все тот же 12-ступенчатый конвейер, как и в микроархитектуре K8.
Однако, несмотря на внешнее сходство, новое ядро процессора все же претерпело существенные изменения. Итак, расскажем обо всем по порядку. Предвыборка данных и инструкций Как уже отмечалось, в случае классического гипотетического процессора исполнение кода процессором начинается с процесса выборки инструкций и данных из кэша L1.
Однако для того, чтобы инструкции и данные попали в этот кэш, их нужно предварительно туда загрузить из оперативной памяти. Такой процесс называется предвыборкой данных и инструкций из оперативной памяти. В процессорах с микроархитектурой K8 имеются два блока предвыборки Fetch Unit : один для предвыборки данных, а другой для предвыборки инструкций.
Блок предвыборки данных производит предвыборку в кэш L2. В микроархитектуре AMD K10 предвыборка данных осуществляется непосредственно в кэш L1, что, по утверждению представителей компании AMD, способствует повышению производительности, несмотря на вероятность засорения кэша L1 ненужными данными. Кроме того, в блоках предвыборки процессоров с микроархитектурой K10 реализован механизм адаптивной предвыборки данных, позволяющий динамически изменять глубину предвыборки, что позволяет избежать засорения кэша L1 ненужными данными.
Ну и последнее новшество, связанное с предвыборкой данных и инструкций, — это, как уже отмечалось, наличие нового блока предвыборки, расположенного в контроллере памяти. Такой блок анализирует запросы к памяти, предсказывает, какие данные понадобятся процессору, и извлекает их в собственный буфер, не занимая кэш процессора. Выборка из кэша Итак, в соответствии со схемой классического процессора процедура исполнения кода процессором начинается с выборки инструкций в формате X86 и данных из кэша L1.
Иными словами, значение 3900 МГц мы имеем только «на бумаге», а в реальности же скорость новинки колеблется в пределах 3000 - 3500 МГц, что отчетливо видно на графике. Напряжение питания при этом меняется от 1,288 В до 1,384 В. В режиме простоя множитель снижается до значения «х14», тем самым частота опускается до 1400 МГц.
Напряжение при этом составляет 0,864 В. Кэш-память AMD A10-7800 распределяется таким же образом, как и у AMD A10-7850K: кэш-память первого уровня L1: на каждое из 4-х ядер выделяется по 16 КБ для данных с 4-мя каналами ассоциативности и на каждый 2-ядерный модуль по 96 КБ для инструкций с 3-мя каналами ассоциативности; кэш-память второго уровня L2: 2 МБ для каждого 2-ядерного модуля с 16-ю каналами ассоциативности; кэш-память третьего уровня L3: отсутствует. Контроллер оперативной памяти DDR3 работает в 2-канальном режиме и гарантировано поддерживает модули с частотой вплоть до 2133 МГц.
В краткосрочной перспективе, по крайней мере, поддержка HSA не является достаточно распространенной, чтобы сделать ее основной популярностью для основных пользователей и бюджетных игроков - для тех пользователей, которым нынешние APU от AMD подходят больше всего. Производительность процессора Прежде чем мы перейдем к результатам тестов A10-7800, помните, что чип может быть настроен на мощность 45 или 65 Вт, во многом как A8-7600 ближе к среднему. Это важное улучшение, даже если вы не планируете работать на более низких настройках, поскольку A10-7850K, который, как мы увидим, лишь немного быстрее, имеет номинальную расчетную тепловую мощность TDP 95 Вт.
Но, как мы уже говорили ранее, в большинстве задач, ориентированных на ЦП, чип AMD отстает от более дешевых чипов Intel Core i3, которые можно было купить примерно за 125 долларов на момент написания этой статьи. Также заметка о наших испытательных стендах. Мы протестировали все чипы, которые сравниваем Kaveri A10-7800 с Windows 8.
Мы также протестировали чипы Intel с той же оперативной памятью, но только на самой быстрой и более низкой скорости, официально поддерживаемой этими чипами. В Cinebench 11. А последнее поколение A10-6800K делает чуть лучше, чем новый чип, который мы здесь рассматриваем.
Медиа-конверсионные тесты Затем мы перешли к нашим тестам по анализу мультимедиа, в которых мы увидим, как выглядит повышение производительности в реальных сценариях, включающих обработку аудио, видео и графических файлов. В этом временном тесте немного замедляется тактовая частота A10, как и базовая архитектура Bulldozer, которая всегда, сравнительно говоря, боролась с однопоточными рабочими нагрузками. A10-7800 отстает от A10-7850K, но отстает от процессоров Intel Core i3 и i5, и медленнее, чем A10-6800K предыдущего поколения.
Затем мы подвергли A10-7800 тестам преобразования видео и редактирования фотографий, используя еще два компонента многоядерного программного обеспечения. Как обычно, энергосберегающий A10-7850K был чуть быстрее. Для пробного редактирования фотографий мы запустили оригинальный Adobe Photoshop CS6 который также использует несколько ядер и подвергли наше тестовое изображение в Photoshop ряду из 11 фильтров, запускаемых последовательно через файл Actions… В этом тесте A10-7800 опередил A8-7600, даже при работе на более низком 45-ваттном TDP.
Но новый чип A10-7800 вновь оказался на несколько секунд позади последнего поколения A10-6800K и финишировал более чем на минуту позже, чем Intel Core i3-4130. В целом, производительность процессора для A10-7800 не совсем потрясающая. Но он достаточно близок к более дорогому и энергоемкому A10-7850K, чтобы сделать последний чип менее ценным, если вы не планируете разгон и не беспокоитесь о мощности или теплопроизводительности.
И на этом фронте, Kaveri A10, безусловно, более впечатляющим. Производительность графики Мы начали наше графическое тестирование с версии 3DMark от Futuremark, в частности, ее высокопроизводительного субтеста Fire Strike 2013 года, который предназначен для измерения общих графических возможностей системы. A10-7800 доминировал над большинством других чипов здесь, не отставая от более дорогого A10-7850K… В тесте графической подсистемы, который пытается отделить графические возможности от других отличий компонентов, A10-7800 почти удвоил счет более дорогого Core i5-4570, в то же время значительно опередив A10-6800K предыдущего поколения, который сам по себе был только немного опередил более новый A8-7600 на базе Kaveri.
И все они обеспечивают воспроизводимую частоту кадров при 1080p и высоких настройках. Имейте в виду, однако, что это старая игра. Как мы увидим, частота кадров значительно ниже при использовании более нового и требовательного кода.
Переключение на DirectX 11, особенно на Aliens Vs. Тест игры Predator, частота кадров резко упала… Опять же, тем не менее, A10-7800 работал намного лучше, чем встроенная графика на любом чипе Intel. Но ни одна из частот кадров здесь не воспроизводилась при высоких настройках.
Производительность Исходя из рабочих частот, A10-7300 обеспечивает быстродействие на уровне Intel Core i3-4100U Haswell. Производительности вполне достаточно для рутинных задач вроде работы в офисных приложениях или браузере и просмотра видео. Архитектура GCN 1. Интерфейс программирования OpenCL позволяет использовать ресурсы видеокарты для общих не графических вычислений например, в Adobe Photoshop.
Долгожданные процессоры с микроархитектурой AMD K10
Гибридный процессор AMD А10-7800 тестировался в штатном режиме и при максимальном разгоне, а также энергосберегающем режиме при ограничении TDP до 45 Вт. Летом этого года компания AMD официально представила новые гибридные APU, которые пополнили семейство Kaveri. В этой статье мы подробно рассмотрим APU AMD A10-7800. хоть и старый, но всё ещё можно юзать. Процессор AMD A10 7800 как по мне показался довольно хорошим для своего времени, но я думаю не стоит покупать его так как уже существует более хорошие варианты покупок. Гибридный процессор AMD А10-7800 тестировался в штатном режиме и при максимальном разгоне, а также энергосберегающем режиме при ограничении TDP до 45 Вт.
Au1550 ™ - Защищенный сетевой процессор AMD Alchemy™ от фирмы AMD
Барселона -- это провал! Ее ждали уже полгода, а они все тянули и тянули... И вот -- дождались! В пятницу нам на ней сделали наши тесты...
Первый — за графику отдувается только камень и встроенный GPU. К сожалению, проверить наших подопечных под разгоном не получилось. Два приложения — WinRAR 4. Ну и, наконец, четыре игры: Aliens vs. Прогоняли мы их в разрешениях 1280х1024, 1680x1050 и 1920х1080.
Параметры графики варьировались от минимальных до максимальных, анизотропная фильтрация и антиалиазинг были отключены. Итоги Слепо перечислять тут все получившиеся циферки не будем, под них и так отведена целая страница по соседству, лучше просто подведем итоги. Для начала надо поздравить AMD.
Также источник раскрыл новые технические данные о процессорах с кодовым названием Raphael. Количество ядер и частоты пока не уточняются, однако можно предположить, что новинки получат прирост и в этом плане. Косвенно на это может указывать сравнение размеров Raphael и Alder Lake.
В то же время в бенчмарке 3DMark 06 преимущество A10-5800K над A8-3850 оказалось куда более заметным 9396 очков против 6223 очков и, вероятно, реализовано за счет гораздо более быстрой графики в APU Trinity.
A10-7850K: технические характеристики и тесты
Очень подозрительная информация как по содержанию, так и по сравниваемым продуктам. Если говорить чисто про производительность, то главным конкурентом новых процессоров Intel является пресловутый i9-9900KS. Смешным окажется положение, если новые топовые модели уступят предыдущей. Сдают свои же: производители материнских плат Z490 уже дали понять, что их продукты готовы к выходу за 250 Вт, на данный момент это рекомендованная величина для работы 10900K на заявленных мощностях. Заявленные требования TDP не превышают 125 Вт, но вызывают сомнение — скорее всего, после знакомства с перечнем реальных показателей, Грета Тунберг устроит против Intel крестовый экопоход.
А вот шестиядерный i5-10400F без видеоядра действительно может стать серьезной заявкой на борьбу против Ryzen 5 3600 как по цене, так и по потенциальной скорости. В гонку с противником подключится и i3-10100, почти равный по характеристикам Ryzen 3 3300X.
AMD запускает Ryzen 7 5700 по цене 175 долларов, что почти вдвое ниже стартовой цены 5700G, когда он вышел в 2021 году. Ryzen 5 5600GT — немного более быстрая версия 5600G. AMD предлагает 5600GT по очень привлекательной цене — 140 долларов. Ryzen 5 5500GT — это версия 5600GT с немного более низкой тактовой частотой и еще более низкой ценой — 125 долларов! Все 4 новых процессора Socket AM4, анонсированные сегодня, должны появиться в магазинах с 31 января.
Это мобильный четырехъядерный чип, позволяющий обрабатывать до восьми потоков данных одновременно благодаря технологии Hyper-threading. Одно ядро нового Core i7 для ноутбуков набирает в Geekbench более 5,5 тысяч баллов.
Это сопоставимо с результатами 12-ядерного AMD Ryzen 9 3900X, который работает на более высоких частотах, имеет значительно большее тепловыделение и предназначен для настольных компьютеров. В зависимости от выбранной конфигурации системы его ядра показывают результат от 5 до 6,5 тысяч баллов, однако без разгона «планку» в 5 500 они берут с трудом.
В то же время в бенчмарке 3DMark 06 преимущество A10-5800K над A8-3850 оказалось куда более заметным 9396 очков против 6223 очков и, вероятно, реализовано за счет гораздо более быстрой графики в APU Trinity.
Обзор и тестирование процессора AMD A10-7800
Altra Max будет выпускаться под брендом Ampere — это компания Джеймс, которую она основала сразу после ухода из Intel. В ассортименте самой Intel на 19 марта 2021 г. По информации портала Golem. В настоящее время это почти самая современная технология — чипы AMD сейчас 7-нанометровые, а Intel остается на 10 нанометрах. В новинках Ampere используется архитектура ARM. Впервые о линейке Altra Max стало известно в августе 2020 г. Это своего рода продолжение серии Altra, дебютировавшей, как сообщал CNews, в марте 2020 г. Ampere Computing полное название компании была основана в 2017 г.
Для процессора будет нужно качественное охлаждение потому, что тепловая мощность доходит до 65 Вт. Температура при загруженности может составлять 713 градусов. Процессор устанавливается на платы с разъемом Socket FM2.
Следует также отметить присутствие встроенного видеоадаптера Radeon HD 7660D. Тактовой частоты 3400 МГц хватит для современных задач поставленных перед ПК. А новый режим Turbo Core обеспечит предельную производительность процессора заметно повысив частоту от 3400 до 4000 мегагерц.
Разница в быстродействии Kaveri и Haswell, имеющих одинаковое количество вычислительных ядер и работающих на одной и той же тактовой частоте, — примерно двукратная. Иными словами, внедрение компанией AMD очередной версии своей микроархитектуры ничего не меняет, и с точки зрения вычислительной производительности чётырёхъядерные Kaveri могут рассматриваться лишь в роли конкурентов двухъядерных процессоров Core i3. Но не будем спешить с окончательными выводами, и посмотрим, как обстоит дело с производительностью вещественночисленного блока FPU. Здесь преимущество Kaveri над Richland на одинаковой тактовой частоте составляет в среднем 6-7 процентов. Всё это наглядно доказывает, что процессоры семейства Kaveri с точки зрения вычислительной x86-производительности интересны не более чем их предшественники. Что бы ни говорила AMD о сделанном микроархитектурном рывке и о возможности сопоставления новинок с четырёхъядерниками конкурента, все такие заявления разбиваются о суровую реальность.
Впрочем, о практической производительности Kaveri в общеупотребительных приложениях мы ещё поговорим ниже, а пока давайте обсудим то, что у AMD получается гораздо лучше x86-ядер — встроенный графический ускоритель. Графическое ядро Spectre Интегрированное графическое ядро процессоров Kaveri, получившее кодовое имя Spectre, также как и вычислительные ядра, обновило свою архитектуру. Это означает, что интегрированный в Kaveri GPU по своим возможностям приведён в соответствие с современными видеоускорителями: он основывается на той же архитектуре, что и видеокарты AMD семейства Volcanic Islands. Конечно, количество шейдерных процессоров в Spectre по сравнению с флагманскими видеокартами Hawaii значительно уменьшено, но, тем не менее, встроенный в Kaveri графический ускоритель относится к классу Radeon R7 и поддерживает все современные программные интерфейсы, включая DirectX 11. Никаких принципиальных изменений при переносе архитектуры GCN из видеокарт в гибридные процессоры сделано не было, поэтому основным структурным элементом графики остались вычислительные кластеры Compute Unit , имеющие по 64 совместимых со стандартом IEEE 2008 шейдерных процессора, массив которых наделён четырьмя векторными и 16 текстурными блоками. В максимальной конфигурации графическое ядро Kaveri может содержать до восьми таких вычислительных кластеров, плюс геометрический сопроцессор и до восьми блоков растровых операций, способных обрабатывать до 8 пикселей за такт или до 32 пикселей — в режиме без цвета. Таким образом, суммарно графическое ядро Kaveri может иметь до 512 шейдерных процессоров, то есть по этой характеристике новый APU находится где-то между очень неплохими видеокартами среднего уровня Radeon R7 250 и Radeon R7 250X. Однако следует напомнить, что игровое быстродействие встроенной в процессоры графики во многом ограничивается пропускной способностью шины памяти, а не мощностью шейдерных процессоров видеоядра. Поэтому, в действительности, производительность Spectre всё же ниже, чем у 100-долларовых дискретных видеокарт.
Впрочем, помимо интерфейса памяти, GPU из процессоров Kaveri по сравнению со своими дискретными собратьями не имеет никаких других архитектурных ограничений. Так, Spectre обрабатывает и растеризует до одного геометрического примитива за каждый такт, имеет увеличенную кэш-память для хранения параметров примитивов и улучшенную производительность геометрических шейдеров и аппаратной тесселяции, для чего в GCN сделаны улучшения в буферизации данных. Однако главная особенность Kaveri, на которую особенно напирает AMD, это — возможность использования ресурсов графического ядра для вычислений с поддержкой модели разделяемой с x86-ядрами оперативной памяти. Для этой цели в видеоядре в полном объёме присутствует пул из восьми независимых движков асинхронных вычислений, которые могут работать параллельно с графическим командным процессором и обслуживать до восьми очередей команд каждый. Эти движки имеют прямой доступ к кеш-памяти и контроллеру памяти процессора, за счёт чего и реализуется набор технологий, упрощающий организацию гетерогенных вычислений HSA. Фактически, движки асинхронных вычислений способны работать как отдельные вычислители, и это позволяет AMD на полном серьёзе представлять Spectre как дополнительные восемь процессорных ядер. Для этого компания оперирует собственным определением вычислительного ядра — AMD представляет его как программируемый аппаратный блок, способный выполнять в своём собственном контексте независимо от других ядер по крайней мере один процесс в виртуальной памяти. Но тут, конечно, нужно понимать, что такие вычислительные квазиядра из GPU требуют собственный программный код и могут быть задействованы лишь в специально разработанном программном обеспечении, осуществляющим параллельную обработку данных. Говоря о смежных возможностях графического ядра Kaveri, нельзя не упомянуть и о том, что в нём, как и в современных видеокартах, присутствует звуковой сопроцессор TrueAudio, предназначенный для создания аппаратно ускоряемых динамических пространственных звуковых эффектов.
Кроме того, как и раньше, в процессоре сохранились выделенные движки VCE и UVD для кодирования и декодирования видеоконтента высокого разрешения. При этом их возможности в очередной раз расширены. А номер версии UVD возрос до четвёртого: здесь улучшилась устойчивость при обработке видеопотока с ошибками. Немного о маркетинге: HSA Раньше было принято ругать маркетинговый департамент компании AMD, который из рук вон плохо справлялся с продвижением новинок и новых технологий. Теперь же ситуация кардинально изменилась, маркетинг AMD умудряется даже пробуждать в пользователях интерес к тем возможностям, которых ещё нет в реальности. Именно такая история произошла и с HSA: в процессоры Kaveri всего лишь заложена аппаратная база для общего доступа к памяти всех типов ядер и вычислительных, и графического , но AMD взялась рьяно продвигать новую технологию, демонстрируя впечатляющие графики и обещая гигантский рывок в производительности. Однако на самом деле никакого HSA пока нет. Для внедрения и использования HSA-возможностей помимо аппаратной совместимости требуется создание программной инфраструктуры, а её не существует даже в самом минимальном виде. В первую очередь, AMD пока не выпустила HSA-совместимый драйвер, и поэтому говорить о каком-то общедоступном программном обеспечении сильно преждевременно.
Конечно, программы, использующие HSA-возможности, в конце концов, появятся, но произойдёт это, очевидно, не завтра или послезавтра, а значительно позже — тогда, когда процессоры семейства Kaveri, скорее всего, будут уже неактуальны. Сейчас же поддержка HSA в Kaveri может быть интересна лишь разработчикам программ, которые могут получить в своё распоряжение аппаратное средство для отладки своих перспективных продуктов. Все же существующие на данный момент приложения с поддержкой гетерогенных вычислений пользуются программным интерфейсом OpenCL 1. Поэтому с точки зрения обычного пользователя Kaveri — это ровно такой же по возможностям гибридный процессор, как и его предшественники поколения Richland. Тем не менее, учитывая заложенную в Kaveri аппаратную поддержку HSA, пару слов о ней всё-таки следует сказать. Однако не забывайте, здесь мы говорим лишь о том, как всё должно будет работать в отдалённой перспективе. Итак, основная идея гетерогенных вычислений заключается в том, что многие задачи могут выполняться на параллельных потоковых процессорах графических ядер быстрее и с меньшими затратами энергии, нежели на скалярных x86-ядрах. Комбинируя и те, и другие ресурсы, можно получить универсальную аппаратную базу для эффективного выполнения широкого спектра задач. Однако на ранних стадиях процессоры с гетерогенным дизайном не могли завоевать широкую популярность.
Проблема заключалась в том, что для их использования нужны были специальные программы, создание которых вызывало у разработчиков большие трудности. Технологии же семейства HSA способны с одной стороны существенно упростить программирование алгоритмов, работающих в гетерогенной среде, а с другой — увеличить их производительность. В её рамках новые гибридные процессоры могут получить простой путь доступа ко всей системной памяти вне зависимости от того, какой частью APU сгенерирован соответствующий запрос. Иными словами, любое из ядер Kaveri вне зависимости от того, ядро ли это с x86-архитектурой или графическое ядро имеет равноценный и простой доступ непосредственно в кэш и системную память. Аппаратная реализация hUMA в Kaveri обеспечивает когерентность кеш-памяти и даёт графическому ядру возможность работать не только с физической, но и с виртуальной памятью в рамках 32-гигабайтного адресного пространства. Иными словами, hUMA убирает любые ограничения и любое разделение памяти на системную и видеопамять. Сейчас вся вычислительная нагрузка так или иначе проходит через процессорные ядра, в том числе и та, которая предназначена для решения на графическом ядре. За отправку задач на GPU и контроль их исполнения в любом случае отвечают x86-ядра, что вносит дополнительные задержки. Новый же подход к организации вычислений, hQ, разрешает графическому ядру взаимодействовать с приложением и другими ядрами не под управлением CPU, а напрямую, уравнивая ядра с различной природой в своих правах.
Иными словами, hQ стирает грани между ролями CPU и GPU, уменьшает задержки и упрощает параллельную обработку данных разнородными ядрами. С теоретических позиций HSA выглядит многообещающе. AMD рассчитывает, что использование этой технологии станет обычным делом в приложениях для воспроизведения и обработки изображений и видео; в интерфейсах нового поколения, основанных на распознавании голоса, жестов и лиц; а также в играх, где HSA-возможности могут задействоваться при физических расчётах или при моделировании искусственного интеллекта. Осталось только дождаться появления соответствующих программ, использующих оптимизированный под HSA интерфейс OpenCL 2. Полупроводниковый кристалл Kaveri и новый техпроцесс Рассмотрев составные части CPU и GPU гибридного процессора Kaveri, логично перейти к комплексному знакомству с ним. И вот на этом уровне, к сожалению, AMD может порадовать своих поклонников не слишком многим. Kaveri, как и их предшественники Trinity и Richland, собраны на базе двух двухъядерных процессорных модулей Steamroller и GPU. Иными словами, гибридные процессоры нового поколения сохраняют в максимальной конфигурации четырёхъядерный дизайн и принципиально превосходят предшественников лишь по оснащённости интегрированного графического ядра Radeon R7. Оно не только несёт новую архитектуру GCN 1.
На фоне того, что улучшений в микроархитектуре Steamroller не так много, процессоры Kaveri стали ещё более графически-ориентированными. Если в Richland на долю x86-части приходилось 58 процентов транзисторного бюджета, то в новом Kaveri эта доля снизилась до 53 процентов. Но в целом новый APU стал гораздо сложнее своего предшественника. Прошлые версии гибридных процессоров AMD состояли из примерно 1,3 млрд. А это даже больше количества транзисторов в процессорах Intel Haswell с графикой GT3, которое ограничивается величиной 1,8 млрд. Так что Kaveri выступают прекрасной иллюстрацией того, что высокая сложность полупроводникового кристалла не обязательно конвертируется в высокую производительность, а вот производственные проблемы создаёт заметные. Для массового выпуска Kaveri компания AMD прибегла к более современному техпроцессу с 28-нм нормами. Производственным партнёром была выбрана GlobalFoundries, сумевшая перенастроить своё оборудование для выпуска APU. Новый техпроцесс был специально оптимизирован для сверхплотного размещения транзисторов на кристалле и получил название SHP Super High Performance.
При этом от технологии SOI было решено отказаться. В результате полупроводниковый кристалл Kaveri удалось разместить на площади 245 мм2, то есть по физическому размеру он почти эквивалентен 32-нм кристаллу процессоров Richland. Полупроводниковый кристалл Kaveri Однако обратной стороной сверхплотного размещения транзисторов стала необходимость снижения их рабочей частоты. То есть были выше примерно на 10-15 процентов. Впрочем, как показывает практика, с выпуском энергоэффективных Kaveri всё оказалось тоже не так просто, и пока модели с типичным тепловыделением меньше 95 Вт остаются недоступны. Обе модели имеют по четыре x86-ядра, но различаются частотами. Технология Turbo Core способна при низкой нагрузке повышать эти величины до 4,0 ГГц в первом случае и до 3,8 ГГц — во втором. Кроме того, процессоры различаются и количеством шейдерных процессоров. Их максимальное количество заложено лишь в модели A10-7850K, которая обладает 512 шейдерами.
Во второй же модели из ряда A10, A10-7700K, возможности GPU урезаны на четверть: число шейдерных процессоров сокращено до 384, то есть до уровня Richland. Частота графического ядра у обеих моделей Kaveri установлена в 720 МГц. Поэтому на деле получилось так, что новый процессорный разъём введён в употребление лишь с целью искусственного обновления парка материнских плат. Все такие платы основываются на новых наборах логики семейства Bolton A88X и A78 , которые по спецификациям практически не отличаются от своих предшественников Hudson A85X и A75. Но и то и другое, на самом деле, идёт от самих процессоров Kaveri, в которых AMD обновила контроллер шины PCI Express и подтянула параметры контроллера памяти. Есть лишь одна новая возможность, появившаяся непосредственно в наборах логики A88X и A78. Его характеристики в сравнении с флагманским гибридным процессором Richland выглядят следующим образом: Как видно из таблицы, старшая модель линейки Kaveri дороже A10-6800K, но при этом предлагает не слишком много преимуществ. Фактически, она лучше лишь с точки зрения мощности GPU, который не только переведён на новую архитектуру, но и располагает увеличенным количеством шейдерных процессоров. Правда, ограничивать графическую производительность A10-7850K будет не мощность графического ядра, а пропускная способность памяти.
С производительностью же вычислительной части, очевидно, дело будет обстоять несколько хуже. Мало того, что новая микроархитектура Steamroller даёт лишь совсем небольшое улучшение в количестве исполняемых за такт инструкций, так ещё и частоты A10-7850K ощутимо ниже, чем у его предшественника. При этом AMD не стесняется устанавливать на свою новинку цену на уровне младших моделей Core i5, что, исходя из всего сказанного выше, кажется слишком много. Впрочем, может быть мы что-то упускаем из вида? Согласно показаниям диагностической утилиты CPU-Z, A10-7850K при полной нагрузке на все ядра работает с частотой 3,7 ГГц при номинальном напряжении 1,328 В, которое почти не отличается от привычного напряжения питания гибридных процессоров AMD прошлых поколений. Технология Turbo Core работает у Kaveri вполне ожидаемо, поднимая его частоту до 4,0 ГГц при нагрузке на один из двух модулей Steamroller. Приятно, что AMD в Kaveri смогла окончательно разобраться с формулой частоты CPU, и в процессе тестирования при реальной процессорной нагрузке мы не сталкивались со снижением частоты ниже штатных 3,7 ГГц — раньше, как вы помните, такие ситуации возникали. В моменты же простоя при работе энергосберегающих технологий частота A10-7850K падает до 1,7 ГГц. Интегрированный северный мост процессора работает на более низкой, нежели сам CPU, частоте.
Она у рассматриваемой модели составляет 1,8 ГГц. На коробке обозначено, что процессор относится к серии Black Edition, и это правда — коэффициенты умножения у него разблокированы, так что простой разгон как CPU-, так и GPU-части вполне возможен. К сожалению, кулер этот нельзя назвать сколь-нибудь подходящим для серьёзных нагрузок. На максимальной скорости, достигающей 4100 оборотов в минуту, его вентилятор ведёт себя шумновато, да и вся эта конструкция справляется с охлаждением A10-7850K только при его работе в штатном режиме. Как мы тестировали Процессор AMD A10-7850K, выступающий главным героем настоящего обзора, мы сравнивали не только с его предшественником, но и с конкурирующими предложениями компании Intel, продающимися за сравнимый бюджет. А из интеловских CPU нам пришлось выбрать сразу два варианта Haswell: самый быстрый на данный момент двухъядерник Core i3-4340 и младший четырёхъядерник Core i5-4430.
Это первое, что приходит на ум для этого ВСУ. Его усовершенствованный производственный процесс, его высокие частоты, рабочее напряжение и низкая температура дают ему большой запас для этого, во многих случаях получая более чем хорошие показатели для сегмента, для которого он предназначен. Конечно, нам не нужна материнская плата последнего поколения, лучший радиатор и лучшие запоминающие устройства, потому что этот A10-6800K с напряжением менее 1, 43 В позволил нам достичь 4700 МГц и интегрированной графики до 1013 МГц без необходимости подавать дополнительное напряжение, немыслимые фигуры в высшей модели предыдущего поколения.
В основном, мы также выделяем контроллер памяти с частотой 2133 МГц, что дает ему очень хороший прирост графики по сравнению с прошлым поколением, A10-5800K, где мы видим, что он почти достигает цифр разгона, являясь этим стандартным.
Лучше, чем было
- Представлены флагманские процессоры AMD A10-7890K и Athlon X4 880K - MegaObzor
- Обзоры электроники с AMD A10-7300 :
- Видео: AMD Radeon R7 Graphics in APU A10-7800: gameplay в 23 популярных играх (Апрель 2024)
- AMD A10-5700 - обзор процессора. Тесты и характеристики | Hitesti
AMD A10-7800 против AMD A10-5800K
Обзор процессора для ноутбуков AMD A10-9620P тестирование в последних компьютерных играх и синтетических тестах. Главная Новости Процессоры Процессор AMD A10-4600M – подробности о мобильном представителе Trinity. Benchmarks, information, and specifications for the AMD A-Series A10-6800K processor (CPU). Тест и обзор AMD A10 | Подробно о GPU (VLIW4 больше VLIW5).
AMD запустила производство процессоров на архитектуре Zen 5 со встроенным ИИ
The following table shows features of AMD's processors with 3D graphics, including APUs (see also: List of AMD processors with 3D graphics). Характеристики всех моделей серверных процессоров Barcelona представлены в Долгожданные процессоры с микроархитектурой AMD K10 1. Процессор AMD a10-4600m для ноутбука. Линейка процессора: A10 Тип: Процессор Архитектура: Trinity Сокет процессора: Socket FS1 Базовая частота, ГГц: 2.3. Рейтинг процессоров AMD 2023 года ТОП–10 лучших процессоров AMD Какой процессор АМД лучше для игр? Например, по итогам 2022 года NVIDIA заняла большую часть рынка видеокарт, тогда как AMD ушла ниже 10%.
Обзор процессора AMD A10-7850K (Kaveri): шаг вперёд, два шага назад?
Поддерживаемым процессорами разъемом, по всей видимости, станет LGA 1200. Intel снова поменяла сокеты, так что без новой материнской платы любителям топового железа не обойтись. На серии K появится возможность отключать Hyper-threading. Главной фишкой можно назвать систему Thermal Velocity Boost и управляемый ею динамический разгон, зависящий от мощности системы охлаждения ПК. Вероятно, без TVB и качественного подхода к разгону новые процессоры не обгонят ни предыдущее поколение, ни основных конкурентов.
Не очень убедительная заявка Intel четко дает понять только одно: производитель делает ставку на оверклокинг. Остаемся ждать Meteor Lake.
Даже у младшего A8-7600 явно больше игровых возможностей, чем у чипов Intel. Также обратите внимание, что при снижении A10-7800 с 65 до 45 Вт наблюдается заметное, хотя и не значительное падение игровой производительности.
При условии, что вы можете обеспечить достаточное охлаждение или в порядке с производительностью чипа при 45-ваттном TDP , A10 может стать основой довольно грозного тонкого мультимедийного и игрового ПК. AMD Dual Graphics Одним из потенциальных преимуществ выбора AMD APU является то, что вы можете комбинировать интегрированную графику на чипе со специальной видеокартой, независимо от того, покупаете ли вы эту карту при создании системы или месяцами или годами в будущем. AMD называет этот тип устройства AMD Dual Graphics и рекомендует сопрягать чипы A10 с Radeon R7 250, картой среднего класса, стоимость которой в настоящее время составляет около 80 долларов. Когда мы в последний раз посещали Dual Graphics, у нас было чертовски много времени, чтобы все заработало.
И как только мы это сделали, производительность была заметно нестабильной, предположительно вызванной незрелостью драйверов в свете сложного процесса, позволяющего двум разным банкам графических ядер работать синхронно друг с другом. Однако на этот раз, хотя настройка по- прежнему была не совсем простой и интуитивно понятной, несколько уколов в BIOS, несколько щелчков мыши в AMD Catalyst Control Center и перезагрузка просто чтобы убедиться, что все работает правильно , и мы Dual Graphics была запущена и работает. Запустив Heaven 2. И хотя производительность не всегда была гладкой мы заметили случайное мгновенное падение производительности или разрыв экрана , общий опыт кажется намного лучше, чем наш опыт с технологией ранее весной 2014 года.
Тем не менее, как и для любой технологии с двумя графическими процессорами, прирост производительности, который вы получите, будет варьироваться иногда очень сильно от одной игры к другой. Это, в сочетании с периодически возникающими проблемами с производительностью Dual Graphics, по-прежнему означает, что если вы можете себе это позволить, вам, вероятно, стоит просто сэкономить на более мощной выделенной видеокарте. Такие карты, как Radeon R7 260X, в настоящее время продаются всего за 90 долларов после скидок. Мы видим двойную графику в качестве временного промежутка только для людей с очень ограниченным бюджетом.
Если вы не непреклонны в разгоне и не заботитесь о потреблении энергии и тепле, это лучше, чем более энергоемкий и дорогой A10-7850K. Несмотря на это, предлагаемая цена в 155 долларов немного выше, чем хотелось бы, учитывая, что A8-7600 все еще довольно впечатляет в игровой сфере и должен быть доступен одновременно с A10-7800, примерно на две трети. Кроме того, такие чипы, как Intel Core i3-4130, можно приобрести примерно за 125 долларов, и они обеспечивают лучшую производительность процессора для большинства задач, хотя вы получите только половину графического потенциала. Если вас не волнует игра, то чипы Intel в этом ценовом диапазоне все же лучше купить.
И мы считаем, что A8-7600 по-прежнему представляет собой хорошее место между производительностью и стоимостью в текущем стеке чипов AMD Kaveri особенно сейчас, когда он действительно должен быть доступен для покупки. Но если вы хотите создать бюджетный ПК для игр и обычных вычислений, и вы не были достаточно впечатлены результатами тестов чипа A8-7600, A10-7800, безусловно, обеспечивает более высокую производительность. Вам придется заплатить немного больше за эту дополнительную графику и нагрузку на процессор, но A10-7800 обеспечивает почти все возможности высокопроизводительного A10-7850K с более низкими требованиями к мощности и настраиваемым TDP. Опять же, A10-7800 не разблокирован для разгона.
Но в этих ценовых категориях, с дополнительными деньгами и временем, которые вам, вероятно, придется потратить, чтобы добиться значительного, стабильного разгона, вам, вероятно, лучше потратить эти деньги, переходя на платформу более высокого класса с выделенной видеокартой, будь то это чип AMD серии FX или процессор Intel Core i3 или Core i5. Получение хорошего разгона также сопряжено с большой удачей, поскольку разгоняемость варьируется от образца к прибору. Это немного лотерея. Существует большой потенциал в будущем, когда чипы AMD Kaveri смогут лучше распределять рабочие нагрузки между процессором и графическим процессором.
Но неясно, когда большинство пользователей смогут извлечь существенную выгоду из возможностей последних чипов AMD на этом фронте, без необходимости искать несколько программ и плагинов, которые используют это преимущество.
Тем не менее, посчитать, что Kaveri для нас совсем неинтересны, было бы неверным. В этих процессорах нашла применение очередная версия микроархитектуры Bulldozer — Steamroller, графическое ядро переведено на дизайн GCN, а также реализована глубокая гетерогенность, базирующаяся на спецификации HSA Heterogeneous System Architecture. Несмотря на то, что все эти нововведения не могут сделать новые процессоры привлекательными для игроков или энтузиастов при всём желании, посмотреть на них в подробностях всё же любопытно. По крайней мере, мы сможем получить представление о том, в каком направлении движется AMD, и можно ли рассчитывать, что эта компания когда-нибудь восстановит разработку процессоров для производительных персональных компьютеров в числе своих первоочередных задач. С начала этого года на рынок поставляется две модели процессоров Kaveri для настольных компьютеров — A10-7850K и A10-7700K. Нельзя сказать, что их поставки носят широкомасштабный характер, но, тем не менее, найти такие процессоры в магазинах не составляет большого труда. Мы решили познакомиться с новинкой на примере самой старшей модели: она обладает максимальными тактовыми частотами и содержит встроенное графическое ядро с наибольшим числом шейдерных процессоров. Иными словами, именно эта модификация представляет собой самый быстрый современный процессор AMD.
В теории, существует и третья, достаточно любопытная 65-ваттная энергоэффективная модель Kaveri в десктопном исполнении, A8-7600. Но от её тестирования нам пока пришлось отказаться, так как AMD сорвала её поставки в розничную сеть, и она всё ещё остаётся недоступной для обычных пользователей. Микроархитектура Steamroller Новая микроархитектура вычислительных ядер Kaveri — это, пожалуй, одно из самых интригующих обновлений, привносимых этим гибридным процессором. После того как предыдущие версии производительной микроархитектуры AMD, Bulldozer и Piledriver, не смогли сравниться по быстродействию с интеловскими Core, улучшение эффективности старших процессоров AMD стали связывать с новой микроархитектурой Steamroller. В ней разработчики обещали постараться ликвидировать главный недостаток «больших ядер» AMD — низкую однопоточную производительность. Впрочем, даже если микроархитектура Steamroller и представляет собой значительный шаг вперёд по сравнению со своими предшественниками, толку от этого мало. AMD отказалась от её внедрения в производительные многоядерные процессоры, и Steamroller будет использоваться исключительно в четырёхъядерных Kaveri, которые позиционируются компанией как недорогие интегрированные решения. Тем не менее, сама AMD обещает, что на той же самой тактовой частоте новая микроархитектура может предложить примерно 20-процентное улучшение производительности по сравнению с Piledriver. Правда, при этом из-за усложнения дизайна и его мобильной ориентации максимальные тактовые частоты для Steamroller стали ниже, поэтому реальный прирост в скорости работы процессоров, построенных на новой микроархитектуре, оказался совсем небольшим.
И здесь не помогло даже внедрение более современной 28-нм производственной технологии. В итоге, Steamroller следует воспринимать как эволюционное развитие предыдущих микроархитектур Bulldozer и Piledriver — к такому выводу нетрудно прийти, если смотреть и на производительность, и на внутреннее строение. AMD продолжает своё движение по пути оптимизации базовой микроархитектуры небольшими шажками, не затрагивая заложенный c появлением Bulldozer фундамент. Как и ранее, в Steamroller применена всё та же процессорная структура с двухъядерными сплотками и разделяемым 2-мегабайтным кешем второго уровня на каждый такой модуль. Нет никаких нововведений и в системе команд: поддержки AVX2 инструкций в новой микроархитектуре так и не появилось. Основные же изменения коснулись распределения разделяемых между ядрами одного модуля ресурсов. Дело в том, что изначальная концепция процессоров Bulldozer предполагала реализацию достаточно существенного набора функциональных блоков в двухъядерном модуле в единичном экземпляре. К числу таких разделяемых между ядрами узлов относились блоки выборки и декодирования инструкций, блок операций с плавающей запятой и кеш-память. Подобный подход позволял AMD добиться уменьшения сложности полупроводниковых кристаллов и снижения их тепловыделения, что в конечном итоге и позволяло компании создавать многоядерные процессоры, работающие на сравнительно высоких тактовых частотах.
Но обратной стороной такого подхода становилось то, что при многопоточной нагрузке разделяемые ресурсы оказывались узким местом, приводящим к простоям исполнительных устройств и ограничивающим производительность. Как показала практика, наибольшие «заторы» возникали на этапе декодирования инструкций, и в Steamroller разработчики AMD решили исправить этот недостаток и удвоить количество декодеров. Теперь каждое из ядер, входящих в двухъядерный модуль, получило собственный независимый декодер, способный обрабатывать до четырёх x86-инструкций за такт. К сожалению, первоначальная выборка при этом осталась в сфере ответственности общего на два ядра функционального узла, эффективность и результативность работы которого инженеры AMD попытались улучшить другими мерами. В частности, совершенствованию подверглись алгоритмы предсказания переходов за счёт роста ёмкости буферов , а также с 64 до 96 Кбайт была увеличена вместимость общего на модуль кэша инструкций первого уровня, степень ассоциативности которого возросла с двух до трёх. При этом следует понимать, что удвоение числа декодеров со всеми смежными мерами — это лишь ликвидация основного бутылочного горлышка микроархитектуры. Ожидать от Steamroller близкого к двукратному увеличения производительности явно не следует: узкие места всё ещё сохранились на этапах выборки и исполнения инструкций, и их частичное устранение намечено лишь в следующей итерации микроархитектуры — Excavator. В Steamroller же к изменениям во фронтальной части исполнительного конвейера добавились лишь некоторые мелкие переделки, которые не оказывают существенного влияния на производительность. Так, была проведена балансировка ролей исполнительных устройств в блоке FPU с целью оптимизации их загрузки, а также оптимизирован интерфейс между кеш-памятью первого и второго уровня, что позволило увеличить скорость перемещения данных.
Некоторые нововведения в Steamroller вообще направлены исключительно на улучшение экономичности. Например, L2-кеш получил деление на четыре области, имеющие независимое питание, что позволяет отключать его по частям, а в декодерах добавилась очередь микроопераций, при наполнении которой основная логика этих блоков также может обесточиваться. К сожалению, вместе с увеличением производительности микроархитектура Steamroller существенно нарастила и свою сложность. Число транзисторов, задействованных в одном двухъядерном модуле, с переходом от Piledriver к Steamroller возросло более чем на 60 процентов. Связано это не только с внутренними изменениями в микроархитектуре, но и с вводом новых автоматизированных методов компоновки полупроводникового кристалла. В итоге, внедрение Steamroller заставило AMD отказываться от своей изначальной идеи — компоновки процессоров из большого числа высокочастотных, но простых ядер. Иными словами, выбранное направление развития микроархитектуры можно расценить и как некоторое изменение её основополагающей парадигмы, что на практике вылилось в нежелание AMD использовать Steamroller в многоядерных процессорах класса FX. Но AMD преподносит Steamroller с большим оптимизмом и говорит о весомости внесённых в микроархитектуру улучшений, не заостряя внимание на том, какой они дались ценой. По данным компании, количество промахов при обращении к L1-кешу инструкций снизилось на 30 процентов, число неправильных предсказаний переходов уменьшилось на 20 процентов, а общая эффективность работы планировщика поднялась на 5-10 процентов.
И всё это в конечном итоге приводит к улучшению загрузки исполнительных устройств примерно на четверть. Обычно мы не принимаем на веру такие заявления производителей. Поэтому, чтобы практически проверить эффективность всех улучшений, сделанных AMD в новой микроархитектуре, мы решили сравнить практическую производительность четырёхъядерных процессоров Richland и Kaveri построенных на микроархитектуре Piledriver и Steamroller соответсвенно при их работе на одинаковой частоте 4,0 ГГц. В качестве средства численной оценки быстродействия были выбраны синтетические бенчмарки из диагностической утилиты Aida64 4. Попутно на тех же диаграммах приводятся и результаты, демонстрируемые в тестах четырёхъядерным процессором Haswell, работающим на аналогичной частоте 4,0 ГГц с отключенной технологией Hyper-Threading. Для удобства восприятия все результаты нормированы по показателям производительности Richland. Картина получается весьма унылая. Несмотря на все старания AMD никакого заметного прироста скорости не видно. Среднее увеличение производительности при переходе от Piledriver к Steamroller составляет не более 10 процентов.
Причём, существуют и случаи, когда производительность новой микроархитектуры ниже, чем у старой. Такая ситуация наблюдается, в частности, в бенчмарке Queen, который фокусируется на выявлении результативности предсказаний переходов и штрафа, возникающего при ошибках в них. А это значит, что заявления AMD об улучшении эффективности входной части исполнительного конвейера, можно подвергнуть сомнению. Наилучшее же увеличение производительности, обеспечиваемое внедрением микроархитектуры Steamroller, наблюдается в бенчмарке хеширования. Здесь для теста используется стандартный алгоритм SHA1 и целочисленные варианты векторных инструкций. Попутно представленная диаграмма позволяет наглядно оценить, насколько AMD со своими микроархитектурами отстала от Intel. Разница в быстродействии Kaveri и Haswell, имеющих одинаковое количество вычислительных ядер и работающих на одной и той же тактовой частоте, — примерно двукратная. Иными словами, внедрение компанией AMD очередной версии своей микроархитектуры ничего не меняет, и с точки зрения вычислительной производительности чётырёхъядерные Kaveri могут рассматриваться лишь в роли конкурентов двухъядерных процессоров Core i3. Но не будем спешить с окончательными выводами, и посмотрим, как обстоит дело с производительностью вещественночисленного блока FPU.
Здесь преимущество Kaveri над Richland на одинаковой тактовой частоте составляет в среднем 6-7 процентов. Всё это наглядно доказывает, что процессоры семейства Kaveri с точки зрения вычислительной x86-производительности интересны не более чем их предшественники. Что бы ни говорила AMD о сделанном микроархитектурном рывке и о возможности сопоставления новинок с четырёхъядерниками конкурента, все такие заявления разбиваются о суровую реальность. Впрочем, о практической производительности Kaveri в общеупотребительных приложениях мы ещё поговорим ниже, а пока давайте обсудим то, что у AMD получается гораздо лучше x86-ядер — встроенный графический ускоритель. Графическое ядро Spectre Интегрированное графическое ядро процессоров Kaveri, получившее кодовое имя Spectre, также как и вычислительные ядра, обновило свою архитектуру. Это означает, что интегрированный в Kaveri GPU по своим возможностям приведён в соответствие с современными видеоускорителями: он основывается на той же архитектуре, что и видеокарты AMD семейства Volcanic Islands. Конечно, количество шейдерных процессоров в Spectre по сравнению с флагманскими видеокартами Hawaii значительно уменьшено, но, тем не менее, встроенный в Kaveri графический ускоритель относится к классу Radeon R7 и поддерживает все современные программные интерфейсы, включая DirectX 11. Никаких принципиальных изменений при переносе архитектуры GCN из видеокарт в гибридные процессоры сделано не было, поэтому основным структурным элементом графики остались вычислительные кластеры Compute Unit , имеющие по 64 совместимых со стандартом IEEE 2008 шейдерных процессора, массив которых наделён четырьмя векторными и 16 текстурными блоками. В максимальной конфигурации графическое ядро Kaveri может содержать до восьми таких вычислительных кластеров, плюс геометрический сопроцессор и до восьми блоков растровых операций, способных обрабатывать до 8 пикселей за такт или до 32 пикселей — в режиме без цвета.
Таким образом, суммарно графическое ядро Kaveri может иметь до 512 шейдерных процессоров, то есть по этой характеристике новый APU находится где-то между очень неплохими видеокартами среднего уровня Radeon R7 250 и Radeon R7 250X. Однако следует напомнить, что игровое быстродействие встроенной в процессоры графики во многом ограничивается пропускной способностью шины памяти, а не мощностью шейдерных процессоров видеоядра. Поэтому, в действительности, производительность Spectre всё же ниже, чем у 100-долларовых дискретных видеокарт. Впрочем, помимо интерфейса памяти, GPU из процессоров Kaveri по сравнению со своими дискретными собратьями не имеет никаких других архитектурных ограничений. Так, Spectre обрабатывает и растеризует до одного геометрического примитива за каждый такт, имеет увеличенную кэш-память для хранения параметров примитивов и улучшенную производительность геометрических шейдеров и аппаратной тесселяции, для чего в GCN сделаны улучшения в буферизации данных. Однако главная особенность Kaveri, на которую особенно напирает AMD, это — возможность использования ресурсов графического ядра для вычислений с поддержкой модели разделяемой с x86-ядрами оперативной памяти. Для этой цели в видеоядре в полном объёме присутствует пул из восьми независимых движков асинхронных вычислений, которые могут работать параллельно с графическим командным процессором и обслуживать до восьми очередей команд каждый. Эти движки имеют прямой доступ к кеш-памяти и контроллеру памяти процессора, за счёт чего и реализуется набор технологий, упрощающий организацию гетерогенных вычислений HSA. Фактически, движки асинхронных вычислений способны работать как отдельные вычислители, и это позволяет AMD на полном серьёзе представлять Spectre как дополнительные восемь процессорных ядер.
Для этого компания оперирует собственным определением вычислительного ядра — AMD представляет его как программируемый аппаратный блок, способный выполнять в своём собственном контексте независимо от других ядер по крайней мере один процесс в виртуальной памяти. Но тут, конечно, нужно понимать, что такие вычислительные квазиядра из GPU требуют собственный программный код и могут быть задействованы лишь в специально разработанном программном обеспечении, осуществляющим параллельную обработку данных. Говоря о смежных возможностях графического ядра Kaveri, нельзя не упомянуть и о том, что в нём, как и в современных видеокартах, присутствует звуковой сопроцессор TrueAudio, предназначенный для создания аппаратно ускоряемых динамических пространственных звуковых эффектов. Кроме того, как и раньше, в процессоре сохранились выделенные движки VCE и UVD для кодирования и декодирования видеоконтента высокого разрешения. При этом их возможности в очередной раз расширены. А номер версии UVD возрос до четвёртого: здесь улучшилась устойчивость при обработке видеопотока с ошибками. Немного о маркетинге: HSA Раньше было принято ругать маркетинговый департамент компании AMD, который из рук вон плохо справлялся с продвижением новинок и новых технологий. Теперь же ситуация кардинально изменилась, маркетинг AMD умудряется даже пробуждать в пользователях интерес к тем возможностям, которых ещё нет в реальности. Именно такая история произошла и с HSA: в процессоры Kaveri всего лишь заложена аппаратная база для общего доступа к памяти всех типов ядер и вычислительных, и графического , но AMD взялась рьяно продвигать новую технологию, демонстрируя впечатляющие графики и обещая гигантский рывок в производительности.
Однако на самом деле никакого HSA пока нет. Для внедрения и использования HSA-возможностей помимо аппаратной совместимости требуется создание программной инфраструктуры, а её не существует даже в самом минимальном виде. В первую очередь, AMD пока не выпустила HSA-совместимый драйвер, и поэтому говорить о каком-то общедоступном программном обеспечении сильно преждевременно. Конечно, программы, использующие HSA-возможности, в конце концов, появятся, но произойдёт это, очевидно, не завтра или послезавтра, а значительно позже — тогда, когда процессоры семейства Kaveri, скорее всего, будут уже неактуальны. Сейчас же поддержка HSA в Kaveri может быть интересна лишь разработчикам программ, которые могут получить в своё распоряжение аппаратное средство для отладки своих перспективных продуктов. Все же существующие на данный момент приложения с поддержкой гетерогенных вычислений пользуются программным интерфейсом OpenCL 1. Поэтому с точки зрения обычного пользователя Kaveri — это ровно такой же по возможностям гибридный процессор, как и его предшественники поколения Richland. Тем не менее, учитывая заложенную в Kaveri аппаратную поддержку HSA, пару слов о ней всё-таки следует сказать. Однако не забывайте, здесь мы говорим лишь о том, как всё должно будет работать в отдалённой перспективе.
Итак, основная идея гетерогенных вычислений заключается в том, что многие задачи могут выполняться на параллельных потоковых процессорах графических ядер быстрее и с меньшими затратами энергии, нежели на скалярных x86-ядрах. Комбинируя и те, и другие ресурсы, можно получить универсальную аппаратную базу для эффективного выполнения широкого спектра задач. Однако на ранних стадиях процессоры с гетерогенным дизайном не могли завоевать широкую популярность. Проблема заключалась в том, что для их использования нужны были специальные программы, создание которых вызывало у разработчиков большие трудности.
Так, со средненьким воздушным кулером 6800K покоряет отметку в 4,7 ГГц, тогда как не всякий 5800K добирался до такой частоты без применения хорошей оверлокерской СО.
Графическое же ядро по-прежнему главенствует на рынке, уделывая встроенную в Ivy Bridge HD 4000 не зря же ATi покупали! В качестве видеопамяти по-прежнему выступает оперативка, которая спеками именно для этой модели процессора рекомендуется шустрая, DDR3-2133, тогда как остальным настольным моделям Richland предписано работать с DDR3-1866. Практика показала, что при разгоне видеоядра скорость RAM начинает хорошо так влиять на показатели. Кстати, об играх. На 6800K можно играть, особенно если довести частоту IGP до гигагерца.
Так, в разрешении 1920 х 1080 играбельны абсолютно все современные игры на средних настройках графики и отключенным сглаживанием, лишь в особо тяжелых случаях с Crysis и Metro приходилось сбрасывать настройки на минимальные. Онлайновые развлечение и прочие нетребовательные к графической карте игры порой можно запускать на максимальных настройках и выставлять 4х анизотропную фильтрацию. Думаю, что для интегрированного видеоядра это хороший результат.