Перейти к содержимому


Фото

Высокопроизводительные железяки с конвейера


  • Чтобы отвечать, сперва войдите на форум
7 ответов в теме

#1 koraalex Опубликовано 29 Ноябрь 2008 - 18:33

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
Предлагаю сообщать здесь о специальных высокопроизводительных системах, которые можно купить и установить сейчас. Системы на базе процессоров общего применения интересны только в случае низкой стоимости и простой элегантной архитектуры.

#2 koraalex Опубликовано 29 Ноябрь 2008 - 19:03

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
Вычислительные ускорители ClearSpeed имеют производительность до сотни ГФЛОПС, что соотвествует серверу с четырьмя-восемью двухъядерными Оптеронами, но выглядят как плата расширения для PCIe и потребляют 25 Ватт. Совместимы с архитектуров x86, для использования требуется ПО из комплекта. Внутри - 2x96 процессорных модулей, соединённых неким коммутатором. Слабое место - собственная оперативная память, она как у одного Оптерона, а не у восьми. Продаются вместе с ПО по закрытой цене, предположительно - порядка $3,5K за плату + открытый драйвер + компилятор C, библиотеки и утилиты.

Тоже на PCIe ставится 64-процессорная карта Tilera с архитетурой "решётка", производительность - под 500 БОПС. Процессоры общего назначения, про совместимость не знаю. Энергопотребление немного выше, чем у ClearSpeed. Поддерживает интенсивную сетевую работу. Карта стоит $4K.

Оба производителя выпускают карты в исполнении PCIe и в серверном исполнении, со специальной шиной.

Изменено: koraalex, 22 Январь 2009 - 13:47


#3 koraalex Опубликовано 21 Январь 2009 - 20:38

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
Nvidia производит платы Tesla для PCIe. Процессор с 240-а ядрами (архитектуру ещё не видел) работает на частоте 1,3 ГГц, пропускная способность GDDR3 памяти - около 100 ГБайт/с (у ClearSpeed, кстати, классическая DDR2). Энергопотребление соответственно - до 200 Вт. В спецификации написано, что при работе с типом single, т.е. 32-битовые числа, производительность под ТФлопс, однако при работе с типом double - 78 ГФлопс. Надо полагать, карта сделана в духе графического ускорителя. Числа с короткой мантиссой не используются в больших вычислительных задачах, при работе с ними накапливаются погрешности округления и теряются малые величины. Но всё-таки 78 ГФлопс + быстрая память - это как 8 "Феномов". Правда, память, видать, хромая, - GDDR вряд ли поддерживает технологию ECC, могут возникать ошибки. Цена - от $1700.

Изменено: koraalex, 22 Январь 2009 - 13:44


#4 KiberGus Опубликовано 22 Январь 2009 - 13:54

KiberGus
  • Genius loci
  • 6 561 Сообщений:
  • Алексей Гусейнов
Насколько я знааю, это и есть та же видеокарта, котоая так же через куду программирвется. Просто ей нарастили произвоодительность и убрали все выходы, только для расчетов. Поэтому и производительность для double у нее такая плачевная по сравнению с float.
Зато, обладая единственной в мире подводной орбитальной группировкой спутников глонасс...
gentoo.gif

#5 koraalex Опубликовано 03 Июль 2009 - 9:36

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
AMD вступает в бой. Карта PCIe FireStream™ 9270: 800 ядер, максимально 240 ГФлопс при двойной точности, 1200 - при одинарной, энергопотребление примерно как у NVIDIA, однако энергоэффективность выше. На Нэкстэге цена $1250, карточку 9170 (320 ядер, 100 ватт питания) отдают за $850. Скорее всего на карточках стоят стандартные графические чипы ATI или же их упрощённые варианты, спецификации больно похожи. Меня смущает, что ничего не пишут про кэш каждого ядра, судя по блок-схеме (архитектура графики, PDF) он какой-то есть, но не полноценный. Создаётся впечатление, что обрабатываются только параллельные инструкции, а функции-алгоритмы выполняться независимо в каждом ядре, как у ClearSpeed, не могут. Если так, то смысла в большой производительности сопроцессора нет. Вообще, подобные ускорители не должны быть слишком быстрыми, они постоянно обращаются к главному процессору, производительность которого 2...10 ГФлопс.

AMD сохраняет за собой сектор самых дешёвых высокопроизводительных систем. Оптерон, к примеру, - не лучший процессор, но даже Крэй собирает кластерные системы на Оптеронах из-за дешевизны.

Изменено: koraalex, 07 Июль 2009 - 8:31


#6 koraalex Опубликовано 03 Июль 2009 - 9:57

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
Теперь у меня возник вопрос о программной поддержке вычислений на графических чипах. AMD рекламирует технологию Stream (PDF), предлагает добровольно установить драйвер + сетевой клиент, чтобы ваш компьютер одна фирма загружала своими медицинскими задачами. Есть SDK. Хочу услышать знающих, могу ли я, простой программист, легко ускорить свою программу на своём компьютере уже сегодня? AMD подчёркивает, что продвигает открытый стандарт, а как дела с NVIDIA?

Изменено: koraalex, 03 Июль 2009 - 19:05


#7 BOЯAT Опубликовано 06 Июль 2009 - 23:25

BOЯAT
  • Друзья
  • 10 Сообщений:
  • Nazar Andrienko

AMD подчёркивает, что продвигает открытый стандарт, а как дела с NVIDIA?

NVIDIA продвигает свой стандарт, зовется CUDA. Разработка ведется на специальной версии языка C (туда добавлены операторы синхронизации потоков + библиотека с device specific функциями). По отзывам людей, имевших с кудой дело, могу сказать, что пока что оно сыровато: компилятор подключивает, а нормальных математических библиотек нет (например ругались на тормоза CUBLAS - версии BLAS для CUDA - которые причем проявляются в определенных ситуациях, видимо, где-то разработчики перемудрили с кэшэм).

#8 koraalex Опубликовано 09 Июль 2009 - 8:12

koraalex
  • Свои
  • 1 946 Сообщений:
  • Алексей Коробов
Может кто-нибудь объяснить, почему ускоритель FireStream 9250 (причём с видеовыходом) стоит $850, а аналогичная графическая карта Radeon 4850 (1 GB RAM) стоит около $150? SDK поддерживает видеокарту так же, как ускоритель.

Изменено: koraalex, 09 Июль 2009 - 8:39





1 пользователей читают эту тему

0 пользователей, 1 гостей, 0 невидимых