С выходом AMD RADEON RX VEGA в сети не утихают слухи, что именно эта карта может выдавать 70-100 мегахешей при майнинге Ethereum, однако на текущий момент эти сведения не подтверждаются тестами на последних доступных драйверах. Поэтому позиции текущего лидера Nvidia Tesla V100 в майнинге Ethereum с результатом в 80Mh/s остаются на первом месте.
Nvidia Tesla V100 это профессиональное устройство для расчетов, построенное на основе GPU Volta, которую ждут в потребительском сегменте не ранее 2018 года.
Основные особенности Nvidia Tesla V100 и ее предшественников:
Модель ускорителя | Tesla K40 | Tesla M40 | Tesla P100 | Tesla V100 |
Модель GPU | GK180 | GM200 | GP100 | GV100 |
Архитектура | Kepler | Maxwell | Pascal | Volta |
Техпроцесс | 28 нм | 28 нм | 16 нм FinFET+ | 12 нм FFN |
Кол-во транзисторов, млрд | 7,1 | 8,0 | 15,3 | 21,1 |
Размер ядра, мм² | 551 | 601 | 610 | 815 |
Кол-во SM | 15 | 24 | 56 | 80 |
Кол-во TPC | 15 | 24 | 28 | 40 |
Ядер FP32 на SM | 192 | 128 | 64 | 64 |
Ядер FP32 всего | 2880 | 3072 | 3584 | 5120 |
Ядер FP64 на SM | 64 | 4 | 32 | 32 |
Ядер FP64 всего | 960 | 96 | 1792 | 2560 |
Тензорные ядра всего | - | - | - | 640 |
Турбо-частота GPU, МГц | 810/875 | 1114 | 1480 | 1455 |
Пиковая пр-сть FP32, терафлопс | 5,0 | 6,8 | 10,6 | 15,0 |
Пиковая пр-сть FP64, терафлопс | 1,7 | 2,1 | 5,3 | 7,5 |
Пиковая пр-сть тензор, терафлопс | - | - | - | 120 |
Кол-во TMU | 240 | 192 | 224 | 320 |
Шина памяти, бит | 384 | 384 | 4096 | 4096 |
Тип памяти | GDDR5 | GDDR5 | HBM2 | HBM2 |
Объем памяти, ГБ | До 12 ГБ | До 24 ГБ | 16 ГБ | 16 ГБ |
Объем L2-кэша, КБ | 1536 | 3072 | 4096 | 6144 |
Объем разделяемой памяти на SM, КБ | 16/32/48 | 96 | 64 | До 96 КБ |
Объем регистрового файла, КБ | 3840 | 6144 | 14336 | 20480 |
TDP, Вт | 235 | 250 | 300 | 300 |
Из особенностей следует отметить использование памяти HBM2 как это сделала AMD в своей Веге, правда ширина памяти здесь полноценная в 4096 Бит. Сам чип GV100 выполнен по нормам 12нм и содержит 5120 ядер FP32 (аналог CUDA ядер в потребительских видеокартах) и 2560 ядер для расчетов FP64. Производительность в расчетах FP32 15 Терафлопс и 7,5 Терафлопс для FP64, что на 50% больше чем у чипов предыдущего поколения.
К слову сказать предыдущее поколение Nvidia Tesla P100 выдает на алгоритме Dagger Hashimoto (Ethereum) 69-72 Mh/s, с использованием исходных кодов майнера Genoil/cpp-ethereum c компилированием под архитектуру ppc64el. Другими словами Теслы не совместимы с кодом х86 для обычных компьютеров и на них нельзя запустить более производительные в майнинге майнеры от Claymores, т.к. код майнера закрыт и скомпилировать под архитектуру ppc64el может только сам автор этих майнеров.
Обсуждение по использованию в одной связке 4-х Nvidia Tesla P100 с общим хешрейтом 275Mh/s и энергопотреблением в 1кВт можно прочесть на этой ветке Reddit.
Что на счет новичка, то иноформации по производительности Nvidia Tesla V100 еще меньше, но мельком проскакивают сообщения на профильных форумах, что эти карты выдают не менее 80 Mh/s при майнинге эфира и энергопотреблении в районе 150Вт.
Учитывая эти показатели Nvidia Tesla V100 это самый производительный для майнинга Ethereum инструмент как в натуральном выражении так и по энергоэффективности (менее 2Вт на Mh/s), однако все впечатление портит его цена ( от 5.000$ за Nvidia Tesla P100 ) и плохая доступность в розничной продаже.