Fluboxer

Fluboxer

пикабушник
пол: мужской
поставил 836 плюсов и 340 минусов
отредактировал 7 постов
проголосовал за 96 редактирований
11К рейтинг 1250 комментариев 7 постов 2 в "горячем"
105

Вся правда про RTX что же скрывали в NVIDIA?

Иногда вещи не такие, какими кажутся на первый взгляд, даже если к этому "первому взгляду" пустить маркетологов с целью рассказать про *продукт* как можно больше. Именно такая ситуация произошла с зелёными, когда они выкатили свои новые видеокарты серии NVIDIA RTX

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Кроме шуток, 95% времени презентации они втирали про трассировку. Для профсегмента (а это  целевая аудитория презентации) их слова имели мощное воздействие, ибо трассировка = основа рендера, а рендерит там чуть ли не каждый первый, но кроме ЦА эту презентацию смотрели геймеры, реакция которых прекрасно выражается одной-единственной картинкой со звуком

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

В результате этого сообществом геймеров был сделан вывод, что новые карты имеют из нового лишь трассировку и DLSS

Настало время исправить это недоразумение и раскрыть секретные материалы из архивов КГБ то, о чём не сказали на презентации

ДИСКЛАЙМЕР! Если Вы купили видеокарту на паскале (GTX 10хх) топового сегмента за неделю до аннонса RTX 20xx или топите за абсолютную монополию AMD здравую конкуренцию (ведь зелёные и синие зажрались), то это всё выдумки, пост проплаченный, а я - маркетолог нвидии. Можете поставить плюсик за старание и идти по своим делам, листать ленту дальше

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Зачем я это написал? Подумайте сами - Вы купили за свои кровные 1080 Ti за 9/10 цены прям перед выходом тьюрингов или же топите за AMD только потому что AMD - это AMD (= фанбой) и тут Вам говорят, что всё, что Вы знаете - ложь и нещадно рушат Ваш мирок. Вы смените свою точку зрения под давлением фактов? Возможно, но скорее всего Вы воспылаете СВЯЩЕННЫМ ГНЕВОМ и пойдёте минусить всех, чья точка зрения отличается от Вашей. Оно нам надо?

Ладно, слишком много воды, слишком большое вступление, мы же сюда за фактами пришли?

Для начала - немного матчасти, дабы мои слова можно было понять. Всё ещё с водой, дабы до каждого дошло. Если знаете или понимаете, что ничего не поймёте - пропускайте до картинки

ТИПЫ ДАННЫХ:

> Тип данных - множество значений и хуNты, которую с ними делают. Вот ты взял листочек, написал циферку, скажем, "10", после чего назвал её словом "ЖОПА" "X". Теперь у тебя есть жопа "x" со значением "10". Ты можешь вычесть их "x" число 6 и присвоить результат обратно "x". Всё, у тебя "х" со значением "4". Теперь ты робот. Ну или программист, ибо там это - основа основ.

> INT и FP - основные типы данных, с которыми работает компьютер и программист, создающий ПО (скажем, игру). В INT хранится целое число, например, "1". А в FP хранится число с плавающей запятой, например: "1,13"

> После типа данных есть число, скажем, INT8. Это - количество бит (нолей и единичек), которые отданы на хранение числа. С большими данными работать сложнее, они жрут больше памяти, да и не всегда нужно - если (условный) персонаж может держать лишь 10 единиц предмета в слоте, ему хватит INT4, нет необходимости вываливать на это число INT16 или FP64 (лол)

> В играх вычисления на GPU в основном FP32. Это - число с одинарной точностью и любая современная карта имеет много терафлопс производительности именно с ним. Ещё есть FP16 (половинная точность) и FP64 (двойная точность). Производительность измеряется во флопсах с СИ-приставками. У тебя мегабайты кеша, гигабайты ОЗУ и (наверное) терабайтный винт, мысль ясна? В случае с процессорами (CPU) всё просто - из двух терафлопс FP32 получится четыре терафлопса FP16 или один терафлопс FP64

>> Ещё раз, коротко: FP32 - основа основ. Производительность измеряется во флопсах с СИ-шной приставкой. При хороших планировщиках аля CPU производительность 4*FP16 = 2*FP32 = 1*FP64. Так же замечу, что хорошим показателем мощности считается ~4-5 терафлопс FP32 на куде или 6-7 терафлопс от AMD, современные карты с такой производительностью выдают 60 фпс на ультрах в большинстве игр. Всё, что больше 10 терафлопс - жир

Это всё, что нужно знать про типы данных. Если интересно - читать тут, тут и тут.

ОСНОВА ОСНОВ:

> видеокарта ака GPU, процессор ака CPU имеют архитектуру. Архитектура - это АД для тех, кто попытается самостоятельно изучить матчасть. В отличии от явного изменения характеристик, изменения в архитектуре являются бомбой замедленного действия. Замедленного и крайне разрушительного

*для слишком умных - речь про внутреннюю архитектуру, а не про х86 vs ARM*

> Насколько глубока кроличья нора? Вот есть процессор, скажем, i7 3770 на архитектуре Ivy Bridge (ивик). 4 ядра с HT, частота TB на все ядра - 3,7 ГГц, а FPU блок делает 16 операций за такт. Производительность FP32 = 4*3,7*16 = ~236 гигафлопс. А теперь берём i7 4770. Те же 4 ядра с HT, те же 3,7 ГГц на все ядра, но архитектура там Haswell, у которой FPU блок в 2 раза мощнее, ибо делает 32 операции за такт. FP32 = 4*3,7*32 = ~473 гигафлопс. И вроде характеристики одинаковые, и там, и там 4/8, и частота одинаковая, но при этом более новый процессор в 2 раза мощнее. Для любознательных: это было сделано ради AVX2, следующий такой прыжок уже случился в процессорах на LGA2066, ради AVX512, где FPU блок делает 64 операции FP32 на такт. Так же замечу, что у АМДшной рязани FPU блоки тоже делают 32 операции на такт, как и все десктопные камни интела после хасвелла. Ой, мы же видеокарты обсуждаем?

> Архитектуры имеют своё красивое название, по крайней мере, у синих intel и зелёных nvidia

750 (Ti) и 9хх = максвелл, 10хх = паскаль, TITAN V = вольта, 16хх и 20хх - тьюринг

У АМД нейминг более компактный, RX 4xx/5xx = GCN 1.3, VEGA = GCN 1.4

>> Ещё раз, коротко: архитектура очень важна. Прикол в том, что просто так её подробности не узнать и "лоб в лоб" не сравнить - нужно либо искать соответствующие ресурсы, либо читать пересказы. По понятным причинам стадо хомячков игнорирует факт её существования, что сильно огорчает AMD и, с недавних пор, зелёных

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Раз уж картинка говорит про "богатый внутренний мир", пора делать то, зачем мы тут собрались - разбираться в архитектуре. Начнём с внутренностей чипа. На картинке 2080 Ti. Да, это огромный чип, да, та самая карта от 80К рублей

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост
Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост
Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Страшные картинки, ничего не понятно? А если нажать на них и зазумить? Верхнее - это чип TU102 (= 2080 Ti), а нижнее - SM вблизи и его сравнение с прошлыми поколениями. Не нужно быть гением-инженером, что бы понять, что тьюринг и вольта - родственники, а паскаль на таком фоне выглядит очень непохоже. Кстати, про вольту забудьте, сравнивать мы будем с паскалями

Первое, что бросается в глаза - это смена страшного "core" на "FP32 + INT". Так-то "core" ака "cuda-ядро" содержит в себе FP32 и INT, вот только за один такт можно было выполнить ЛИБО FP32, ЛИБО INT операцию. Условно говоря, игра хочет сделать 70 FP32 и 30 INT32. Паскаль на это потратит условные 100 тактов (такая у нас условная одноядерная карта, да), а тьюринг потратит лишь 70 тактов, ибо INTы сделаются одновременно с FP32. Что, опять ничего не понятно?

>> Ещё раз, кратко: прирост +25-40% производительности(в зависимости от игры) при условии отсутствия внимания со стороны разработчика. Разраб может забить и спокойно пить мартини, загорая на пляже, пока его игра бустится от магии тьюринга. А если не забьёт, то тьюринги будут буститься в 2 раза относительно паскаля, а школота будет орать про занижение драйверами, когда на деле всё гораздо проще

Следующее, что заметит глазастый пикабушщник - это FP64. Он мелькнул в чипе вольты и исчез в тьюринге. Вещь для геймера ненужная чуть более, чем полностью, она больше для вычислений научных. Её кладут в некоторые титаны и квадры, дабы на них можно было считать белки и заниматься прочим числодробительным непотребством. Если же в карту не положить FP64, то она будет считать FP64 в разы медленнее. Никаких тебе FP64 = FP32/2 (1:2), которые и давали те FP64 блоки и которое делает FPU в любом современном процессоре. 1080 Ti с её 11 ТЕРАфлопсами имеет лишь 350 ГИГАфлопс FP64. FP64 = FP32/32 (1:32), что как-то не очень, не находите?

>> Ещё раз, кратко: FP64 не для тебя. Забудь про него. Листай дальше

Раз уж речь зашла про FP, то нельзя не упомянуть про FP16 и AMD. Эта эпопея началась с выхода GCN 1.4 (вега), когда AMD предложила вместо разбрасывания FP32 использовать более короткие FP16 там, где их можно заменить, ибо это халявная производительность. Они назвали это дело "быстрой математикой" и сделали красивое FP16 = FP32*2 (2:1) в вегах. До этого были GCN 1.3 (рыксы) с соотношением 1:1 (прироста не будет, но и производительность не упадёт) и паскали с, барабанная дробь, 1:64. Т.е. из 4300 гигафлопс FP32 у 1060 будет...60 гигафлопс FP16. В итоге ситуация зашла в тупик - делать FP16 ради ~25% рынка (статистика стима; встройки от интел занимают 10% и тоже имеют православные 2:1) и убивать производительность в абсолютный ноль на остальных 75% никто не станет. Упс. Но тут приходят волшебные RTX с таким же православным соотношением 2:1 и тензорниками в придачу. В 128 раз мощнее, чем паскаль с тем же кол-вом FP32, и это без учёта тензорников!

>> Ещё раз, кратко: паскали не могут в FP16, от слова совсем. Так как тьюринг распространяется на мидл+лоу сегмент и AMD поджимает своими консолями, то старые карты обречены на отыквивание.

Тензорники? Эти 2 молодца Tensor cores рождены для того, что бы быть числодробилкой ради нейросетей и DLSS. Они немного улучшились со времён вольты, но с задачей прекрасно справляются - время работы моей любимой расшакаливательной нейросети на 2070 сократилось до считанных миллисекунд. Никогда моя коллекция мемов не была настолько чистой от артефактов сжатия вконтакта!

Но это не весь их функционал! Они могут быть числодробилкой в FP16, в случае с 2080 Ti это 107 терафлопс в бусте. Прибавим 26,9 терпфлопс от самой карты и попробуем подсчитать, сколько 1080 Ti нужно, что бы их заменить. 133 терафлопса делим на 0.177 терафлопс одной 1080 Ti и умножаем на цену - 700 долларов, после чего вычитаем 1200 баксов за 2080 Ti. 524 тысячи долларов придётся потратить, что бы заменить одну 2080 Ti на мегасервер из 1080 Ti. А ведь это ещё нужно питать и в принципе куда-то разместить... Воистину, архитектура - замечательная вещь. Конечно, можно считать матрицы для нейросетей, но зачем? Лучше посчитать INT4 - аж 500 тераопсов!

>> Ещё раз, кратко: тензорники - лютая весч, позволяющая делать порно с лицами одноклассниц нейросети в домашних условиях. Не хочешь сетей? Держи 100 терафлопс FP16!

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Итак, с чипом и числодробительной скоростью разобрались. Осталось рассказать про кешу и можно идти дальше. Кеш(а) - архибыстрая память, дабы держать нужную шелуху "под рукой" и не лезть в медленную ОЗУ или, омг, на тормозной хард. Делится на уровни (L1, L2), меньше циферка - меньше объём и задержки и выше скорость. На радость TPC новые карты получили "привет от вольты" - кеш L1 слился с разделяемой памятью (shared memory), L2 просто раздулся в 2 раза, а регистровая память из-за перестройки SM значительно увеличилась. Ну и на закуску - в каждую секцию SM затолкали L0 вместо общего кеша инструкций

Ещё один "привет от вольты" - ITS, позволяющее планировщику эффективно засрать начинку SM работой. Эй, не зевать!

>> Ещё раз, кратко: улучшили кешу, улучшили планировщик. Вылизали то, что нужно вылизывать из поколения в поколение

Раз уж речь зашла про подсистему памяти, то нельзя не вспомнить про GDDR6. Смена памяти сама по себе хороша, ибо почти двухкратный рост псп (пропускной способности памяти, читать как "скорости") на дороге не валяется. Но кроме этого, вместо наращивания объёма (количества) nvidia в тьюринге решили взять качеством. Новая память получила 2 независимых канала по 16 бит вместо одного канала по 32 бита, что позволило избавиться от "застревания" данных и сократить размер кванта, что так же оптимизирует работу с памятью и позволяет эффективней использовать псп. Так же стандарт GDDR6 позволяет работать в режимах DDR либо QDR (реальная -> эффективная у GDDR имеет в 2 раза больший множитель, т.е. 2 ГГц в 8 ГГц, в то время как DDR делает из 2 ГГц лишь 4 ГГц. Вот и секрет высоких частот у видеопамяти!) при неизменной псп. ИМХО это незаконно, я звоню в полицию. А пока я набираю номер, замечу, что зелёные опять сильно улучшили сжатие данных. Они вообще над этим активно работают, настолько активно, что сжатие - единственное значимое изменение в паскалях относительно максвелла. На этом изменения между максвеллом и паскалём, влияющие на все игры, кончились. Ощутили разницу?

>> Ещё раз, коротко: GDDR6 имба, позволяющая крайне эффективно и быстро работать с памятью. Зелёные взяли качеством, а не количеством памяти.

Продолжаем выносы мозга. Следующее улучшение - асинхронники и API. Асинхронники в паскале были просто божественны - их не было. А теперь есть, на радость картам AMD, у которых они есть давным-давно. Асинхронники позволяют одновременно вычислять и делать графоний, что позволяет считерить в случаях, когда считать много, а графона мало (и наоборот). А что по API? Тут всё просто. Есть DX12 (DirectX 12) простой, а есть DX12_1, оптимизированный, с новыми фичами. AMD традиционно в нём тащила, так же, как и в вулкане. И тут, и в случае с асинхронниками, инженерам зелёных стало очень завидно. Они захотели так же. Ну, мужик захотел - мужик сделал, в итоге мы имеем поддержку фич DX12_1 и Vulkan, в которых раньше тащила AMD. Учитывая наличие асинхронников мы получаем разрушительную штуку. Является спонсором ситуаций, когда 2060/2070 >= 1080 Ti. Весело, не так ли?

>> Ещё раз, коротко: RTX тащит в современных играх, ибо научился в acync, vulkan и DX12_1. В случае вульфа 2 делает 2070 > 1080 Ti.

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Уже проверяя пост перед отправкой я вспомнил, что забыл рассказать про улучшения разгона. Зелёные выкатили сканнер (он так и называется), который позволяет авторазгоном выбить 2 ГГц даже забитому рукожопу, нажав лишь пару кнопок. Так же, ради сканера новые карты получили улучшения в сфере контроллера питания и лимитов, что несколько обрадовало оверклокеров, которые разгоняют карты самостоятельно. Фича включена в бету MSI AB

Так-то саморазгон был и до этого, но это был мусор, который вылетал чаще, чем работал. Сканнер же имеет функционал стресстестов для подбора кривой частот. Из минусов - думает оно минут 20 перед тем, как родить результат. Фичу подвезли и к паскалям, но без улучшений она работает хуже и вообще у меня асус 2 ГГц с завода.

>> Ещё раз, кратко: тьюринги хорошо гонятся системами авторазгона, но их нужно подрубить вручную

Ansel. Помните его? Это такая волшебная скриншотилка, которая имела свой API и позволяла делать скриншоты по паре гигабайт. Оно вернулось. Ansel RTX не требует добавления особого API и позволяет работать с (почти) любой игрой за счёт нейросетей. А если API есть, то можно включить режим стационарной трассировки, увеличив кол-во лучей в стопицот раз. Эхх, а раньше кадры с трассировкой днями рендериться могли, вот это было время))

>> Ещё раз, кратко: купишь RTX - побегай с Ansel, шоб было

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Mesh Shading. Звучит как что-то страшное, не так ли? А по факту это лишь новый графический конвейер, позволяющий творить магию в сложных сценах. Насколько магию?

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

>> Кратко, ещё раз: Mesh Shading - лютая весч для сложных сценок. Обладатели RTX могут полюбоваться на демку с астероидами и поглазеть на это самостоятельно

Ещё голова не болит? Тогда переходим к VRS. VRS - это продолжение идеи паскальнутой MRS и LMS, суть которых в том, что в некоторых местах экрана можно забить на качество, все равно игрок туда не смотрит. Звучит довольно нагло, но по факту, если в игре есть, скажем, моушин блюр (размытие в движении), то не всё ли равно, с какой точностью рендерилось то, что замылилось специальным шейдером? Аналогично для гонок и VR, ведь в гонках игрок не смотрит по краям, а в VR мало того, что не смотрит по краям, так ещё и отслеживание взгляда пихают куда только не лень. Так почему бы не совместить приятное с полезным?

И, раз речь пошла про VR, то будет глупо не вспомнить про TSS. Суть, как всегда, в халтуре - зачем делать 2 кадра на каждый глаз, если и там, и там почти всё одинаково? Почему бы не взять результаты с одного глаза и не использовать их для ускорения рендера другого?

Ну и про глаза - MVR позволяет обладателям многомониторных конфигураций и VR нового поколения (C)(R)(TM) получать более качественное изображение. Так же этим можно делать карты теней с несколькими источниками света... Почему бы не показать слайд?

>> Кратко, ещё раз: добавили технологий для VR, гонок и прочего мультимонитора.

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Улучшили блок кодирования-декодирования видео. Тут всё просто, мамкины стримеры будут довольны. Предыдущее улучшение в этой области было в паскале и оно было действительно сильным - улучшили декодировщик в стопицот раз. Буквально

Дабы этот абзац не был таким одиноким, напишу про лулз в виде контроллера USB 3.0 Gen 2 Type C и соответствующий выход на карте. Так-то туда нужно шлем втыкать, но люди так и обычный дисплей подключали, да и обычные устройства должны там работать. И - Инновации!

Кстати, туда был добавлен DisplayPort 1.4a с возможностью 8К60Гц. Осталось только монитор найти подходящий, под 8К-то!

>> Ещё раз, кратко: в видеокарту можно воткнуть флешку, лол. Ещё там (де-)кодировщик улучшили, но Вам ведь интересней возможность подключить в видеокарту флешку/телефон/наушники?

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

NVLink. Так же, как и тензорники с RT-ядрами, является подачкой с барского стола. Заменяет собой убогую SLI, правда, не все вендоры об этом в курсе. Позволяет адекватно стакать ресурсы видеокарты, в результате чего пара 2080 Ti позволяет играть в 8К. Иногда даже на ультрах в 60 фпс. Да, 2080 Ti - не самая дешёвая карта, но тех, кто хочет (и может себе позволить) играть в 8К, это не сильно волнует. А ещё есть мостики NVLink с подсветкой, за 90 евро

О, да, мостик с ргб, для видеокарт с ргб, воткнутых в мать с ргб, к которой подключен ргб SSD, ргб вентиляторы и ргб периферия, включая ргб монитор и ргб коврик


Прекрасная замена новогодней ёлке, жаль только, что почку не заменит

Вся правда про RTX  что же скрывали в NVIDIA? Nvidia, Nvidia RTX, Технологии, Новые технологии, Directx, Vulkan, AMD, Гифка, Длиннопост

Ну и ещё немного. Не бывает всё так хорошо, не находите? А я нашёл. Новые карты получили огромные чипы, которые в 1,7-2 раза больше аналога на паскале, ибо 12 нм производство оказалось слишком жирным для такого. Вот такие огромные чипы - это ненормально, в первую очередь, по причине цены. Карты вышли дорогими, но, так как более слабые модели = более маленький чип, их value (выгода, соотношение цены и производительности) стал стремительно расти и если 2080 стоила как 1080 Ti, то 2070 и 2060 оказались выгоднее аналогов

Но самая серьёзная проблема - школьники ака "паскалеботы" и "амд фанбои". АМДшникам и тем, кому родители купили 1050 Ti, не понравились новые карты, в результате чего они начали искать, как их засрать. В ход шло всё - например, школьник орал про нечестные тесты, ведь на тесты засылали дорогие FE, а у них был, о, боже, РАЗГОН, в то время как 10хх были в стоке. Само собой, при кудахтах про цену её тоже брали от FE нвидии, которые стоят минимум на 10К дороже, чем средненький нереф, который возьмёт любой нормальный человек. Про реф/нереф и выбор карты я писал в прошлом посте, так что вернёмся к РАЗГОНУ. У FE версий с сайта нвидии, которые являются лютым оверпрайсом, действительно был разгон. Аж на 6% в случае с 2080 Ti. Эта цифра крайне смешная, ибо заводской разгон самого поганого нерефа будет гораздо мощнее. И вот с этих 6% кудахтов было так, словно там поработал профессиональный оверклокер

Ладно, хватит негатива, ибо с выходом 2060 все школьники успокоились и разбежались делать уроки. Сами зелёные сообщили, что обвинения в том, что они зажрались, им не нравятся и пообещали использовать 7 нм от самсунга (да, самсунг тоже имеет производство чипов, причём их 7 нм более мелкие, чем 7 нм TSMC или GF) с EUV липтографией, что позволит делать чипы дешевле

>> Ещё раз, кратко: зелёные не зажрались, а 7 раз отмерили и 1 раз отрезали. Пообещали исправиться с картами на 7 нм, так что если Вы ждали, ждали и все ещё ждёте, то можете ещё подождать. Но помните - всегда можно купить карту, а потом продать её, сохранив большую часть цены и потом 2 недели бомжевать со встройкой, ожидая анонса следующего поколения. Я так и сделал, кстати, и ничуть об этом не жалею

Ой, мы что-то забыли? А, да, мелочь, тут трассировка с DLSS завалялись. О них я расскажу в следующем посте, а пока напомню, что оценивать качество сглаживания/трассировки по сжатым-пережатым видео на ютубе с отрицательным битрейтом - дело глупое и неблагодарное. Правда, DLSS применять на FHD - не самая хорошая идея, ибо технология любит высокие разрешения, да и сами зелёные натренировали сети именно под высокие разрешения

ВМЕСТО ВЫВОДА: Скорее всего, если Вы это честно прочитали, то Вас переполняет наука. Если Вы сразу промотали до вывода, то прочитайте хотя бы выделенный текст "Ещё раз, кратко", где я объяснил сложные вещи простыми словами. Тьюринги получились действительно инновационной архитектурой. Конечно, её распространение сильно повлияет на карты AMD, которые поддерживают некоторые фичи тьюринга, но разве это не то, к чему мы стремимся - что бы технологии оптимизации вошли в массы?

P.S. До сих пор хохатулькаю с заголовка. И ведь не поспоришь, ибо они об этом говорят разве что в документации для разработчиков, а на странице, посвящённой архитектуре, втирается дичь про VRS, трассировку и DLSS. Это - лишь верхушка айсберга!

P.P.S. Кстати, содержимое поста вовсе не значит, что нужно бежать продавать свою карту и почку, дабы купить тьюринг. Достаточно просто знать, что одной трассировкой и DLSS дело не обошлось

Показать полностью 12
97

Маркетинг в мире видеокарт

Маркетинг в мире видеокарт Видеокарта, Маркетинг, Asus, Nvidia RTX

- "Ух ты, когда я накоплю денег, я смогу поставить ещё одну карту!"
И ведь действительно - карты турбинного типа, выбрасывающие горячий воздух ЗА пределы корпуса, лучше приспособлены для многокарточных конфигураций. Вот только:
1. В тьюрингах (RTX) SLI заменили на прекрасный NVLink, достав его из карт серверного сегмента. Он гораздо быстрее, чем сам слот для видеокарты, что позволяет стакать память. 10 лет ждали и таки дождались!
2. Поддержку технологии получили только RTX 2080 Ti и RTX 2080. RTX 2070, про которую идёт речь, поддержкой технологии обделена

Вот даже не знаю, смеяться или плакать
258

Выбираем видеокарту (с умом)

Всем привет! Думаю, что не ошибусь, если скажу, что практически у каждого есть ПК, каждый хочет поиграть в игрульки, да вот только не у каждого ПК способен такое потянуть. В большинстве случаев всё обходится заменой видеокарты, ибо развитие остальных компонентов долгое время плелось со скоростью Почты России, доставляющей мелкий пакет без отслеживания

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Итак, мы подошли к сути поста - научиться выбирать видеокарту и не получать на выходе 96 градусов спустя 15 минут работы

ЧАСТЬ 0 - ВЫБИРАЕМ ЧИП
Думаю, если кто-то из читающих пост сидит на IT-новостных ресурсах, то он наверняка видел новости по типу:
- NVIDIA представила референсное исполнение 2070
- ASUS выпустит 228 версий GTX 1080
- MSI выпустит игровую GTX 1050 Ti XxX GamingX XxX, которая получит водяное охлаждение с 360 мм радиатором, обладающим RGB подсветкой. Кстати, кожух тоже с RGB. И радиатор тоже с RGB. И даже вода жидкость с RGB!
- Продам гараж
- Видеокарта Colorful iGame GTX 1080 TiTii KuKudan получила азотное охлаждение, 333 фазы питания, инфракрасную лгбт подсветку, разгон до 3 ГГц и ценник в размере одного госдолга США

- Palit готовит видеокарту GeForce GTX 1660 по знаменитому рецепту личного повара Тутанхамона. Говорят, это вкусно

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Собственно, эти 228 версий объединяет именно чип - они могут иметь разное СО, разную компонентную базу и разные свистоперделки, но чип у них всех будет GP104 с одинаковой производительностью в равных условиях и, соответственно, с одинаковой конфигурацией
Небольшое примечание - так-то чип может быть разный, но модель аля "GTX 1066" определяется конфигурацией чипа. Примечательно, что 1060 имеет целый гарем чипов, из которых её лепят
Небольшое примечание х2 - в RTX есть понятие отборного чипа со стороны зелёных. Влияет только на разгон, хотя школьники успели проораться про "кококо, злое ынвиде чипы урезает!". До этого таким делом обычно занимался сам вендор, отбирая для дорогих премиум карт лучшие чипы. Короче, не забивайте голову этим, по сути ничего не поменялось

- "Стой, а зачем мы тогда вообще этим занимаемся, если чип одинаковый?"
- "Да затем, что бы это дело разогналось, не грелось, прослужило до следующего поколения и успешно слилось на авито ради покупки новой карты"
Теперь немного терминологии: РЕФЕРЕНСНЫМ (реф) исполнением называется версия видеокарты, которую делает (разрабатывает, и чаще всего - производит) сам производитель чипа и которая готова к работе. К покупке не рекомендуются, ибо вендоры по типу ASUS/Palit/Evga/etc сделают карту жирнее и дешевле. Это "жирнее и дешевле" называется нерефом
В моём случае будет много примеров карт, но чаще всего упоминать я буду эти карты - 2060, 2070 и 1060. Почему?
GTX 1060: самая популярная карта в стиме. Давала возможность сделать 60 фпс на ультрах в большинстве игр. Ну и, само собой, она имеет кучу наглядных примеров исполнений, как и хороших, так и откровенной помойки
RTX 2070: последняя из RTX'ов, доступных простым смертным. 2080 и её Ti версия слишком дорогие как и для школьника, копящего с завтрака, так и для большинства работяг, не желающих отдавать больше одной зарплаты за видеокарту
RTX 2060: трассировка и архитектура тьюринг во всём её величии, от 22-23К за дешманский нереф. Уже не так страшно, как 2080 Ti за 1,2 килобакса?
А как же AMD? Там всё так же, ибо живём по одним законам физики.
Ах, да, мы же тут вроде чип выбираем? Это просто - смотрим цену на сайте зелёных, отнимаем 10К и получаем на выходе цену нереференсов

ЧАСТЬ 1 - ВЫБИРАЕМ СИСТЕМУ ОХЛАЖДЕНИЯ
Система охлаждения (СО) состоит, как правило, из двух элементов: радиатора и вентиляторов/кулеров/крутеляторов/вертушек/жжужжалок/твоюжматьлопастьсломалась. Оба элемента важны друг для друга - огромный радиатор без нормального обдува превратиться в такую же хрень, как четехвентиляторная дура, где радиатор - это алюминиевая нашлёпка
Но радиатор всё же важнее, так что ему будет посвящена большая часть статьи

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Кстати, на картинке сверху радиатор - полная дичь
Итак, радиаторы бывают разные. Например, радиатор примерно такой конструкции (на картинке снизу) можно повстречать в большинстве карт топового и среднего сегмента:

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Итак, что мы видим?
> огромную срань. Нет, я серьёзно, это 30 см металлов, которые занимают почти 3 слота!
> большой и объемный двухсекционный радиатор
> 6 теплотрубок, часть из которых осталась лишь в 1й секции
Тут стоит сделать отступление - обычно теплотрубки цвета меди, так как состоят они именно из неё. Почему медь? Потому что у неё высокая теплопроводность, в то время как у алюминиевых пластин радиатора высокая теплоёмкость. Бывают полностью медные наборы, но они не сыскали популярности, в том числе из-за цены. Но вернёмся к нашим баранам теплотрубкам. Некоторые производители, красоты ради, покрывают это дело никелем и они приобретают такой цвет
> Выступ с термопрокладкой, для отвода тепла от VRM (цепи питания)
На наличие этой части часто кладут, а потом удивляются, чего это у них питальник сгорел
> Медная (никелированная) пластина с полировкой (ля какая)

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Кстати, это ни разу не 1060 и даже не 2070. Это топовая 2080 Ti

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Впрочем, в конкретном случае, есть 2 новости - хорошая и плохая:

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Да, асус уже давно повадились пихать на мидленд радиаторы, созданные по образу и подобию топовых моделей. В данном случае правильнее было бы вставить картинку с мемом про списывание, ибо в конструкции радиатора сделали микроскопическое изменение, убрав несколько маленьких пластин и сделав пару трубок нормального размера, но суть при этом осталась той же - огромный радиатор с кучей теплотрубок
Казалось бы, пост - скрытая реклама асуса, не так ли? Что-ж, а теперь плохая новость

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Да, основная причина, по которой нельзя просто взять и взять топовое исполнение - это цена. Нет, не так. Ц Е Н А. В данном случае стрикса 2060 может потягаться в цене с 2060 FE, на которую, напомню, зелёные накручивают по 10К к цене относительно рекомендованной для нерефов. В результате чего между 2060 стрикс и дешман 2070 разрыв в несколько килорублей. Точно такой же прикол с 2070 и 2080, однако с 2080 и 2080 Ti такой прикол не работает из-за лютой разницы рекомендованной цене

Окей, это было небольшое отступление, вернёмся к нашим радиаторам. Давайте возьмём более простое исполнение, за которое нам не придётся продавать свою жопу почку?

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Чёрт, я же ел! Это наглядный пример того, как не надо. Перед вами - одна из худших 1060
Первое, что бросается в глаза - 1 вентилятор на такую "большую" карту
Давайте посмотрим, что внутри? Перед этим настоятельно советую отвести от монитора беременных женщин и детей

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост
Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Я же предупреждал! Итак, что мы видим:
> вместо радиатора - алюминиевая чушка маленького размера. Ни грамма меди!
> охлада на чипах памяти, само собой, нет
> охлад на подсистеме питания - алюминиевая чушка ещё меньшего размера
> карта значительно больше, чем должна бы быть
Ужас, не так ли? Самое смешное, что разница с двухвентиляторной версией была в...200 рублей!
Двухвентиляторный Palit Dual, который так сильно советовали диванные "эксперты", отличается от одновентиляторного Palit StormX сильнее, чем кажется. Вот его радиатор

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Прогресс на лицо!
> маленький радиатор
> 3 теплотрубки. Для GTX 1060 этого достаточно, НО эти трубки U-образные
> Охлада памяти - нет. Простительно для карты лоуенд сегмента
> Контакта VRM с радиатором НЕТ. Это непростительно любой карте мощнее хх50
Нутакое, знаете ли, это тот уникальный случай, когда стоило взять гигабайтовскую карту
Кхм. Перед тем, как я подытожу содержимое этой части, давайте посмотрим на более редкие варианты исполнения карт? Я говорю про турбинные системы охлаждения. Ходит миф, что они шумные и горячие, но по личному опыту могу сказать, что это в 95% случаев враки. Но почему бы не рассмотреть самую дешёвую (на момент выхода 32К стоило!) RTX 2070?

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост
Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

Опять асус, ага. Большой радиатор, испарительная камера (вместо теплотрубок), контакт с VRAM (чипами памяти) и VRM (питаловом), температуры в районе 60 градусов при 95% оборотов и 44 Дб шума - вполне себе обычный дневной уровень шума. За свою цену в 32К этого более, чем достатоно
Ах, да, мы же ещё крутелятор должны выбрать? Да никакой. Такая уж зависимость, что у карты с хорошим радиатором и вертушка, как правило, хорошая, да и информацию о вентиляторах сложно найти - 95% обзорщиков почему-то считают, что писать про вентиляторы необязательно. Правило простое - не берите одновентиляторники аля StormX и карты с шумом в 50+ Дб, и всё тут
______________
Итак, подытожим:
> Хороший радиатор = большой радиатор. Это основная причина, по которой карты премиум сегмента радостно занимают 2,5-3 слота
> Исходя из предыдущего вывода - карты премиум сегмента состоят далеко не из ргб подсветок, кожухов, надписи "ИГРОВОЕ!!1" и бренда(тм!) за х2 цену. Чаще всего такой оверпрайс оправдан. Но в семье не без урода, та же MSI делала карты 10хх именно из "ргб подсветок, кожухов, надписи "ИГРОВОЕ!!1" и бренда(тм!) за х2 цену", положив свою выручку на охлад VRAM и контакт VRM с основным радиатором
> Любая уважающая себя карта имеет хотя бы 3-4 теплотрубки. Почему не 5-6? Потому что толщина трубок может отличаться
> Теплотрубки, как правило, коричневые, ибо медь, но их могут покрыть, скажем, никелем
> В любой уважающей себя карте теплотрубки идут ВДОЛЬ печатной платы и на них нанизано множество алюминиевых пластин, которые, согласно законам логики и здравого смысла, оказываются короткими и располагаются они ПОПЕРЁК печатной платы и теплотрубок
> Двухсекционность радиатора в 95% случаев обусловлена наличием 3х вентиляторов
> Больше площадь контакта = лучше, так что желательно наличие основания. Даёт мощный эффект на карты с маленьким чипом и огромным радиатором; на этом же правиле держится пункт выше, ведь при такой схеме идёт максимальная площадь трупок соприкасается с пластинами, в то время как у U-образной схемы половина трубки сычует за картой без контакта с чем-либо
> Любая уважающая себя карта должна иметь контакт VRM с радиатором и охлаждение на VRAM
> У любой уважающей себя карты должно быть минимум 2 вентилятора
> Карты серии GT (= офисные затычки) и GTX x50 (= околоигровые лоуенд карты) себя не уважают. Там греться попросту нечему и поэтому требования не такие строгие
> Турбинные карты могут оказаться вполне себе хорошим компромиссом между ценой, начинкой и внешним видом. Последний, кстати, чаще всего сосёт

ЧАСТЬ 1 - ВЫБИРАЕМ ПИТАЛОВО
Итак, на радиатор взгялнули и он нас устроил? Отлично, теперь настало время страдать!
Вот мы имеем VRM ака "Питалово", оно отвечает за...Питание? М? Да, всё настолько банально. Так или иначе, оно радостно греется и без нормального питальника тебе не светит ни разгон, ни долговечность, ни +10 нанометров к пипиське. Меряется количеством фаз питания и качеством компонентов (как правило, параметры взаимосвязаны)
Выглядит оно как-то так:

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

- "Ух ты! Какая большая! Но в чём проблема? Где страдания?"
О! Причин страдать много и даже больше! Для начала расскажу, что где:
> большие серые штучки - это дроссели ака "катушки"
Кстати, сверху лежат катушки с другой маркировкой, это отдельные фазы под память.
> справа предположительно мосфеты
> слева предположительно конденсаторы
Уже видите первую причину? Из-за того, что технологии постоянно идут вперёд, становится сложно на глаз понять, ху ис ху. Катушки, может, и не меняются, а вот с мосфетами и кондерами постоянно происходят какие-то метаморфозы - то 2 мосфета срастутся в один, то из "типичного" конденсатора-баночки мы получим плоскую хрень, косплеющую мосфет
А теперь поясним подробнее:
> мосфеты. Выглядят как "маленькие микросхемки", тусующиеся рядом с дросселем. Крайне часто бывают в соотношении "2 мосфета на дроссель", но я видел вариант на 3 мосфета. Обычно находятся "справа" от дросселя, которые находится "справа" от чипа, поближе к доппитанию. Как правило, именно они греются сильнее всех!
> конденсаторы. Обычно выглядят как "баночка", чем и характерны. Нынче могут принимать другие формы, смотрите пример выше. Часто имеют соотношение "2 кондера на 1 дроссель", но так происходит не всегда
> дроссели. Как я уже писал, это - самая заметная часть фазы питания. Обычно 1 дроссель = 1 фаза, так что их можно просто подсчитать буквально "по головам", но тут кроется повод для страданий номер 2 - удвоители! Выглядит это примерно так:
1. Ты видишь стопицот дросселей. Там даже пылинке некуда упасть!
2. Ты смотришь на конкурента. У него на N фаз меньше за те же деньги
3. - "Ха! Лох!" - думаешь ты и покупаешь карту с, как ты думаешь, стапитяста фазами питания
4. Ты никогда не узнаешь, что в той схеме дросселей с обвязкой было больше, чем реальных фаз питания
Замечу, что 1 честная фаза < 1 фаза с удвоителем < 2 честные фазы, вот только набор удвоителей займёт в 2 раза больше места. Да, "a < b" значит, что b лучше, чем a. Ещё есть такая дичь, как УТРОИТЕЛИ, но на видеокартах я такого не встречал, зато на матплатах от гиги прошлых лет - запросто.
Ну что, ощущаете масштаб крышеноса? Что-ж, пора рассказать про то, как это добро выбирать:
Основа ака "метод 0": гуглим плату референсного исполнения нашего чипа для сравнения. Гуглим хотя бы фото платы нужной нам карты
Метод 1, простой: Подсчитать по головам. Тут всё просто - сравниваем число фаз у нашей карты и референса. Если больше или равно - значит, всё хорошо
Метод 1.5: Берём метод 1 и добавляем для сравнения другие карты, которые нам понравятся. Не забывайте про турбины - та турбинка 2070я от асуса имела на 2 фазы больше, чем конкурирующие исполнения за ту же цену
Метод 2, средний: Подходим к делу с умом. Гуглим обзор, смотрим, сколько там фаз и сравниваем. Лол, так можно было. Возможен FAIL из-за не существования обзора. Остерегайтесь тупых обзорорщиков, не знающих про существование удвоителей!
Метод 3, сложный: Подходим к делу с разумом. Гуглим обзор, дергаем с него модели VRM-контроллера и качаем датащиты. Смотрим спецификацию. Легко выявлет удвоители
Метод 4, Оби-Ван Кеноби: Слушаем силу. Понимаем, что там одинаковые контроллеры и вообще там плата референса. Расстроенные уходим искать что-нибудь по-лучше.
Ах, да, ещё пара моментов. Иногда производитель по приколу выкидывает часть питалова в лес, поближе к чипу, погулять, подышать свежим воздухом, ведь в основной цепи питания воздух загажен и вообще там температура под сотню. Обычно так поступают с отдельным питаловом под память, на которое нам глубоко положить, ибо оно почти всегда одинаково, но иногда там бывает различная НЁХ и даже часть обычного питания. А ещё там может быть "зеркало" для удвоителя - скажем, 6*2 фаз расположены по схеме: "6 с одной стороны, 6 с другой", примерно так поступили зелёные с TITAN V.
Подытожим:
> Больше фаз = больше разгон и выше надёжность, ибо меньше нагрузка на каждую фазу
> Без контакта с основным радиатором легко разгоняются свыше сотни градусов и затем ты можешь поулчить шанс размять ноги и прогуляться до ближайшего сервис-центра производителя или почты, если покупали за границей
> 1 честная фаза хуже, чем 1 фаза с удвоителем
> 1 фаза с удвоителем хуже, чем 2 честные фазы
> Часто достаточно просто посчитать катушки
> Не советую считать катушки в присутствии радиоэлектронщиков, электриков и прочей нечисти - харкнут в лицо, и поделом
> Самый надёжный способ сравнить - это по контроллеру, датащиты, как правило, спокойно гуглятся
> Слишком сложные карты могут иметь несколько контроллеров!
> Записывается кол-во фаз питания так: a+b, где a - на чип, b - на пососать на память. Например, на фото выше 7+2, а были бы там удвоители, то могло бы быть 7*2+2
> В определённый момент случается так, что в искомом ценовом сегменте становятся +- одинаковые питальники, что с удвоителями, что без них
> Вы только-что скурили свыше 17 тысяч символов, предположительно, за один раз
> Как правило, производитель выпускает 3 линейки карт: для лоу-, мидл- и хай-енд сегментов. В линейке обычно по 2 карты на одном чипе - разогнанная и обычная. ИМХО - абсолютно безполензое деление, ибо разогнать карту самому (гораздо сильнее, чем с завода) можно без особого труда и, что гораздо важнее, самостоятельный разгон бесплатен
> А ещё OC (OverClocked, разогнанная) версия карты с переплатой в пару тысяч не гарантирует наличия в ней отборного чипа. Вообще, случаи, когда ОС карта отличается чем-то, кроме частот, очень редки. Но они есть, например, стрикса 1060 была громкой, а 1060 ОС практически не шумела
> Короче, выглядит на практике это так: асус 2070 турбо, 3 модификации асус 2070 дуала и 3 модификации асус 2070 стрикс; асус выпустили 2 разгонные версии вместо одной

Выбираем видеокарту (с умом) Разгон видеокарты, Технологии, Современные технологии, Asus, Nvidia, Пикабу образовательный, Видеокарта, Длиннопост

На этом статья подходит к концу. Есть ОЧЕНЬ много вещей, о которых мне следовало бы рассказать в этом посте, но он и так вышел большим, так что буду пилить отдельное продолжение. А под конец маленький лайвхак - полученные знания применимы не только к видеокартам, ибо перед физикой все равны (речь про охлаждение процессора и питальники материнских плат)

Показать полностью 14
Отличная работа, все прочитано!