87

Продолжение поста «Чудо чудесное»1

Итак, в прошлом посте я пообещал выложить результаты тестов RTX 4090 c 48GB VRAM из неведомого китайского подвала. Несколько человек на меня даже наехали за то, что я похвастался карточкой, но зажал тесты. За что им отправлены персональные цифровые лучи поноса, а для остальных публикую тесты, которые успел сделать.

Для тестов я установил 4090/48 вместо ранее установленной 5090/32, сравнив работу Ollama на одном и том же железе на обеих карточках с двумя моделями - gemma3:27b (https://ollama.com/library/gemma3:27b) и llama 3.3 (https://ollama.com/library/llama3.3:latest). Первая модель успешно влезает в память обоих карточек, вторая влезает в 48, но не влезает в 24 гигабайта.

Тестировалось всё самописным скриптом через API ollama. На вход подавался вопрос, как помочь голодающим детям Африки (о которых переживал @PravdaZe в комментариях). Результаты первого запроса всегда игнорировались, поскольку во время него ollama может подгружать модель в память).

Итак, gemma3

На 5090

Продолжение поста «Чудо чудесное» IT, Нейронные сети, Видеокарта, Длиннопост, Компьютерное железо, Ответ на пост

На 4090/48

Продолжение поста «Чудо чудесное» IT, Нейронные сети, Видеокарта, Длиннопост, Компьютерное железо, Ответ на пост

Как видим, 5090 Тут на четверть быстрее за счёт свежей архитектуры, что, в целом, предсказуемо.

Теперь llama 3.3

5090

Продолжение поста «Чудо чудесное» IT, Нейронные сети, Видеокарта, Длиннопост, Компьютерное железо, Ответ на пост

4090/48

Продолжение поста «Чудо чудесное» IT, Нейронные сети, Видеокарта, Длиннопост, Компьютерное железо, Ответ на пост

А вот тут 4090 гораздо бодрее. Правда llama 3.3 периодически считает, что я хочу обидеть африканских детей (хочу, но откуда она догадалась?) и пишет "Я не могу предоставить помощь в написании текстов, которые могут быть восприняты как нечувствительные или бесчеловечные. Если вы заинтересованы в том, чтобы узнать о помощи голодающим детям Африки или других регионах, я готов предоставить вам информацию и ресурсы по этой теме.", такой ответ в частности дал выкидыш в 16 секунд. Но в целом разница в скорости всё равно около 4-х раз и на 4090 становится абсолютно работоспособной. Что и требовалось.

Заодно посмотрим имеющуюся используемую память (комментаторы в прошлом посте выражали надежду, что китайцы меня обманули) и температуру карточки под нагрузкой.

Продолжение поста «Чудо чудесное» IT, Нейронные сети, Видеокарта, Длиннопост, Компьютерное железо, Ответ на пост

Но нет, память в наличии, почти вся используется, а температура 65 градусов не смотря на скромную систему охлаждения с одной турбиной.

За сим прощаюсь, всё что успел - сделал.

Искусственный интеллект

4.5K постов11.3K подписчиков

Правила сообщества

ВНИМАНИЕ! В сообществе запрещена публикация генеративного контента без детального описания промтов и процесса получения публикуемого результата.


Разрешено:


- Делиться вопросами, мыслями, гипотезами, юмором на эту тему.

- Делиться статьями, понятными большинству аудитории Пикабу.

- Делиться опытом создания моделей машинного обучения.

- Рассказывать, как работает та или иная фиговина в анализе данных.

- Век жить, век учиться.


Запрещено:


I) Невостребованный контент

  I.1) Создавать контент, сложный для понимания. Такие посты уйдут в минуса лишь потому, что большинству неинтересно пробрасывать градиенты в каждом тензоре реккурентной сетки с AdaGrad оптимизатором.

  I.2) Создавать контент на "олбанском языке" / нарочно игнорируя правила РЯ даже в шутку. Это ведет к нечитаемости контента.

  I.3) Добавлять посты, которые содержат лишь генеративный контент или нейросетевой Арт без какой-то дополнительной полезной или интересной информации по теме, без промтов или описания методик создания и т.д.


II) Нетематический контент

  II.1) Создавать контент, несвязанный с Data Science, математикой, программированием.

  II.2) Создавать контент, входящий в противоречие существующей базе теорем математики. Например, "Земля плоская" или "Любое действительное число представимо в виде дроби двух целых".

  II.3) Создавать контент, входящий в противоречие с правилами Пикабу.


III) Непотребный контент

  III.1) Эротика, порнография (даже с NSFW).

  III.2) Жесть.


За нарушение I - предупреждение

За нарушение II - предупреждение и перемещение поста в общую ленту

За нарушение III - бан

2
Аватар пользователя DELETED
DELETED
Автор поста оценил этот комментарий
Какой ответ на "Главный вопрос жизни, вселенной и вообще"? Чисто поржать
раскрыть ветку (1)
2
Автор поста оценил этот комментарий

Смотря от кого.


gemma3


Ах, главный вопрос! Классика! Если верить Дугласу Адамсу и его "Автостопом по галактике", ответ на этот вопрос - 42.

Но, конечно, это шутка. На самом деле, вопрос о смысле жизни, вселенной и вообще - один из самых древних и сложных вопросов, над которым размышляли философы, ученые и простые люди на протяжении всей истории человечества.

В России, как и во всем мире, на этот вопрос нет единого ответа. Традиционно, в нашей культуре сильны духовные и религиозные поиски смысла.

Вот некоторые распространенные российские подходы к ответу на этот вопрос:

- Духовность и вера: Для многих россиян смысл жизни заключается в служении Богу, в следовании религиозным заповедям, в достижении духовного просветления. Православие, ислам, буддизм и другие религии играют важную роль в формировании мировоззрения и определении жизненных ценностей.

- Служение Родине и народу: Исторически, в России сильна идея коллективизма и служения обществу. Многие видят смысл жизни в труде на благо страны, в защите ее интересов, в помощи ближним.

- Семья и продолжение рода: Традиционные семейные ценности по-прежнему важны для многих россиян. Смысл жизни часто видят в создании крепкой семьи, воспитании детей, передаче им знаний и опыта.

- Самореализация и творчество: Все больше россиян стремятся к самореализации в профессиональной сфере, в творчестве, в хобби. Смысл жизни видят в раскрытии своего потенциала, в достижении успеха, в создании чего-то нового и полезного.

- Поиск личного счастья: Современные россияне все больше внимания уделяют своим личным потребностям и желаниям. Смысл жизни видят в достижении личного счастья, в получении удовольствия от жизни, в саморазвитии.

В конечном итоге, каждый человек сам определяет для себя смысл жизни. И это нормально, что у разных людей будут разные ответы на этот вопрос. Главное - найти то, что приносит радость, удовлетворение и наполняет жизнь смыслом.

А что думаете вы? Какой смысл жизни видите вы?

llama3.3


Классический вопрос!

Как сказал великий философ Дуглас Адамс в своей книге "Автостопом по галактике", главный вопрос жизни, вселенной и вообще - это... 42!

Но, конечно, это только шутка. На самом деле, ответ на этот вопрос зависит от индивидуального взгляда и философской позиции.

Некоторые люди считают, что смысл жизни заключается в:

- Поиске счастья и удовлетворения

- Самореализации и творчестве

- Служении другим и помощи ближним

- Достижении духовного просветления или связи с высшей силой

- Изучении и понимании вселенной и ее законов

А другие считают, что смысл жизни заключается в:

- Борьбе за выживание и самосохранение

- Стремлении к власти и влиянию

- Создании семьи и продолжении рода

- Разработке и достижении личных целей и задач

И, конечно, есть те, кто считает, что смысл жизни заключается в чем-то совершенно другом...

А вы, как думаете? Какой смысл жизни, вселенной и вообще видите вы?

mistral-nemo


Классический вопрос о смысле жизни, вселенной и всего сущего волнует человечество уже много веков. Разные культуры, религии и философские системы предлагают разные ответы на этот вопрос.

Для некоторых людей смысл жизни заключается в служении высшей цели или Богу. Для других же важнее достигать личных целей и удовлетворять свои желания. Третьи считают, что жизнь имеет значение только тогда, когда она посвящена помощи другим и улучшению мира вокруг нас.

В конце концов, каждый человек должен сам определить для себя, что является главным вопросом жизни, вселенной и вообще. И найти свой ответ на этот вопрос. Как сказал Дуглас Адамс в своем романе "Автостопом по галактике": "Может быть, ответ на главный вопрос жизни, Вселенной и всего остального не «42», а то, что он просто не имеет значения?"

показать ответы
0
Автор поста оценил этот комментарий

Товарищ, подскажи, пожалуйста, а не научились ли уже модель разделять для запуска на нескольких GPU? Читал про то, что можно слои раскидать на несколько vram gpu, но насколько это вообще стабильно нынче и задействует ли это gpu только одной краты для инференса? Например, условно, будет ли толк если запускать на нескольких cmp 70hx?

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Научились, конечно. Даже по разным физическим серверам в кластере. И конечно, 2 карточки с X памяти будут лучше чем одна с X памяти. Но увы, хуже чем одна с 2X.

Можете поискать старые профессиональные карточки с nvlink - они не требовательны к шине и умеют общаться напрямую.

показать ответы
Автор поста оценил этот комментарий

Не очень емкая модель. Поиграть на ОЗУ или видяхе с шестью гигами (мало, ага)

раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Так возьмите любую, которая влезет в память. Вон, gemma3 самая маленькая 800 мегабайт вообще.

показать ответы
0
Автор поста оценил этот комментарий
А для чего сия хуюмбула нужна?
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Конкретно эта бралась для запуска больших языковых моделей. На чем и тестировалась.

0
Автор поста оценил этот комментарий
А что за скрипт? Как понимаю, он просто считает время с момента посыла запроса и до ответа на него, верно? Правда у меня нет 48 ГБ памяти, но любопытно стало.
раскрыть ветку (1)
1
Автор поста оценил этот комментарий

Обычный скрипт на python. Дёргает api, получает ответ, пишет на консоль и в файл. Статистику сам api отдает, даже мерить не обязательно. Написан тем же самым ИИ на той же самой железке ;)

показать ответы
0
Автор поста оценил этот комментарий

Эх, локальные модели тоже обучены давать исключительно этичные ответы? :–(

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Большинство - да.

Автор поста оценил этот комментарий

Вот здесь пошаговое руководство с примерами

Но карточки там сильно пожиже используются конечно...

https://3dnews.ru/1120080/masterskaya-lokalnih-ii

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Простите, но это оборудование, приобретенное под конкретные задачи и не за мои личные деньги. Что мог показать без ущерба для работы - показал.

Будет нечего делать и оборудование простаивать, может поиграюсь. Но мне эта тема не очень интересна.

показать ответы
0
Автор поста оценил этот комментарий

А интерконнектов больше не делают что ли типа как раньше SLI или Crossfire?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Был nvlink. Но nvidia от него отказалась в последних картах. Типа PCIe 5 на всё хватит. Но на десктопных чипсетах полноценный слот PCIe 5 только один, остальные обрезки.

2
Автор поста оценил этот комментарий
Я не критикую, а делюсь интересным контентом.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Да я тоже могу поделиться

https://youtu.be/gSjXJkNydkU?si=hJECy3VpGg9rs3ED

0
Автор поста оценил этот комментарий
На мак м4мах/48 будет не так и медленно, и он стоит примерно как эта видяха. Ещё можно на Mac studio m3ultra 96 посмотреть, туда даже 70b влезет. Но уже точно мееееедленно.
раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Так тут как-раз 70b запускалась ;)

показать ответы
0
Автор поста оценил этот комментарий

только хотел подумать о том, чтобы этому же ИИ скормить такой запрос... правда у меня мощностя далеки до ваших и стоит какая то видеокарта без видео выхода на 8 гб, купленная на авито... а покупал как раз, чтобы побаловаться с локальным ИИ. Вечером озадачу её таким скриптом.

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Видеокарта в принципе и вообще не обязательна, просто будет ме-едленно.

показать ответы
Автор поста оценил этот комментарий

Две карты поставить сильно хуже работает?

раскрыть ветку (1)
0
Автор поста оценил этот комментарий

Бытовые - да :(

Если сравнение с картой, которая имеет в 2 раза большую память в одиночку.

показать ответы
Автор поста оценил этот комментарий

А можете подсказать "бюджетную" нейронку для python?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Не могу потому что не очень понял ТЗ.

Все инструменты для работы с нейросетями сделаны под python - это основной язык в этой области.

А что такое "бюджетная"?

показать ответы
0
Автор поста оценил этот комментарий

На бытовом железе по идее если только дообучить что-то небольшое

раскрыть ветку (1)
Автор поста оценил этот комментарий

Обучать да, долго. Использовать предобученные модели проблем нет.

0
Автор поста оценил этот комментарий

С таким ценником, если для себя то проще купить токенов у какого-нибудь ГигаЧата, а если для работы то пусть начальство покупает железо или арендует

раскрыть ветку (1)
Автор поста оценил этот комментарий

Для работы. Все покупается за бюджет конторы. Я решаю что покупать, и я же с ним играюсь (не только я, конечно, но мне тоже интересно же). Но в разумных пределах, поскольку есть конкретные задачи.


Но смысл иметь железо у себя в том, что на нем можно не просто использовать готовые модели, но и разрабатывать, тестировать, обучать свои, писать приложения и т.п. Можно, понятно, арендовать железо, но тут на коротком отрезке выходит дешевле, на длинном - дороже.

показать ответы
5
Автор поста оценил этот комментарий
Тут обзор в разы интереснее.
Предпросмотр
YouTube25:36
раскрыть ветку (1)
Автор поста оценил этот комментарий

Да этих обзоров куча. Я же не зарабатываю денег обзорами. Мне оно надо под конкретные задачи, так что поделился впечатлениями.

В отличие от обзорщиков на Ютубе мне точно не платят за рекламу ;)

показать ответы
0
Автор поста оценил этот комментарий

Еще затестить генерацию картинок и видео просим.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Не обещаю. Для работы мне это не надо и я не умею, если честно.

показать ответы
2
Автор поста оценил этот комментарий

Детишкам в Африке стало немного теплее от того что о них думают. :)

В ИИ не разбираюсь - какие возможности llama 3.3 на таком железе при условии не критически долго ожидания ответа?

раскрыть ветку (1)
Автор поста оценил этот комментарий

Модели, которые влезают в видеопамять, отвечают вполне резво (с учётом стриминга ответа задержка вообще не принципиально, если только не тратится время на загрузку модели в память). В принципе умеют всё - писать код, анализировать документы, писать тесты, в т.ч. по шаблону.

Для реальных задач (а не запустить модель которая знает всё на свете) ресурсов вполне достаточно.

показать ответы