Запускаем DeepSeek локально и сраниваем модели
Вижу явный перебор с хайпом по теме дикпика дипсика. С одной стороны модель, которая работает на сайте явно имеет много преимуществ. Но вот то, что ее можно установить на свой компьютер и будет работать гораздо лучше любых других моделей это явное преувеличение. К такому выводу я пришел когда решил проверить всё сам.
Проверить можете и вы. Привожу простой рецепт для Linux, потому что понятия не имею как запустить на винде.
Для запуска использовал вот этот репозиторий:
https://github.com/ntimo/ollama-webui
На Linux чтобы запустить DeepSeek локально
Клонируем репу, предварительно установив git:
git clone https://github.com/ntimo/ollama-webui
2. В скачаной директории исправляем docker-compose.yml, раскоментировав раздел 'ollama' для поддержки Nvidia GPU (удалить #). Если запускать на CPU, то этот пункт пропускаем.
Тут может быть проблема в том, что yaml формат очень строг к отступам. Редакторы могут заменять пробелы и табуляции, а потом при запуске будет выдавать неясные ошибки.
# Uncomment below for GPU support
# deploy:
# resources:
# reservations:
# devices:
# - driver: nvidia
# count: 1
# capabilities:
# - gpu
3. Устанавливаем docker и docker-compose
для вашего дистрибутива загуглите, но скорее всего это что-то вроде
sudo apt install docker docker-compose-plugin
4. Запускаем:
docker-compose up
5. Profit!
Найти веб-морду можно на http://localhost:3000/
Дальше в вебморде нужно нажать создание нового чата и установить модель, выбрав ее название вот тут: https://ollama.com/library
Итак, тестирую.
В качестве промпта использую "Расскажи на русском что ты знаешь про Пикабу и про минусы". Запускаю на видеокарте Nvidia RTX4070 Ti Super 16Gb. Но модели меньше 32b хоть медленно, но работают даже на видеокартах 8-10Gb. Как я понял, размер видеопамяти примерно должен соответствовать размеру модели иначе очень проседает скорость генерации ответа. К примеру, на GPU 16Gb модель 70b размером в 32 гига дает ответ около 5 минут.
Удивляют различия в результатах с требованием "на русском" и без него. Прям совсем бред несет. Смотрите сами.
К сожалению AI даже не понял такой сложный вопрос.
Кроме того что не понял, что надо на русском и проигнорировал, в результате выдал мусор.
Это тот минимум, которым можно пользоваться: выдал результат на русском, а то как дошел к результату на английском.
Чтобы увидеть насколько всё плохо локально в DeepSeek привожу результат модели gemma2:9b, которая занимает всего 5.4Gb и которая будет работать практически на любом компьютере даже без видеокарты.
Вывод
Обман заключается в том, что придумана модель, которая даже с игровой видеокартой может выдать результаты лучше всех популярных AI. Перед нами явно раздутая афера, то ли для введения в заблуждения рынков, то ли для раскрутки продаж на основном сайте ДипСика. А скорее всего и то и другое можно без хлеба. Китайцы красавцы что раздули такой хайп, но вложено в модель и в вычислительные мощности однозначно не 5 лямов.
Установка драйверов Nvidia
В общем, полгода назад тупо перестали устанавливаться новые драйвера на видеокарту. Новая версия, архивная - пофигу, просто обрывается становка с ошибкой (картинка). Уже часть игр на вечерок не могу тупо запустить из-за устаревших драйверов.
Пробовал все вариант - и вручную, и реестр чистил. В итоге забил, сделал "чистую" установку и просто нахуй сидел без драйверов. При этом GeForce Experience установился без проблем, но там драйвера июня 2023. И он точно также обрывает обновление драйверов. Толи где-то что-то удалил лишнее, когда место чистил на диске. Я уже думаю нахуй просто новый комп купить, до того уже заебала эта тупая проблема, но причину-то все равно найти хочу.
Причем конкретной ошибки инсталлятор не выдает. Если кто-то сталкивался с проблемой, когда драйверы просто тупо перестали обновляться, смогли ли решить или только винду под переустановку?
Windows 10, RTX 3070.
Видюхе гг (иза бетки стима возможно)
хеллоу начну сразу с предысторий и фото:
GTX 750 TI 4 GB (winforce by gigabyte)
Всё работало хорошо, пока я не нашёл новость о новой функции Steam для записи игр. Любопытство взяло верх, и я пошёл качать обновление. Решил протестировать его в довольно нетребовательной игре (GeForce GTX 500 series или аналогичная). ФПС был стабильно 100-114, а потом случилось это:
Видеокарта в тот момент перестала подавать признаки жизни. После перезагрузки спикер не издавал звуков (автоматически загрузилась встроенная графика, а BIOS сбросился).
Что самое удивительное, софт от NVIDIA даже после удаления драйвера каким-то хуем продолжает работать в фоне.
кстати забыл сказать после "смерти" видюхи я почувствовал запах гари но ничего не горело внешним осмотром я не увидел ничего нового
в скором времени я пойду в steam support спрашивать
Конфиг:
резань 3 3200G
8 гигов r9 (2 плашками по 4)
1 терабайт жд
винда 10 про 22h2 19045.4713
vega 8
Ответ на пост «Интересно, у NVIDIA есть своё ЧВК?»3
Пост не против @salkidv. Я не эксперт, но меня задело. Про ВВП России от меня данных не будет, но скажу, что с такими санкциями, любая страна Евросоюза загнулась бы.
А теперь, про Nvidia.
Рыночная стоимость Nvidia превысила ВВП России и большинства других стран мира. Разработчик графических процессоров и других компьютерных систем Nvidia, которые в том числе, делают много разных видеокарт, их капитализация превысила 2 триллиона долларов. А это больше ВВП большинства стран мира, хотя эта цифра высосана из пальца и нарисована на бумаге. Плюс, американцы любят сами себя так развлекать. Это такой способ, ты объявляешь какую-то компанию, пиздец какой оцененный,подзарабатываешь на этом огромное количество денег на акциях, потом их продаешь, а потом компания схлопывается.
Эту цитату я выдернул из нейросети, которая перевела в текст видео из оригинального поста. Кстати, сервера для этого всего, используют ГП от Nvidia. Nvidia очень быстро вкатилась в AI, и предложила своё решение. В своё время, в майнинге она тоже крайне быстро предоставила решение для энтузиастов, и не прогадала - видеокарты скупали как горячие пирожки.
потом появились разные алгоритмы, где выгоднее майнить на AMD.
Но сейчас речь о другом. Nvidia следит за трендами, более того, компания предлагает решение сразу.
По данным на конец 2024 года, доля на рынке дискретных(отдельное устройство, а не встроенное в ваш процессор) - более 80%.
В Промышленных и серверных системах, NVidia тоже лидирует. Тем, кто работает с Нейросетями это известно.
Цифры взял отсюда:
https://3dnews.ru/1092266/v-proshlom-kvartale-80-rinka-nasto...
Аккаунта на 3д нет, новости больше 6-ти месяцев, как реклама не прокатит
Танец с бубном уже советовали?
Из рекомендацией производителей БП Seasonic счастливым обладателям блоков питания с разъемом 12VHPWR для новых видеокарт nVidia, которые еще не заебались нарадовались покупке:
Carefully use a gentle heat source (such as a hair dryer) to carefully heat the area of the cable where you wish to make the bend.
Осторожно воспользуйтесь деликатным источником нагревания (таким как фен для волос) для осторожного нагревания участка кабеля, который вы хотите изогнуть.
И отдельно доставляет:
Designed for a lifetime of 30 mating cycles, a normal standard for connectors
Разработано в расчете на жизненный цикл в 30 сопряжений – обычный стандарт для разъемов.
У меня один вопрос: Are you ahueli tam?
Так себе новость...
Наткнулся в ленте новостей на вот это, сайт известный. даже почитал.
Не возьмусь говорить за весь майнинг т.к. не шарю. Но конкретно в этой новости утверждается что она окупится за 560 дней, но ни слова не говорится об инфляции, возможности поломки, налогах, усложнении вычислений и вообще в принципе о дичайших скачках курса и прочих рисках. Бесит такая хуета. Новость года просто блять. Знатоки больно тапками не бейте, я пишу только о самой новости которая просто раздражает своей тупостью и заголовком.