Как установить полноценный аналог ChatGPT на домашний ПК

Если последние пару лет вы хоть немного интересовались развитием технологий, то наверняка уже слышали о таком революционном инструменте на основе нейронных сетей, как ChatGPT. Инструмент вне сомнений потрясающий, ибо позволяет всего за пару кликов получить множество полезной информации на любую тему. Однако IT-гиганты не были бы сами собой, если бы не взяли столь полезный инструмент под тотальный контроль и не ограничили его итоговый функционал для широкой публики. В этой небольшой инструкции вы узнаете, как совершенно бесплатно установить на свой личный ПК полноценный аналог ChatGPT без какой-либо цензуры.

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

Минимальные требования

  • CPU: Минимум 8-поточный процессор с поддержкой AVX (Лучше AVX2). Отлично подойдут процессоры семейства AMD Ryzen 1600+.

  • RAM: 8-16 Гб современной памяти стандарта DDR4/5.

  • GPU: Не требуется. Вся обработка происходит силами CPU.

Узнать характеристики своего ПК и поддержку процессором необходимых инструкций вы всегда можете с помощью бесплатной утилиты CPU-Z.

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

AVX-инструкции

Установка

Для работы ChatGPT на домашнем ПК необходимо выполнить установку интерпретатора, чтобы компьютер понимал, как, собственно, ему работать с нейросетью, и отображал ответы в понятном человеку виде.

1. Скачачиваем программу Alpaca Electron с GitHub и выполняем её установку. Если вы используете Windows, то Alpaca-Electron-win-x64-v1.0.5.exe это ваш выбор. (Скриншоты в лучшем качестве доступны здесь).

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

2. Запускаем программу.

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

Пока перед нами всего лишь пустое окно с полем ввода и статистикой потребляемых ресурсов. Чтобы программа заработала, нам наобходимо скачать ей мозги (обученную модель нейросети).

3. Скачиваем модель без цензуры с веб-сайта huggingface.co, где люди делятся заранее обученными моделями. Для лучшей совместимости с ПО выбирайте модели с поддержкой библиотеки llama.cpp и файлы, в название которых есть GGML. В пути до модели не должно быть русских букв! Так же имейте в виду, что чем больше у выбранной модели квантов (q2, q4, q8), то тем больше ей требуется ресурсов ПК для беспроблемной работы.

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

P.S. Дополнительно вы можете попробовать последнюю совершенную модель WizardLM-30B-Uncensored-GPTQ (Не протестирована). Подробней почитать о ней можно здесь. Я же только поясню, что возможности WizardLM-30B на 97,8% соответствуят возможностям ChatGPT 4. И всё это без какой-либо цензуры!

4. Открываем Alpaca-Electron и через левую вкладку Change model указывем ему путь до файла нашей модели. В моём случае это ggml-model-q41.bin.

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

Вот, собственно, и всё! С этого момента в ваших руках кладезь знаний всего человечества. Вы можете попросить нейросеть написать вам реферат для института, исправить ошибки в тексте статьи или поискать нужную вам информацию. В общем, всё что угодно! Выключим интернет и зададим парочку вопросов для проверки работоспособности нейросети.

Внимание!

Для этой инструкции я умышленно ограничил выбор модели. Если вы хотите использовать версию с ответами на всё и вся и без каких-либо ограничений, то воспользуйтесь llama-30b-supercot-GGML/OpenAssistant-SFT-7-Llama-30B-GGML (Не проверены) или поиском.

Программа также принимает любые другие файлы моделей с 4-битным квантованием .bin. Если вы можете найти другие файлы моделей в формате .bin, вы можете использовать их вместо файла, рекомендованного в руководстве, чтобы экспериментировать с различными моделями. Как всегда, будьте осторожны с тем, что вы загружаете из Интернета.

Автор программы Alpaca Electron

Демонстрация

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

Несмотря на то, что я забыл попросить её отвечать на Русском, она весьма точно ответила на все заданные вопросы. А если учитывать, что при этом был полностью выключен интернет, то это просто поражает!

Если не работает!

Если модель не хочет загружаться в Alpaca Electron, то обязательно попробуйте аналогичный интерпретатор Koboldcpp. Далает всё тоже самое, но модели переваривает намного лучше!

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

1. Запускаем программу от имени администратора.

2. Выставляем количество потоков CPU.

3. Выбираем модель.

4. Пользуемся.

Проверенные модели

Заключение

Страшно представить, какими возможностями обладает ChatGPT лишённый ограничений. Тем не менее важно помнить, что это всего лишь инструмент, и только человек решает, как и для чего его использовать. Уважайте свободу, используйте проверенное ПО и ни в коем случае не предавайте себя!

Как установить полноценный аналог ChatGPT на домашний ПК Нейронные сети, ChatGPT, Компьютер, Гайд, Длиннопост

Оригинал - выложено с разрешения автора.

Вы смотрите срез комментариев. Показать все
Автор поста оценил этот комментарий

Ну скажем так, 30B нейронки пробовать на ГПУ — изначально плохоя идея, будете ждать ответа лет н-цать. Нейронки с меньшими параметрами может и заведутся, но тоже со скрипом. Чтобы играться с подобными вещами нужно что-то поприличнее чем проц и 8-16гб оперативки. Если есть лишний терабайт на ссд лучше сделать swap. Плюсом к этому 4-бита на и так малое количество параметров будет производить лютую ахинею, но именно из-за этого требования к параметрам урезается.
TL;DR: На плохом железе — результат соответствующий, магии из коробки ждать не стоит.

раскрыть ветку (8)
1
Автор поста оценил этот комментарий

30b нейронки на gpu большинство попробовать не может - gpu памяти у обычных людей столько просто нет. Но у тех, у кого есть, пишут что работает оно намного быстрее чем на процессоре, но разница не на порядки, а скорее в разы.

Никакой дополнительный swap с нейронками использовать нельзя: если модель хоть немножко не влезла в память, она будет работать на 2-3 порядка медленнее, что не имеет смысла. Логичнее докупить памяти или же взять модель поменьше. Поэтому софт, который работает с моделями, нередко имеет спец-параметры для блокировки памяти: чтобы модель попыталась занять всю память, и не давала себя выгружать в swap во время работы.

раскрыть ветку (2)
1
Автор поста оценил этот комментарий

Тут просто вопрос  в том, что зачем их было включать в исходный пост, если энивей, без кластеров не поднять.
По поводу swap согласен, фигню написал. Предполагал, что возможно забить недостаток виртуальной памятью.
Есть вариант еще использовать  DeepSpeed, говорят дает прирост в быстродействии, но лично у меня так и не вышло.

раскрыть ветку (1)
Автор поста оценил этот комментарий

Без кластера это можно поднять на процессорах, чем многие люди и занимаются. Gpu-память дорогая, но обычная оперативная память намного дешевле и гораздо более доступна: у многих есть 64 или даже 128гб обычной оперативки. Так например на 32Гб памяти и более-менее современном процессоре на комфортном уровне идут 30b нейронки. А на 64Гб памяти уже можно запускать 65b нейронки - идут они уже медленнее, менее комфортно, но их ответы глубже, из-за чего некоторые пользуются именно ими.

Автор поста оценил этот комментарий
если у меня 2696v3 и 128гб рамы -- заведется?
раскрыть ветку (3)
Автор поста оценил этот комментарий

Да

раскрыть ветку (1)
Автор поста оценил этот комментарий
спасибо, попробую
Автор поста оценил этот комментарий

Думаю, должно получиться что-то интересное.

Автор поста оценил этот комментарий

Если есть топовое серверное железо, с 2тб оперативки, подскажите,что можно самое мощное запустить?

Вы смотрите срез комментариев. Чтобы написать комментарий, перейдите к общему списку