Горячее
Лучшее
Свежее
Подписки
Сообщества
Блоги
Эксперты
Войти
Забыли пароль?
или продолжите с
Создать аккаунт
Регистрируясь, я даю согласие на обработку данных и условия почтовых рассылок.
или
Восстановление пароля
Восстановление пароля
Получить код в Telegram
Войти с Яндекс ID Войти через VK ID
ПромокодыРаботаКурсыРекламаИгрыПополнение Steam
Пикабу Игры +1000 бесплатных онлайн игр Таверна «Дважды Гусь» ждет своего нового управляющего, решай проблемы всех посетителей и максимизируй прибыль таверны.

Таверна «Дважды Гусь»

Мидкорные, Головоломки, Бизнес

Играть

Топ прошлой недели

  • AirinSolo AirinSolo 10 постов
  • Animalrescueed Animalrescueed 46 постов
  • mmaassyyaa21 mmaassyyaa21 3 поста
Посмотреть весь топ

Лучшие посты недели

Рассылка Пикабу: отправляем самые рейтинговые материалы за 7 дней 🔥

Нажимая «Подписаться», я даю согласие на обработку данных и условия почтовых рассылок.

Спасибо, что подписались!
Пожалуйста, проверьте почту 😊

Помощь Кодекс Пикабу Команда Пикабу Моб. приложение
Правила соцсети О рекомендациях О компании
Промокоды Биг Гик Промокоды Lamoda Промокоды МВидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
0 просмотренных постов скрыто
Avenir.Sirgun
Avenir.Sirgun
Серия Linux

Linux и минимальный комфорт⁠⁠

7 месяцев назад

выяснено экспериментально.

Система 64 бит .
минимальный комфорт :
проц 4ядра по 3ггц, озу 2шт по 4гб двухканал.
1 диск под систему, 4 диска -хранилище.
сетевая карта минимум 1шт 100мбит с поддержкой linux.
видюха под текущий linux kernel .
тишина важный фактор: пк должно быть не слышно вообще с расстояния 1 метр при 100%% нагрузке.
мыш клава моник -- лишь бы работали.
флопик 3,5 желательно.
компактный размер.
без иллюминаций.
Для дома, небольшой сети до 4х компов в такой конфигурации: 3д, программирование, музыка, видео(если видяху помощнее поставить вместо офисной), планирование, сервер почты файлов сообщений ....

мате

мате

иксвсё4

иксвсё4

линукс с хфсе, иногда пользую mate и
конфигурация как я уже написал. оно не реактивное, но ничо не виснет, могу 20 вкладок браузера открыть, рендерить 3д. и +2 очееди копирования .

консоль без де. менеджер файлов ncdu

консоль без де. менеджер файлов ncdu


частоту меньше и 2 ядра, 4гб пробовал лично
на ноутбуке Ноутбук HP Compaq cq57 -- просмотр онлайн видео 1080р тормозит. обрабатывать небольшие документы, рисунки годится. NAS будет тормозить когда захочешь несколько очередей синхронизации запустить.

если кому-то интересно могут заглянуть в мой профиль, чтобы пообщаться персонально.

Показать полностью 3
Linux Программирование IT Компьютерная помощь Компьютерное железо Программа Python Сборка компьютера C++ Julia Maxima 3D моделирование Paint Arduino Длиннопост
11
45
akatosh199512
akatosh199512
Аниме

Прекрасная пара⁠⁠

2 года назад
Прекрасная пара
Показать полностью 1
Anime Art Аниме Spike Spiegel Julia Ein Jet Black Faye Valentine Radical Edward Cowboy Bebop Поцелуй
0
0
bazabazapriem

Julia⁠⁠

3 года назад
Julia
Показать полностью 1
[моё] Судно Julia
2
19
putsamuraya
putsamuraya
Скриншоты комментов

Адмирал всея флотилии⁠⁠

4 года назад
Адмирал всея флотилии

https://www.linux.org.ru/news/opensource/16432744?cid=164349...

Программирование Julia Языки программирования Исследователи форумов Капитан очевидность IT
3
534
al2071
al2071

Дом, который построил Джет⁠⁠

5 лет назад

Источник: Radio Free Mars

Показать полностью 8
Cowboy Bebop Дом который построил Джек Стихи Аниме Spike Spiegel Jet Black Faye Valentine Ein Radical Edward Vicious Julia Длиннопост
60
4
DELETED
ИТ-проекты пикабушников

Нейронная сеть для распознавания имен на Julia (Flux.jl)⁠⁠

5 лет назад

Доброго времени суток,


хотел бы поделиться своей небольшой работой в области машинного обучения. Данный материал не стоит рассматривать как гайд или урок, так как я близко не являюсь датасаентистом, просто подвернулся интересная задача, и я решил использовать нейронные сети для ее решения.


Суть задачи: есть у нас около 112 тысяч никнеймов. Кто-то пишет свое реальное имя правильно, кто-то пишет, но не правильно, кто-то решил написать какое-либо слово, кто-то - абсурдный никнейм по типу аувау324. И вот нам нужно узнать, сколько в данном списке имен Влад, сколько - Саша, и сколько "мусорных" имен.


Решить данную задачу можно было и без использования ML, но:

а) это было бы долго и много ручной работы

б) хотелось поиграться с нейронками


Решая данную задачу, я во многом полагался на данную интересную статью на Хабре.

Во время решения донного задания я допустил несколько критических ошибок, которые повлияли на конечный результат (ошибки рассмотрю по ходу объяснения алгоритма решения).


Алгоритм решения:

1) Подготовка данных

Первым делом нужно было подготовить данные к манипуляциям. Чем меньше лишних данных и чем меньше форм этих данных - тем лучше справятся алгоритмы машинного обучения.


Важно понимать, что свести все данные к одной форме и убрать n-нное количество информации - не одно и тоже. Можно сравнить данный процесс со сжатием без потерь - информация не удаляется, изменяется лишь ее форма.


Подготовил данные я следующим образом:

1) Преобразовал все слова в lowercase.

2) Нормализировал UTF символы (например, перевел ó в о).

3) Удалил смайлики и прочий мусор из имен.

4) Удалил имена, которые имели 2 символа или меньше.


Важный момент(!) - так как в базе мы имели имена на английском (например Julia), транслитом (например Yulia) и кириллицей (Юлия\Юлія), я не додумался перевести все имена, допустим, на латинские буквы, что повлияло на сложность вычислений и на точность нейронной сети. Это важный момент - все данные должны быть в одной форме.


2) Составления словаря

Если вы знакомы с нейронными сетями, то знаете, что у нейронной сети есть входной слой, размер которого определен на этапе "компиляции" тела нейронной сети и не может быть изменен в ходе выполнения алгоритма. Плюс, нам нужно представить слова как набор чисел, с которыми сможет удобно работать наша нейронка.


Для решения данного пункта я воспользовался материалом с Хабровской статьи, и создал словарь для моего набора слов.

Создавал я словарь следующим образом:

1) Каждое слово делил на би-граммы (если в слове было нечетное количество букв - то на би-граммы и уни-граммы).

2) Далее, если данной би-граммы\уни-граммы еще нет в словаре - записывал ее в словарь. На выходе у меня получился словарь из 2371 би-грамм\уни-грамм без повторений.


Почему я использовал би-граммы, а не уни-граммы? Мой алгоритм не предусматривал определения, например, количества данной буквы в слове, и поэтому нейронная сеть не смогла бы отличить слово "Ана" от "Анна", и вот почему...


3) Векторизация словаря

Теперь нам нужно превратить наш словарь и слова, которые мы будем запихивать в нейронку, в цифры.


Для начала векторизируем словарь:

1) Так как наш словарь имеет 2871 элемент, закодируем каждое "слово" из словаря в 2371-элементный вектор. Для примера, имеем словарь ["a", "b", "c"] - тогда буква "а" будет иметь вектор [1, 0, 0] относительно словаря, "b" - [0, 1, 0], "c" - [0, 0, 1]. И теперь, если мы захотим векторизировать слово "abbca" относительно такого словаря, то у нас получится вектор [1, 1, 1]. И теперь понимаем, почему данный алгоритм не смог бы различаться некоторые слова, если бы мы использовали уни-граммы - для него что слово "aaabbbbccc", что "abc", имеют одинаковый вектор [1, 1, 1].


Таким Макаром мы также установили количество входных нейронов для нашей сети - 2371, так как каждое наше слово теперь будет кодироваться относительно словаря в 2371-размерный вектор и на каждый нейрон будет подаваться 1 или 0.


4) Создание нейронной сети

Самый спорный момент, так как я почти не разбираюсь в проектировании нейронных сетей и ML в целом, так что я эмпирическим путем узнал, что моя видеокарта способна с адекватной скоростью тренировать нейронку с одним входным слоем, одним скрытым на 1840 нейронов, один скрытый на 700 нейронов, ну и один выходной слой (кстати, размер выходного слоя у нас зависит от количества классов, которые вы хотите иметь. Я хотел, что бы нейронка смогла различить 105 разных имен, поэтом размер выходного слоя у меня соответственный). Такая нейронная сеть давала мне около 75% точности после 100 эпох обучения.


5) Подготовка данных

Вручную мною было классифицировано 2000 имен. По ходу ручной классификации было найдено 105 уникальных имени (класс №1 означал "мусорное имя"). На этих именах я тренировал и тестировал нейронную сеть.


Вот, в принципе, и вся история. Надеюсь, данная информация поможет кому-то не допустить ошибок, которые допустил я, или в качестве примера для построения более сложного алгоритма. Весь код проекта можно найти на тут.


Удачи, никогда не забывайте, что программирование - это не знания языка программирования, а в первую очередь умение правильно управлять данными. А еще проектирование не помешает :)

Показать полностью
[моё] Программирование Знания Нейронные сети Распознавание Julia Flux Data Science Длиннопост Текст
10
485
Turklton
Turklton
Комиксы

Комикс 414⁠⁠

5 лет назад
Показать полностью 4
Jago Jagodibuja Carmen Sonia Комиксы Длиннопост Julia
32
181
Bulkodav
Bulkodav

Cowboy Bebop⁠⁠

7 лет назад
Cowboy Bebop

https://www.artstation.com/gennah1984

Показать полностью 1
Anime Art Аниме Cowboy Bebop Spike Spiegel Julia Gennah1984
3
Посты не найдены
О нас
О Пикабу Контакты Реклама Сообщить об ошибке Сообщить о нарушении законодательства Отзывы и предложения Новости Пикабу Мобильное приложение RSS
Информация
Помощь Кодекс Пикабу Команда Пикабу Конфиденциальность Правила соцсети О рекомендациях О компании
Наши проекты
Блоги Работа Промокоды Игры Курсы
Партнёры
Промокоды Биг Гик Промокоды Lamoda Промокоды Мвидео Промокоды Яндекс Маркет Промокоды Пятерочка Промокоды Aroma Butik Промокоды Яндекс Путешествия Промокоды Яндекс Еда Постила Футбол сегодня
На информационном ресурсе Pikabu.ru применяются рекомендательные технологии