MLC@Home: MLC@Home временно отключается, и спасибо!

MLC@Home закрывается


После более чем двух лет, нескольких ухабистых моментов и огромной поддержки со стороны наших волонтеров, я как администратор MLC, принимаю решение закрыть MLC@Home как проект для BOINC временно.


Почему?


Мы достигли целей, которые я поставил перед собой (и даже больше!) с помощью 4 полных наборов данных, включающих десятки терабайт данных для анализа. Теперь нам нужно сосредоточиться на анализе результатов и написании статей.


Как исследователь, в какой-то момент вы должны перестать генерировать данные и писать; и моя семья, работа и школьные обязательства ограничивают количество времени, которое я могу потратить на создание новых экспериментов.


Это должно быть очевидно, так как я все меньше и меньше реагировал на сообщество за последние 6 месяцев, за что прошу прощения. Хотя мы всегда можем хотеть большего от любого начинания, я думаю, что мы достигли пока много, и хочу поставить проект на паузу, на неопределенный срок, пока не появится что-то новое.


Это время, чтобы отпраздновать все, чего наши волонтеры достигли вместе! Это сообщество было потрясающим на форуме и Discord-е. Мы закрываемся не из-за проблем, а потому, что мы достигли целей, которые мы поставили перед собой. Для этого я не мог быть более благодарен.


Единственный горько-сладкий аспект закрытия проекта — это то, что я надеялся вырастить MLC@Home за пределы MLDS, стать платформой для демократизированных исследований в области машинного обучения. Мне не удалось наладить отношения с другими исследователями, и поэтому MLDS был единственным проектом на MLC@Home. Частично виноват COVID, но есть ряд других факторов, начиная от того, как финансируются исследования в такой горячей области, как машинное обучение, и заканчивая моим ограниченным временем.


Если другие исследователи проявят интерес, мы можем возродить проект в будущем, но пока я не могу оправдать запуск проекта без реального пути к значимой новой работе. Это было бы несправедливо по отношению к волонтерам.


Что происходит?


Во-первых, как и было обещано, наборы данных останутся доступными (выпуск DS4 потребует некоторых размышлений и времени, см. ниже), а основной веб-сайт MLC@Home (https://www.mlcathome.org) и твиттер останутся активными, поэтому я буду публиковать обновления в любых документах и получать доступ к DS4, когда он доступен.


На данный момент изменений нет по серверным частям сайта BOINC. Мне нужно будет прочитать о том, как правильно архивировать форумы, страницы проекта и статистику, чтобы они могли оставаться доступными (только для чтения), не становясь магнитом для спама и (в настоящее время ежечасно...) попытки взлома (вздох...). Я также буду сворачивать сообщество Discord в течение следующего месяца или около того.


Лично я буду продолжать свои исследования и работать над публикацией значимых результатов.


Я также продолжу поддержку других проектов BOINC (я вношу свой вклад в BOINC со времен классической версии SETI@Home) и поддержку идеи добровольных вычислений. Когда-нибудь я напишу о своем опыте исследователя.


В целом это был положительный опыт, но есть некоторые определенные области для улучшения.


Что касается вас, я призываю вас продолжать поддерживать другие замечательные проекты BOINC своим вычислительным временем. Официальный список здесь https://boinc.berkeley.edu/projects.php.


DS1/2/3 уже доступны для скачивания, а как насчет DS4?


DS4 имеет размер более 12 ТБ только для части Dense. Так что для копирования потребуется еще больше времени, упаковать, проанализировать и загрузить. Я намереваюсь сделать это после того, как мой анализ и диссертация будут завершены, что должно быть в ближайшие 6 мес. Если вы исследователь и хотите получить доступ к набору данных раньше, пожалуйста, свяжитесь с мной напрямую, и мы можем что-то придумать.

Первоначальная идея DS4 состояла в том, чтобы вычислять нейронные сети для каждого типа данных, используя плотные сети, в стиле LeCun.


Оказывается, сети LeCun настолько малы и просты в вычислении, что я могу вычислить их на моей рабочей станции за день или два, так что я не стал их рассылать. 50 000 из них были размещены локально на моей рабочей станции, как рабочие единицы BOINC. (также из-за того, что текущий клиент дает сбой при вычислении LeNet5 на некоторых платформах, и было быстрее вычислить его локально, чем отследить ошибку). Поскольку это спорно, что научная выгода от того, что AlexNet (еще один CNN) переносит сети LeCun, я, вероятно, уберу их из набора данных.


Спасибо


Даже если больше ничего не произойдет, MLC@Home добился большого успеха. Мы произвели научно интересные и уникальные наборы данных, представили совершенно новый тип науки (машинное обучение) в BOINC сообществе и показали, что исследования в области машинного обучения могут проводиться группой добровольцев в течение длительного времени.


Интернет.


Есть несколько групп и отдельных лиц, которым я хотел бы особо поблагодарить за то, что этот проект стал таким успешным.


К ним относятся, помимо прочего: разработчики BOINC, особенно Виталий Кошура и другие разработчики на сервере BOINC, Discord за помощь в разработке проекта с самого начала, Маркус (Delta на серверах BOINC Discord) за непосредственный вклад в MLC@Home.


Программное обеспечение для серверной обработки, и кто вместе с JRingo запускает подкаст BOINC Radio, который продвигал и поддерживал MLC@Home с самого начала. Майк из проекта PrimeGrid для предоставления некоторых важных ранних советов по запуску нового проекта. Я уверен, что забыл многих других, просто знайте, что мы, как сообщество, должны многих благодарить за успех этого проекта.


Я хотел бы выразить особую благодарность первым волонтерам проекта, которые помогли сделать форум полезным и гостеприимным местом.


Спасибо также CoRaL Labs и моему консультанту в UMBC за поддержку исследования и предоставление финансирования нового сервера после того, как мы быстро переросли наш оригинальный ноутбук ThinkPad эпохи 2015 года.


Наконец, спасибо нашим 4200+ волонтерам, которые выполнили более 12,5 миллионов рабочих единиц, используя более 17000 хостов. Я искренне польщен вашим вкладом и тем, чего мы достигли вместе. Ни чего из этого было бы невозможно без вас. Спасибо, что дали шанс маленькому неизвестному исследователю, и я призываю вас искать более мелкие проекты в будущем, так как их успех поможет определить продолжит ли BOINC расти и процветать.


Я оставляю вас с последним, удовлетворительным скриншотом веб-сайта: Еще раз спасибо всем.


Главный исследователь и администратор MLC@Home: https://www.mlcathome.org/, электронная почта: mlcathome2020@gmail.com

MLC@Home: MLC@Home временно отключается, и спасибо! IT, Наука, Программирование, Mlc, Boinc, Проект, Волонтерство, Длиннопост