Возврат к велосипедостроению: исчерпание OkCupid
Привет, Pikabu.
В продолжение поста http://pikabu.ru/story/_2942445 :
ресурс действительно заточен по чувствительности, в том числе, на рационалистов-антимракобесов и имеет высокий входной порог для не англоязычных (что значительно понижает уровень фейков и разводил), как и рекомендовалось идеологически верными. Но целевая мощность вместе с размером российской аудитории не привела к получению каких-либо кандидаток вовсе, работа с ресурсом прекращена из-за слишком низкой эффективности.
В продолжение поста http://pikabu.ru/story/_2942445 :
ресурс действительно заточен по чувствительности, в том числе, на рационалистов-антимракобесов и имеет высокий входной порог для не англоязычных (что значительно понижает уровень фейков и разводил), как и рекомендовалось идеологически верными. Но целевая мощность вместе с размером российской аудитории не привела к получению каких-либо кандидаток вовсе, работа с ресурсом прекращена из-за слишком низкой эффективности.
Отход от велосипедостроения: OkCupid как готовый WideScreenScreener общего назначения.
Привет, Pikabu.
Было решено временно отойти от собственного велосипеда и поработать с сервисом знакомств на базе рекомендательных систем ( https://ru.wikipedia.org/wiki/Рекомендательная_система ) чтобы отдохнуть от работы напильником, работая на готовом и отработанном инструментарии (особенно когда понимаешь как он работает), и набраться некоторого опыта. Безусловно, никто не собирается ожидать от этого ресурса какой-то реальной пользы, поскольку это всё-таки сайт знакомств, пусть и с заметными входными порогами и эффективной системой сравнения.
p.s. Следующим постом будет описание задачи WSS более "человеческим" языком.
Было решено временно отойти от собственного велосипеда и поработать с сервисом знакомств на базе рекомендательных систем ( https://ru.wikipedia.org/wiki/Рекомендательная_система ) чтобы отдохнуть от работы напильником, работая на готовом и отработанном инструментарии (особенно когда понимаешь как он работает), и набраться некоторого опыта. Безусловно, никто не собирается ожидать от этого ресурса какой-то реальной пользы, поскольку это всё-таки сайт знакомств, пусть и с заметными входными порогами и эффективной системой сравнения.
p.s. Следующим постом будет описание задачи WSS более "человеческим" языком.
Широкоформатный скрининг для знакомств - новая смена парадигмы: необходимость неограниченной интерференции.
Привет Pikabu.
От ранее расписанной парадигмы в http://pikabu.ru/story/_2873139 было решено отказаться. Причинами для этого стали получение большого количества информации от успешных случаев реализации отношений Ъ/Ъ и отношения имеющихся ресурсов (в основном времени) к оцениваемым затратам на успешную конвертацию в Ъ (без учёта вероятности успеха < 1), требующую много месяцев и сил. Отказ от выявления про-Ъ кандидаток, потенциально хорошо "конвертируемых", с последующими попытками идеологического апгрейда был сделан из-за оцениваемого размера получаемой выборки, на порядок (по меньшей мере) превышающей размер первичной выборки (при данной методологии - 3 тыс. кандидаток), при этом степень Ъ заведомо занижена в среднем, т.к. делается отход от главного критерия - формальная принадлежность интересов к Ъ.
Новая парадигма, напротив, использует максимизацию фактической степени Ъ на основе не майнинга соц. сетей, а реальной активности в Ъ-сообществах, что будет выясняться с помощью computer-assisted нетворкинга (разработанный инструментарий WSS будет использоваться и развиваться дальше, но только как вспомогательный).
Собственно суть новой парадигмы состоит в экстремальном использовании общности интересов, эксплуатации экономико-географического детерминизма (в микро-масштабе, конечно) и максимизации эффективности сотрудничества. Аналогия на основе примеров: жёны революционеров, которые сами революционеры, с такой-же политической активностью.
Вероятно что суть описанного является ещё более труднодоступной по сравнению со многими предыдущими постами, а понятней дальше не будет. Также активность данной записи будет уменьшаться из-за падения необходимости в ней.
От ранее расписанной парадигмы в http://pikabu.ru/story/_2873139 было решено отказаться. Причинами для этого стали получение большого количества информации от успешных случаев реализации отношений Ъ/Ъ и отношения имеющихся ресурсов (в основном времени) к оцениваемым затратам на успешную конвертацию в Ъ (без учёта вероятности успеха < 1), требующую много месяцев и сил. Отказ от выявления про-Ъ кандидаток, потенциально хорошо "конвертируемых", с последующими попытками идеологического апгрейда был сделан из-за оцениваемого размера получаемой выборки, на порядок (по меньшей мере) превышающей размер первичной выборки (при данной методологии - 3 тыс. кандидаток), при этом степень Ъ заведомо занижена в среднем, т.к. делается отход от главного критерия - формальная принадлежность интересов к Ъ.
Новая парадигма, напротив, использует максимизацию фактической степени Ъ на основе не майнинга соц. сетей, а реальной активности в Ъ-сообществах, что будет выясняться с помощью computer-assisted нетворкинга (разработанный инструментарий WSS будет использоваться и развиваться дальше, но только как вспомогательный).
Собственно суть новой парадигмы состоит в экстремальном использовании общности интересов, эксплуатации экономико-географического детерминизма (в микро-масштабе, конечно) и максимизации эффективности сотрудничества. Аналогия на основе примеров: жёны революционеров, которые сами революционеры, с такой-же политической активностью.
Вероятно что суть описанного является ещё более труднодоступной по сравнению со многими предыдущими постами, а понятней дальше не будет. Также активность данной записи будет уменьшаться из-за падения необходимости в ней.
Широкоформатный скрининг для знакомств WSS - продвижения и будущая смена методологии.
Привет, Pikabu.
На первой итерации запуска WSS был получен только 1 приемлемый позитивный ответ из 200 человек, итерация 2 не прошла нормальный запуск - потому нельзя оценить эффективность, а на итерации 3 получено 4 позитивных ответа из 7, что говорит о повышении эффективности до ~50%, что является стократным ростом.
При работе с Top95 подтвердились редкие ошибки вычисления принадлежности к T-группам, из-за которых получались ложные завышения score, предполагаются и ложные занижения, но эта гипотеза не проверялась, потому нужно это в первую очередь исправить - это требует изменений и проверки алгоритмов парсинга и слияния датафреймов. Также будут другие небольшие технические модификации.
После исправления критических изъянов по степени отклонения топовых списков будет приниматься решение о возможности смены методологии поиска. Предполагаемая парадигма: эксплуатация географико-экономического детерминизма как более насущного фактора по сравнению с идеологическими критериями, что, как ни странно, давно отражено в контрольно-проверочном тексте (КПТ). Группами набора первичной выборки будут официальные и неофициальные группы топовых ВУЗов, группами для вычисления score (они будут разделены, да) будут разные адекватные научно-релевантные группы, в них-же (вместе со стенами) будет проводиться выкачка комментариев для подсчёта частоты основных научных слов. Также будет введена функция вида распределения Фишера для вычисления поправки к score на основе точного возраста (для подобных случаев) и устрожена система детекции фейков (число друзей, постов и прочего контента). Также будет попытка реализовать инкрементальное увеличение базы данных для возрастов для облегчения выполнения оценки возраста.
И жду активности от 7 подписчиков.
На первой итерации запуска WSS был получен только 1 приемлемый позитивный ответ из 200 человек, итерация 2 не прошла нормальный запуск - потому нельзя оценить эффективность, а на итерации 3 получено 4 позитивных ответа из 7, что говорит о повышении эффективности до ~50%, что является стократным ростом.
При работе с Top95 подтвердились редкие ошибки вычисления принадлежности к T-группам, из-за которых получались ложные завышения score, предполагаются и ложные занижения, но эта гипотеза не проверялась, потому нужно это в первую очередь исправить - это требует изменений и проверки алгоритмов парсинга и слияния датафреймов. Также будут другие небольшие технические модификации.
После исправления критических изъянов по степени отклонения топовых списков будет приниматься решение о возможности смены методологии поиска. Предполагаемая парадигма: эксплуатация географико-экономического детерминизма как более насущного фактора по сравнению с идеологическими критериями, что, как ни странно, давно отражено в контрольно-проверочном тексте (КПТ). Группами набора первичной выборки будут официальные и неофициальные группы топовых ВУЗов, группами для вычисления score (они будут разделены, да) будут разные адекватные научно-релевантные группы, в них-же (вместе со стенами) будет проводиться выкачка комментариев для подсчёта частоты основных научных слов. Также будет введена функция вида распределения Фишера для вычисления поправки к score на основе точного возраста (для подобных случаев) и устрожена система детекции фейков (число друзей, постов и прочего контента). Также будет попытка реализовать инкрементальное увеличение базы данных для возрастов для облегчения выполнения оценки возраста.
И жду активности от 7 подписчиков.
WideScreenScreening - итерация номер три.
Привет, Pikabu.
Выполнен полный цикл data acquisition с целью обновления показателей рейтинга и получения новых кандидаток. Также были внесены мелкие изменения и выявлены небольшие баги.
Было получено 3242 кандидатки, сформирован топ-лист кандидаток с рейтингом, большим чем у 95% кандидаток - получилось 164 кандидатки. Начата серийная проверка.
Выполнен полный цикл data acquisition с целью обновления показателей рейтинга и получения новых кандидаток. Также были внесены мелкие изменения и выявлены небольшие баги.
Было получено 3242 кандидатки, сформирован топ-лист кандидаток с рейтингом, большим чем у 95% кандидаток - получилось 164 кандидатки. Начата серийная проверка.
Перезапуск WideScreenScreening и поиск добровольцев.
Привет, pikabu и мои подписчики.
Из-за устаревания данных проведение непосредственно проверки самих кандидаток следует делать быстро. По некоторыми этическим причинам я длительное время не прорабатывал конечный список кандидаток, потому всё успело значительно устареть. Также нужно сделать несколько мелких изменений и нововведений.
Поэтому я выполняю перезапуск - получение всех данных заново и последующая обработка топовых кандидаток.
Ещё для реальной отработки мне нужны добровольцы, либо хотя-бы базовые критерии и группы для тестирования отличных от моего случаев.
Из-за устаревания данных проведение непосредственно проверки самих кандидаток следует делать быстро. По некоторыми этическим причинам я длительное время не прорабатывал конечный список кандидаток, потому всё успело значительно устареть. Также нужно сделать несколько мелких изменений и нововведений.
Поэтому я выполняю перезапуск - получение всех данных заново и последующая обработка топовых кандидаток.
Ещё для реальной отработки мне нужны добровольцы, либо хотя-бы базовые критерии и группы для тестирования отличных от моего случаев.
WideScreenScreening - широкоформатный скрининг для знакомств: обращение к подписчикам.
Уважаемые пять подписчиков!
Находясь на 40% критической для блокировки отрицательной величины рейтинга у меня осталось не так много возможностей что-то написать. Но цель описать WSS и сделать попытку набора кандидаток здесь я уже реализовал.
Актуальное состояние инструмента для WSS уже было подробно описано, ход создания и теперешние результаты тоже. Мне практически нечего будет тут описывать, поскольку я не буду выставлять свою и чужую личную жизнь напоказ. В не очень скором времени я смогу рассказать только о результатах второй попытки анализа списков групп пользователей и анализа текстов постов/комментариев, больше ничего, других нерешённых задач у нас нет. Единственное, что ещё, то это мы ищем веб-сервер для размещения этого инструмента, но это дело ещё более отдалённого будущего + вообще под вопросом.
Мне остаётся только спросить - что-же хотят ещё услышать от меня мои подписчики.
Находясь на 40% критической для блокировки отрицательной величины рейтинга у меня осталось не так много возможностей что-то написать. Но цель описать WSS и сделать попытку набора кандидаток здесь я уже реализовал.
Актуальное состояние инструмента для WSS уже было подробно описано, ход создания и теперешние результаты тоже. Мне практически нечего будет тут описывать, поскольку я не буду выставлять свою и чужую личную жизнь напоказ. В не очень скором времени я смогу рассказать только о результатах второй попытки анализа списков групп пользователей и анализа текстов постов/комментариев, больше ничего, других нерешённых задач у нас нет. Единственное, что ещё, то это мы ищем веб-сервер для размещения этого инструмента, но это дело ещё более отдалённого будущего + вообще под вопросом.
Мне остаётся только спросить - что-же хотят ещё услышать от меня мои подписчики.