Ни в коем случае не связываться с интернетом от этих говноедов!
Кадр первый. Подключали в Оренбурге. Мастер ехал неделю, завели линию, инет пошел. На следующий месяц закидываю денег, проходит дата списания - инет блочится, "заблокировано за неуплату". Я смотрю на 2000 рублей на счету и 400 руб/мес по тарифу за инет (а у меня работа на 80% по инету) и думаю кто из нас дибил. В конечном счете прихожу к выводу, что все-таки эти уёбки нахимичили. Звоню в поддержку, полчаса ожидания, обрисовываю ситуацию, там "...ой, странно, передам поддержке, сейчас поправят...". В итоге ТРИ НЕДЕЛИ ЕЖЕДНЕВНЫХ ЗВОНКОВ ПО 10-30 МИНУТ ЭТИМ ГОВНОРУКИМ ХУЕДРЫГАЛАМ чтобы просто списали деньги и включили инет. Компенсация? А за что, с вас же денег не снимали пока связь не работала? Ну и что что мы монополисты и тут больше никого нет, ну и что что вы понесли убытки у нас лапки, ты просто идёшь нахуй.
Кадр второй. Я по профессии айтишник, у одного из моих клиентов была офисная IP-телефония от РТ. В какой-то момент у них сломалась маршрутизация на мобильные шлюзы Мегафон, то есть позвонить с номеров РТ на Мегафон и обратно было невозможно. Обратились и туда и туда - оперативно выясняется что косяк именно на стороне "телекома". Сроки ликвидации неисправности - полтора месяца. И это БИЗНЕС-сегмент, мать его, работа с юр.лицами. Это был просто какой-то треш.
Кадр следующий. У моих родителей (Московская область) дома телефон от этой конторы инвалидов на голову, ставился еще от другого местного телефониста которого потом перекупили с потрохами. В какой-то момент пропадает гудок в трубке, тыкаю тестером - по нулям, линия пустая. Обращаемся в поддержку, типа "не работает, не гудит", заявку принимают. И ДВА МЕСЯЦА ищут ВЫДЕРНУТЫЙ НА КОММУТАТОРЕ КАБЕЛЬ. Ну как так, ссука? Ну у вас один техник на всю Москву и Московскую область? Опять таки звонили каждые два-три дня, всё "ой-да-да-да, в работе, вот-вот уже техник пойдет смотреть что там у вас". И опять таки, до поддержки дозвониться - минут по 15-20 ожидания и через дибильного робота.
Кадр четвертый. Та же линия из кадра первого, сегодняшний день. Интернета нет. Пропал примерно в марте. В МАРТЕ, КАРЛ! Ждем техника и по сей день. Заявки просто закрываются в личном кабинете сами по себе, то "Мастер не смог с вами связаться" (ага, а при отрицательном балансе робот как-то дозванивается с требованием погасить задолженность), то "у вас отрицательный баланс, никто не поедет пока не погасите задолженность". Погашал несколько раз, признали что обрыв линии где-то, но техника ждем уже больше полугода, деньги на счету слизали до нуля а интернета так и нет. Я писал что звонки по 20 минут? Ну вот напомню на всякий случай. Пробовали перезаключить договор через Теле2 - хрен там, по этому адресу уже есть договор по РТ и на нем отрицательный баланс, оплачивайте. Сейчас ушла досудебка, посмотрим к чему приведет. НИ В КОЕМ СЛУЧАЕ НЕ СВЯЗЫВАЙТЕСЬ С ЭТОЙ КОНТОРОВ ДЕГЕНЕРАТОВ, наплачетесь.
При этом просто по работе контактирую с десятком провайдеров - такая картина ТОЛЬКО у них. МГТС-МТС, порвали оптику экскаватором у дома - дозвон за 2 минуты, на следующий день нашли и починили. NetByNet (теперь Мегафон) - дозвон до поддержки меньше минуты, с утра нет сигнала в квартире, в обед уже звонок в дверь от пары техников. WestCall, БиЛайн, ДомРу, Макомнет, Смайл, Вермонт, какие-то малые местечковые - ни у кого не приходится висеть больше 2-3 минут на линии и ждать техника больше 1 дня, ну за реееедким исключением 2 дня. Что по физлицам, что по организациям.
Сейчас тут неожиданно будет пост про компанию Ростелеком.
Что вы будете делать, когда вам понадобится скопировать чип-ключ от домофона? Я с вьюношества поступал следующим образом – целенаправленно шёл на рынок к специально обученному дяденьке, который изготавливает ключи на заказ, и отдавал уже имеющийся чип. Далее происходило следующее – этот дяденька нажимал на какую-то специальную херню, копирующую уникальный код чипа, и возвращал мне уже два экземпляра со словами «с вас сто рублей».
Сейчас мы с женой переехали на новую квартиру, хозяйка которой отдала нам всего один комплект ключей. На следующий день после переезда я по давно отработанной схеме сразу побежал на рынок. Но, к моему удивлению, всесильный дяденька-ключник сказал, что сам-то комплект ключей он, конечно, изготовит, а вот такого чипа от двери в подъезд сделать уже не сможет. Мол, это от умного домофона.
Озадаченный я сразу начал гуглить, шо это за умный домофон такой. Оказывается, у нас в доме действительно установлена целая экосистема от компании Ростелеком – тут тебе и домофон этот хитровыебанный, и видеокамера, и проведён свой интернет с телевидением, и прочее-прочее.
При звонке в компанию Ростелеком спустя полчаса ожидания на горячей линии нам таки предоставили адрес местного офиса, где можно сделать данный ключ. Наутро я прогулялся в ТЦ по адресу, побродил там с недоумением, разглядывая вывески магазинов и попутно прикупив корма собаке и пару килограмм картошки. В конце концов допёр – ага, так мне в Теле2 нужно!
В Теле2 девушка-консультант сказала, что сделать ключ она безусловно может, но только вот мне необходимо скачать приложение МойРостелеком и зарегистрироваться там. Что я, собственно, и сделал – было затруднительно и долго, учитывая ограничения интернета в области. Пока скачивал приложение и регистрировался, успел пару раз покурить на улице, поболтать с мамой, бабушкой и пацанами с завода, купить перца, кочан капусты и пачку дюбелей.
По возвращении в Теле2 я услышал от консультанта, что мне ж необходимо ещё, оказывается, иметь лицевой счёт в компании Ростелеком! Ага, квест продолжается, значит… Вечером я уже тупо отписался хозяйке квартиры, мол, мы тут с Дашей уже, мягко говоря, заебались с разными графиками работы бегать с одним ключом от домофона, а названивать каждый раз соседям такое себе. Хозяйка написала в чат жильцов дома, уже столкнувшихся с данной проблемой, и ей дали подробную инструкцию.
Она позвонила представителю компании и оставила заявку на подключение. Ей скинули ссылку на ВБ и Озоне на оригинальные чипы Ростелекома; я заказал эти ключи, ну а следующую неделю, пока ключ шёл с маркетплейса, пришлось нам с женой как-то между собой координироваться и передавать друг другу этот домофонный чип – у нас на заводах совершенно разные рабочие графики.
Итак, спустя неделю я наконец забрал вожделенный ключ. Отзвонился хозяйке квартиры. Договор был заключен на неё. Она зарегистрировалась в приложении – только не в МойРостелеком, а в другом, РостелекомКлюч, который нам тоже пришлось отдельно скачивать. Мы скинули ей номер ключа и вошли в лицевой счёт по номеру хозяйки квартиры, после чего просто ждали, пока ей придёт код; код шёл долго, вследствие чего приложение просто ушло в астрал и перестало открываться. Решили подождать…
На следующий день вновь повторили эту шараду, спустя полчаса раздумий Ростелеком таки чип активировал, и вот, вуаля – я счастливый обладатель ключа от домофона! Отныне я могу войти в свой подъезд! Сам, без звонков соседям и без ожидания жены по полчаса на лавочке на улице зимой!
Теперь нам предстоит подключать Ростелекомовский интернет… Чую, что там нас тоже ждёт много удивительных открытий, поэтому, если кто вдруг сталкивался с этой компанией – отпишитесь, пожалуйста, в комментариях. А то нам уже умный домофон все мозги выпотрошил.
Ну и подписывайтесь на аккаунт, а то у меня тут совсем маловато подписчиков. Пишу всякое интересное про кино, литературу, космос и нейросети. После того, как вчера пост залетел в Горячее, думаю написать серию текстов про хорошие фантастические боевики девяностых -- вы все их наверняка смотрели, однако лишний раз поностальгировать, думаю, никто не откажется.
В общем, есть сайт с большим каталогом товаров. Часто к нам обращаются люди например в WhatsApp, в ТГ или на ABuTO и задают вопросы про конкретные товары и иногда хочется кидать очень короткие ссылки, которые бы вели сразу на товар с конкретным артикулом, например ссылка Я.сс/1234 вела бы на основной сайт на страницу товара с артикулом 1234: ОсновнойДоменСайта.ру/1234
Также эти короткие ссылки бы использовались на этикетках товаров, тем самым текст бы меньше места занимал на этикетках или например пихали бы ссылки в QR-коды, они бы тоже по размеру были меньше.
Но тут есть такой нюанс, почему я и задаю такой вопрос. Естественно такие однобуквенные латинские домены все заняты или стоят очень дорого, но есть свободные и недорогие с одной буквой, но буква на кириллице, например Я.СС или Ж.МЕ или Й.SS или Ц.ЕЕ или ещё Ё.СОМ
Так вот стоит ли такой домен покупать и использовать? Что думаете?
Давно в бородатых десятых, при подключении кабельного интернета вам предлагали услугу аренды роутера с последующим выкупом, за который вы, может быть должны до сих пор?
Или за этот бизнес уже они не в ответе? Не пользуюсь больше услугами ночных бабочек.
У меня большой соблазн написать: "Вы описали устаревший подход. Я тоже так думал, и поэтому год назад завалил собеседование в 'Эпл' и 'Амазон', причем в первом незнакомтсво с общепринятым в современности подходом было одной из главных причин, почему мне отказали на самом последнем этапе (шестое интервью после пяти успешно пройденных). Сейчас коллаборативная фильтрация обычно реализуется совсем по-другому, ее обычно уже и не называют коллаборативной фильтрацией".
Но на самом деле это было бы несправедливой придиркой. Да, коллаборативная фильтрация в том виде, как вы ее изложили, это технологии 2010-х годов, от которых давно отходят. Но так как ваше изложение все равно очень короткое и поверхностное, в принципе, под него можно притянуть и современные подходы - и иногда так и делают. Если поискать сочетание терминов collaborative filtering и two tower, последнее часто описывают как частный случай первого. Но чаще нейросетевые подходы к рекомендательным системам рассматривают, не упоминая коллаборативную фильтрацию.
В общем, коллаборативная фильтрация активно используется и сейчас. Но вот это ваше описание:
Допустим, недавно Вася посмотрел до конца и поставил высокую оценку вот таким тайтлам: Мастер и Маргарита, Атака Титанов, Фишер, Игры
А Петя сделал то же самое вот с таким контентом: Киберслав, Атака Титанов, Фишер, Игры
Итак, у Васи и Пети все тайтлы одинаковые, кроме одного различия: Мастер и Маргарита против Киберслава (ставьте лайк, если хотели бы увидеть такой кроссовер). По логике КФ, если пользователи “обменяются” своими 4 тайтлами (Вася глянет Киберслава, а Петя М&М), то им должно понравиться. Собственно, отсюда и слово “коллаборативная” в названии - пользователи как бы сотрудничают, подкидывая наилучшие рекомендации друг другу.
- это очень упрощенный пересказ того, как работали рекомендательные системы 10 лет назад. Подробнее он изложен, например, в книге Лесковеча, Раджарамана и Ульмана. Только эта книга издавалась и переиздавалась с 2010 по 2019 годы. Сейчас рекомендательные системы работают по-другому.
Если вы собираетесь проходить собеседования на специалиста по машинному обучению, рекомендую хотя бы поверхностно ознакомиться с темой современной коллаборативной фильтрации. Тем более что схожие подходы используются и в других областях: так сейчас делают и поиск, и распознавание лиц...
Вы приходите домой и включаете любимый стриминг. Лента сразу же выдаёт вам несколько фильмов и сериалов, которые… действительно хочется смотреть. Сегодня разберём, как именно рождается эта магия вне Хогвартса, и что сидит под капотом рекомендательного движка онлайн-кинотеатра.
Это крайне сложный мем про онлайн-кинотеатры и всю индустрию стриминга в целом. Просьба отнестись с пониманием и проникнуться глубиной!
Так как лично я чаще других сервисов включаю Кинопоиск (да, я посчитал с точностью до минуты), то детализировать детали и анализировать нюансы я буду именно на его примере. И да, в этой статье не будет сложных технических терминов и греческих букв. Её цель - раскрыть основные принципы стримингов человечьим языком и наглядно.
Итак, погнали:
Этого стриминга в Химках видал, неточными рекомендациями торгует!
Давайте пойдём поэтапно. Что нужно сделать онлайн-кинотеатру, чтобы быть классным? Рискну предположить, что сначала ему нужно вот что:
Составить хорошую библиотеку. Добавить к себе сериалов и фильмов крутых и разных, да побольше!
Набрать пользовательскую базу. Чтобы я, вы, ваша мама, ваш коллега и вон тот парень оформили подписку. Но не только - важно, чтобы вы ещё регулярно смотрели (почему - объясню ниже, это важный момент).
Итак, у нас есть контент, и у нас есть пользователи. Говоря более научно, есть item, и есть user. И теперь кинотеатру нужно сделать третий шаг, ключевой:
Соединить user и item. Проще говоря, дать пользователю Васе именно тот фильм, сериал или аниме по манге (мало ли от чего прётся наш Василий), который ему а) нужен в целом и б) актуален прямо сейчас.
Но как это сделать?
Вариант первый - плясать от юзера Васи (user-based recommendations). Допустим, мы видим, что Вася с кайфом посмотрел последний российский детектив про жуткого маньяка. Ну окей, пульнём ему другие леденящие душу истории про серийных убийц. Но что если ему понравился именно тот детектив, а новые не зайдут?
Хорошо, тогда можно использовать обратный подход - плясать от контента (item-based recommendations). Пусть алгоритмы глянут, что там "сидит" внутри этого детектива - сюжетные повороты, темп повествования, атмосфера, антураж, локации, год выпуска, набор актёров, подмешивание других жанров и т.д. Находим максимально похожий тайтл и кидаем его Васе на первое место в ленте!
Но Вася проходит мимо и садится смотреть турецкий сериал с Серканом Болатом, или как там его зовут. Почему? Да хрен его знает. Может после того сериала у него детективный передоз, и больше он не хочет смотреть на мрачные расследования? А может Вася планирует поездку в Турцию, и хочет полюбоваться видами Стамбула? Или ещё проще - у Васи появилась девушка, и пульт теперь у неё (ну или мы просто чего-то о нём не знаем). Люди - существа иррациональные, причин может быть очень много, а на поверхности - ни одной.
Раз уж вспомнили турецкие сериалы, то держите уютного стамбульского котика (запомните этот момент, это пасхалочка ко второй половине этой статьи).
Как видите, чистый user-based и item-based - это упражнение, конечно, интересное, но полезное лишь для общего развития. А для точных стриминговых рекомендаций нужно что-то позабористее. Но что?
Существует три вида лжи…
… ложь, наглая ложь и статистика. Так про статистику говорил то ли Бенджамин Дизраэли, то ли Марк Твен (но не Ленин, как многие думают, Ильич как раз статистику очень любил и уважал). Смысл цитаты в том, что статистическими выводами можно:
а) вертеть как угодно
и б) делать это на максимально серьёзных щщах
Ведь вывод будет подкреплён (ну, типа) анализом выборки, а не просто взят с потолка.
Не буду спорить, но в случае рекомендательных систем - это вовсе не минус, а очень даже плюс. Потому что нас интересует не единственно верная истина, а набор наиболее релевантных вариантов. Но давайте конкретнее:
В рекомендательных системах онлайн-кинотеатра выбор на основе большой статистики воплощён в виде коллаборативной фильтрации (КФ). КФ - это база-основа любого годного стриминга, от Ютуба до Яндекс Музыки. Онлайн-кинотеатры в целом, и Кинопоиск в частности - не исключение.
Давайте разберём, что это такое:
Коллаборативная фильтрация работает на предположении, что:
Пользователи, которые одинаково оценили какие-либо тайтлы (т.е. фильмы/ сериалы) в прошлом, склонны давать похожие оценки другим тайтлам в будущем.
То есть, если фильм "Ромашка" понравился многим пользователям с похожей историей просмотров, то он скорее всего понравится и другим пользователям с такой же (или почти такой же) историей просмотров.
Давайте на примере (очень упрощённо и схематично):
Допустим, недавно Вася посмотрел до конца и поставил высокую оценку вот таким тайтлам:
Мастер и Маргарита
Атака Титанов
Фишер
Игры
А Петя сделал то же самое вот с таким контентом:
Киберслав
Атака Титанов
Фишер
Игры
Итак, у Васи и Пети все тайтлы одинаковые, кроме одного различия: Мастер и Маргарита против Киберслава (ставьте лайк, если хотели бы увидеть такой кроссовер). По логике КФ, если пользователи “обменяются” своими 4 тайтлами (Вася глянет Киберслава, а Петя М&М), то им должно понравиться. Собственно, отсюда и слово “коллаборативная” в названии - пользователи как бы сотрудничают, подкидывая наилучшие рекомендации друг другу.
Понятное дело, что пример выше упрощён до неприличия. В реальности должны быть не Вася с Петей, а несколько сотен тысяч (а лучше миллионов) юзеров, и тайтлов в анализе должно быть слегка больше четырёх. И тогда рекомендательная система может на больших данных глянуть, что смотрят юзеры с похожими предпочтениями, и сделает статистически значимый вывод.
Чтобы было ещё понятнее, давайте проведём аналогию с чем-нибудь из жизни. Я вот с утра в зал сходил, давайте с ним и сравним:
Представьте какой-нибудь суперумный фитнес-зал (ИИшка видит его так), где камеры под потолком анализируют ВСЕ действия ВСЕХ посетителей.
Зал видит, что вы сделали жим сотку, гантели по тридцатке и пошли на кардио. А ещё он в своей базе данных видит, что были другие посетители, которые делали то же самое. Многие из них ещё делали румынскую тягу и французский жим. Логично будет порекомендовать эти упражнения и вам (вероятность попадания будет статистически высокая).
Однако, что будет, если вам нельзя делать румынскую тягу по медицинским показаниям, а во время французского жима вы год назад уронили гантелину на голову и теперь у вас психологический блок на это упражнение? Или ещё прикольнее - система подобрала целых 10/ 20/ 50/ да хоть тысячу статистически актуальных упражнений. Какое порекомендовать первым, а какое последним? И вообще, зачем всех под одну гребёнку пихать? Я же уникальная снежинка, предложи мне что-нибудь эдакое!
Вот и с контентом в онлайн-кинотеатре то же самое.
А что если Вася сильно отличается от других юзеров, которые смотрели похожие тайтлы?
А если актуальных рекомендаций много, то какую порекомендовать первой, второй, двадцать седьмой?
И вообще, настроение у Василия игривое, он хочет сюрпризов, удивите!
Или ещё сложнее - что если Вася только-только зарегался на Кинопоиске, и у него ещё нет никакой истории (a.k.a. “холодный юзер”)?
(Cat)бустим коллаборативную фильтрацию
Для преодоления вышеописанных преград, коллаборативная фильтрация отлично дополняется градиентным бустингом. Для начала очень кратко распишу, что это вообще за зверь такой:
Итак, градиентный бустинг - это такой метод машинного обучения, когда несколько “небольших” моделей применяются последовательно, и каждая из них исправляет ошибки предыдущей. Шаг за шагом ошибка становится всё меньше и меньше, а результат всё точнее и точнее.
Логика примерно такая. Берём дерево решений и пускаем по нему алгоритм. Смотрим, насколько существенна ошибка функции. Добавляем ещё дерево и запускаем новую итерацию. Ошибка становится меньше. И так далее, пока ошибка не минимизируется.
Множество маленьких моделек градиентного бустинга ещё называют “ансамбль моделей”. По-французски emsemble значит "вместе", ну вы поняли.
Давайте разберём на примере пиццы. Ну а что, в зал мы уже сходили, так что имеем право.
Итак, допустим, вы понятия не имеете, как готовить пиццу (= не знаете юзера Васю), но слышали, что её делают из теста и сыра. Вы кидаете кусок теста и сыра в печку. Получилась дрянь. Вы думаете: “А что, если раскатать тесто и положить на него сыр?”. Уже лучше, но тесто сгорело. Вы повторяете попытку, уменьшая жар. Ещё лучше, но сыр подгорел. Вы насыпаете его более равномерно. Отлично, но не хватает томатной пасты. Вы добавляете пасту. Теперь это уже похоже на пиццу, но всё равно есть что улучшать. Вы можете дальше повторять итеграции, играясь с рецептом и технологией готовке, пока у вас не получится идеальная пицца как у дядюшки Джузеппе.
Градиентный бустинг в онлайн-кинотеатре работает точно так же, только шагов и ошибок в “дереве решений” может быть гораздо-гораздо больше, ну и тесто с сыром не нужно портить (это ж машинное обучение, в конце концов).
У Кинопоиска за градиентный бустинг отвечает штука под названием CatBoost.
Кэт буст. Вижу так.
CatBoost - это набор библиотек (= готовых шаблонов и решений) градиентного бустинга, который Яндекс использует во многих своих сервисах: в маркетплейсе, прогнозе погоды, рекламных системах, музыкальном стриминге и т.д. Ну и в онлайн-кинотеатре, само собой.
“Cat” здесь значит “категориальный”, то есть модель заточена на работу с категориями, а не только с числовыми данными. Она умеет мыслить не только понятиями "один-ноль" и “больше-меньше”, но и отличать кошечку от собачки, Турцию от Кореи (а Южную Корею от Северной), детектив от триллера (или от комедии, хоррора, пеплума, …), Юру Борисова от Ванпанчмена и т.д.
С последним могут возникнуть проблемы. Не, ну правда, тут придётся очень много моделек запускать.
Итак, вернёмся к нашему юзеру Васе.
Сценарий первый. Коллаборативная фильтрация отобрала ему 50 самых-самых релевантных фильмов. И ещё 10 сериалов в качестве бонуса. Как всю эту очередь расставить в ленте?
Допустим, в списке есть Начало и Интерстеллар. Кого поставить выше? CatBoost видит, что Вася ставил всем фильмам Нолана оценку 8+ (любит он Нолана, в общем). Также он видит, что Вася плюс-минус одинаково хорошо смотрит и Ди Каприо, и Макконахи. Он идёт дальше, перебирает другие факторы. И видит, что по вечерам Васе чуть лучше заходит космическая тематика. А ещё он в Яндексе недавно чёрные дыры искал - совпадение? Сейчас как раз вечер, так что поставим Интерстеллара чуть выше Начала.
Понятно, что в реальности алгоритм будет ранжировать (да, забыл сказать, такая операция называется “ранжирование”) из множества единиц контента и одновременно учитывать сотни и тысячи единиц информации о пользователе. Но логика такая.
Сценарий второй. Вася из другой реальности (скажем, с Земли-616) только-только зарегался на Кинопоиске. Данных по нему нет, сравнить с другими пользователями не выйдет, коллаборативно фильтрануть не получится. Но! Во-первых, он наверняка зарегается не просто так из вакуума, а придёт за определённым тайтлом.
Ну например, увидит сериал “Игры” и такой: “О, это мне надо, хочу смотреть на младшего Верника в антураже брежневского Союза”. И оформит подписку.
И алгоритмы такие: “Ага, ему нравится младший Верник (ну или Серебряков, единственный в своём роде), антураж СССР, спортивная тематика, драмы с элементами детектива, современные российские сериалы, …”. Это всё гипотезы, каждую из них CatBoost может начать отрабатывать. Рекомендовать, смотреть на результат. Рекомендовать дальше, улучшать результат, отрабатывать ошибку. И так далее, далее, далее. Повышая знание о пользователе, учитывая всё новые факторы, делая “градиент” всё более плавненьким. В какой-то момент у Василия будет достаточно истории, и его получится нормально запихнуть в коллаборативную фильтрацию.
Если Вася всё же пришёл из ниоткуда (действительно холодный юзер), то ему сначала дадут глянуть что-нибудь из самого популярного. Посмотрят, как он реагирует на разные тайтлы из топ-10, а дальше см. выше.
Знания о пользователе крутятся, кэт бустится.
Здесь ещё можно было бы разобрать, какие факторы учитываются в градиентном бустинге, как именно алгоритм достаёт эти данные, с какой скоростью он учится… и многое другое.
Однако, статья и так получилась чуть больше, чем я планировал, поэтому на этой ноте откланяюсь. Напоследок держите набор простейших действий, способных здорово помочь КэтБусту и натренировать Кинопоиск. С другими онлайн-кинотеатрами тоже должно сработать - вплоть до Netflix или даже Youtube (последний - это тоже своего рода стриминг). Итак:
Ставим высокие оценки фильмам и сериалам, которые вам нравятся, и низкие - тем, которые не зашли. Для этого в конце просмотра есть специальная голосовалка, не пропускаем её.
Если листаем ленту и видим что-то прикольное, не стесняемся добавлять в “Буду смотреть”.
Если видим, что рекомендательная система прогадала и запихнула в ленту залётные неактуальные тайтлы, то прожимаем кнопку "Неинтересно".
Если вас зацепил какой-то фильм или сериал из ленты, но вы не хотите его смотреть прямо сейчас, то можно включить его хотя бы на пару минут (а лучше минут на 5-10). Это станет важным сигналом для рекомендательных систем.
Если не забывать про эти простые шаги, то алгоритмы скажут вам “спасибо”, коллаборативная фильтрация станет ещё более меткой, а вы сможете тратить ещё меньше времени на поиск персонализированной актуалочки.
Очень надеюсь, что вам стало понятнее, по какой логике алгоритмы этих наших стримингов вываливают на нас именно те фильмы, сериалы и прочее народное творчество, которое актуально, релевантно и желанно именно нам и именно в данный конкретный момент времени.
P.S. Понятно, что выше я описал основные подходы и базовую логику их применения. На самом деле сложность и продвинутость сего действия нужно умножить на дцать, и вообще, там всё переплетено так, что мама не горюй. Но принцип именно такой.
Если вам понравилось, то подписывайтесь на мой тг-канал Дизраптор, где я человечьим языком разбираю интересное из технологий, инноваций и бизнеса. А на втором канале Фичизм выходят самые кайфовые фичи и всё такое.
Примерно 20 лет назад я подписал соглашение о неразглашении с одной очень крупной звукозаписывающей компанией, связанное с их попытками продавать свой каталог онлайн. Стриминг, продажи и т. д. Это было минное поле, потому что они всё ещё опасались разозлить розничных продавцов на центральных улицах, а именно от них зависели чарты.
Попытки были сорваны руководителями высшего звена компании. Однажды они все отправились на конференцию в Буэнос-Айрес под названием «Что такое MP3», чтобы ввести их в курс дела. Дело в том, что они потратили так много времени на вечеринки, что единственным, что, похоже, запомнилось, была тактика запугивания по поводу того, как подростки могут скачивать MP3-файлы из интернета, и их можно легко скопировать и распространять.
Когда они вернулись, было приказано удалить из интернета все элементы каталога. Никаких 30-секундных превью, ничего не должно быть слышно. Ни намёка на аудио. Всё заблокировать. Сложите все кассеты в сундук и залейте его бетоном на дне моря. Тогда все вернутся к компакт-дискам. Старые добрые прибыльные компакт-диски.
Я работал в компании по созданию веб-сайтов в 1999 году, управляя сайтом крупного бренда / большого банка, который спонсировал оплаченный билет на Супербоул в оба конца. Я работал над сайтом, на котором собирались все заявки, и разместил правила, которые юридический отдел компании написал для описания правил конкурса.
Победитель должен был быть выбран случайным образом, и я написал программный инструмент для случайного выбора победителя, который должен был использоваться после окончания конкурса.
Когда конкурс закончился, мне сказали забыть о моём инструменте, забыть о правилах, просто заглянуть в базу данных и найти кого-нибудь в Южной Флориде (где проходил Супербоул в 1999 году), чтобы компании не пришлось платить за перелёт.