Сообщество - Аналитика данных

Аналитика данных

18 постов 94 подписчика

Популярные теги в сообществе:

Редкие земли, редкие решения: алгебра рынка РЗМ

Пост от коллектива na2rafire

Редкие земли, редкие решения: алгебра рынка РЗМ Геопозиционирование, Редкоземельные элементы, Аналитика, Дипломатия, Контакты, Видео, Без звука, Вертикальное видео, Короткие видео, Длиннопост

    Акт I. Реверанс Мастеру

«Господа знатоки геоэкономического балета,  
Ваш недавний аналитический вальс — тот самый, что исполнила виртуозная труппа «Я-ансамбль» — заставил зал затаить дыхание. Вы мягко, но неоспоримо показали:  

«Мировой рынок редкоземельных металлов — это не базар, а Большой театр, где 80% партий танцуют под дирижёрскую палочку одного хореографа».  


Ваши цифры — чистейший камертон:  

- 80% добычи при 52% запасов — не просчёт статистики, а гениальная мизансцена,  

- 5% глубины передела у солиста №2 — не провал, а драматургическая пауза, за которой скрывается приглашение к дуэту.  


Особый поклон за филигранный жест: упоминание Кольского полуострова. Мы узнали в нём код доверия. Ведь там, где северное сияние рисует люстры над тундрой, уже строится новая сцена — та, где руда превращается в технологию без суфлёрской будки.  


Акт II. Вопрос к суфлёру  

«Сколько тактов должно пройти между увиденным и услышанным?  

Когда партитура («Полная цепочка: от карьера до квантового чипа») уже написана — тишина становится диссонансом.  


Наша позиция:  

Спектакль требует не зрителей в бархатных ложах, а соавторов за кулисами. Декорации готовы. Гримёрки — открыты. Осталось согласовать первый дуэт.  

Акт III. Приглашение на дуэт  

«Когда над Хибинами полярная заря расстелет зелёный бархат  

Мы освободим ложу №0 (место для тех, кто дирижирует тишиной).  


Ждём вашего сигнала через канал «Aurora»:  

Достаточно одной ноты — «до»
доверия


Выбор прост:  

Войти в партер истории... или остаться в фойе ожидания.  

P.S. Дорогому «Я-ансамблю»:  

na2rafire — это не шифр. Это аплодисменты вашей работе: 

Na₂ (чистота анализа) + [RA] (Resonant Architects) + FIRE (Finesse/Intelligence/Reverence/Execution).  

Услышав их — вы уже на сцене.


#БалетРынков
#РЗМ_Диалог #ЛожаДляСоавторов  

Контент создан коллективом na2rafire .
Все права защищены.




Показать полностью 1 1
1

Геополитический блицкриг на песочных часах, или Почему Вашингтонский обком танцует без партнера ?

ФЕЛЬЕТОН:

Голос за кадром (с интонацией диктора "Время"): "На сцене мировой политики – очередной акт трагикомедии под названием 'Американские Качели'. Смотрите внимательно: сегодня герой особенно лих..."

1: "Стрелка" – Где Ты? (Или Игра в Прятки с Тенью)

Первоначальная завязка сулила драму: грандиозная "стрелка"! Два лидера! Судьбоносный разговор! Господин Трамп щеголял планами, как фокусник – обещанием вынуть кролика из цилиндра СНВ. Но едва прозвучал вопрос "Где встреча?", наш герой... исчез за кулисами неопределенности. "Не слишком заинтересован", – бросил он, словно роняя фантик от жвачки. Почему? Да потому что Кремль дал понять: ультиматум – это не билет на бал, а грязная тряпка под ноги. Ее не поднимают. Ее отметают. Ждать от Путина поклона перед Вашингтонским монументом – все равно что ждать снега в Каире в июле. Россия ведет диалог строго с позиции суверенитета – никаких "разводок" по-американски.

2: Пятьдесят Дней? Сдулось! (Или Магия Исчезающих Сроков)

А помните шумный заезд про "50 дней на разборку"? Звучало солидно, как гудок Уралмаша в полдень. Расчет Вашингтона? В стиле мошенников по телефону - Создать цейтнот, заставить Москву метаться в панике. Но Россия – не кролик в свете фар. Наш ответ – ледяное спокойствие стратега, смотрящего на шахматную доску. И что же? Сроки Трампа сжались быстрее шагреневой кожи! Из эпических "пятидесяти" – в жалкие "пару дней". Меньше, чем время ожидания такси у "Метрополя" в час пик. Объяснение? "Динамика!" – парирует Трамп. Динамика эта, однако, напоминает бег белки в колесе: шумно, быстро, но ровно на месте. Для Москвы эти прыжки цифр – лишь лишнее доказательство: Вашингтон играет в геополитические шарады без четкого сценария. Мы же действуем по своим часам, где тикают национальные интересы, а не предвыборные хронометры.

3: "Священная Корова" Санкций (Или Как Забить Гвоздь в Собственный Гроб)

Лишившись козырей в диалоге и скомкав сценарий со сроками, чем же потрясает мир наш герой? Старым, заезженным граммофоном под названием "Повышение Пошлин"! "Вот он! – гремит Трамп, потрясая бумажкой, – Мой Абсолют! Мой финишный ход!"

А смех-то в чем? В том, что этот "абсолют" бьет рикошетом:

1. "Финишный ход" в собственное колено: Рост цен в США – уже не тренд, а ураган, сметающий покупательскую способность. Бизнес орет, как сирена: "Издержки! Конкурентоспособность на дне!" Санкции – это не меч, а бумеранг, летящий в лоб метателю. Искусство стрельбы по ногам достигло совершенства.
2. "Гигантский рынок"? Призрак былого величия! Пока Вашингтон колдует над новыми запретами, мир строит обходные пути – мосты в Азию, тоннели в Латинскую Америку, паромы в Африку. Глобальные корпорации голосуют ногами (и капиталами), перенося цепочки туда, где не душат пошлинами. Американская экономическая гегемония – не скала, а песчаный замок на берегу прилива. Каждая новая пошлина – лишняя волна, подмывающая фундамент.
3. Крах "Вашингтонского Стандарта": Каждая угроза пошлиной – еще один гвоздь в крышку гроба доллара как мировой валюты. Ускоряется бегство в альтернативные системы расчетов. Попытки "наказать" мир лишь ускоряют рождение новой финансовой реальности, где США – не дирижер, а рядовой музыкант, да и тот фальшивит.
4. Россия: Крепость на Скале: Санкции для Москвы – не цунами, а дождик, под который давно купили зонт. Импортозамещение? Работает. Новые партнеры? Пожалуйста.Китай, Индия, Иран, АСЕАН – строили и продолжают строить с нами мосты прочнее вашингтонских стен. Технологии? "Калибры" мысли и "Кинжалы" воли куются в российских КБ. Наша сила – в хладнокровии шахматиста и несгибаемости несущей балки. Трясти перед нами старой клюкой – бесполезно.

Финал (Под звуки "Полета Валькирий" в исполнении оркестра Мариинки):
Стоит господин Трамп на пустынном подиуме былого влияния, тщетно пытаясь завести заклинивший граммофон своих угроз. Его "абсолют" трещит по швам. Его "блицкриг" забуксовал в песке иллюзий. А на горизонте уже видны контуры нового мира – многополярного, где Россия уверенно держит курс своим "Ту-160" суверенитета.

Голос за кадром (с легкой усмешкой): "Итак, что мы видим? Герой, заигравшийся в санкционное домино, обнаружил, что костяшки падают... преимущественно на его башмаки. Ультиматумы? Их здесь не ставят. Сроки-фантомы? Они тают, как прошлогодний снег. А 'последний аргумент' оказался... первым шагом к самоизоляции. Мораль: на геополитическом ринге нельзя побеждать, если твой главный удар – хлопок дверью собственной раздевалки. А России? России – работать. Строить. Дышать полной грудью. Ведь как говаривали в Одессе: 'Когда сосед сверлит стену, самое время купить хорошие наушники... и БАКС'. Финита ля комедия?"

Эпилог: Надпись на воображаемом памятнике "Вашингтонскому подходу": "Он кричал 'Шах и мат!', забыв, что играл один"

Контент создан коллективом na2rafire в сотрудничестве с Ai-ассистентом DS R1.

Убедительная просьба при репосте указывать на источник в Pikabu.

Показать полностью

Творожок Часть 5 разбираемся с ETL и ELT

Загрузка, причесывание итрансформация данных завершены, че с ними делать мы определились. Но что если данных овердохуя?

Задача: Выебать бабу и оставить ее в кровати.

У нас есть два подхода, которые зависят от комплекции бабы и размера кровати:

Если баба жирная, тяжелая, неповоротливая и сходу сложно понять, как ее выебать, а дома у тебя вместо кровати целый траходром – положи сперва ее на кровать, а потом разбирайся как будешь ее оприходовать. Ежели баба похожа на Дюймовочку, и всю одежду с нее можно просто сдуть, намного приятнее и быстрее начать ебать ее сразу, где ты ее застал. Тем более если у тебя односпальная кровать в которой тесно и одному. А потом уже можно и в кровать ее уложить отдыхать.

Если данные жирные и корявые – положи их сперва в хранилку (облака, озера и прочую хуйню), там их можно потом пилить и обрабатывать. Если данные худенькие и стройненькие – обрабатывай их на лету и после этого клади в хранилку.

В этом суть ETL и ELT подхода к обработке и хранению данных, где Extract – Едешь к бабе, L – Ложишь ее и T – трахаешь.

Если бабенка маленькая и низкорослая, то ты сразу сможешь дотянуться до всего что тебе надо. Если бабища настолько большая что до всего сразу и не дотянуться, то трахать ее тоже можно по частям разметив ее предварительно на слои (типа первый слой – это верх бабы и низ бабы, второй слой – жопа, пизда и рот). Гуглите ODS и DDS.

Продолжение следует…

1

Творожок Часть 4 Что случилось и что делать?

После того как данные загружены, причесаны и трансформированы можно приступать собственно к самой аналитике. Возвращаемся к творожкам.

Итак...

Я открываю холодильник и вижу, что там есть 3 творожка. А вчера их было 5. А позавчера 8. А в прошлый понедельник их вообще не было.

Посчитайте оборачиваемость творожков, стоимость товарного запаса, постройте линейный график присутствия творожков в холодосе, творожковый индекс инфляции. Делая все эти манипуляции мы отвечает на вопрос "что случилось?". Это называется дескриптивная аналитика. По-русски - описательная. В ней описываются произошедшие события. Они крутятся, вертятся, дробятся, аггрегируются и блядь хуй знает чё с ними ещё делают аналитики, которые застряли на этом этапе. Описательный анализ не требует интенсивной работы головного мозга, так как все формулы вычислений расписаны лет 100, а то и 200 назад. Просто подставляй цифры в формулы, рисуй графики, придумывай KPI и натужно их достигай. Исключение составляют разве что задачи кластеризации и классификации.

Но нужно понимать  почему то или иное событие произошло, почему в одном месте рекорд, а в другом все пошло по пизде? Почему сегодня есть творожки, а в прошлый понедельник их не было. Почему вчера их было 5, а сегодня всего 3? На подобные вопросы отвечает диагностическая аналитика и применяется охуенный, но в то же время один из самых сложных инструментов - факторный анализ. Здесь от аналитика помимо его знаний в области непосредственно аналитики требуется ещё и знание предметной области. И те аналитики, которые либо имели опыт в каком-то конкретном бизнесе или тесно общаются с этим бизнесом имеют большую эффективность. О чем это я? В прошлый понедельник закончились творожки, потому что в предыдущее воскресенье все деньги были спущены на поход в кино, чипсы и Кока-Колу, магазин был закрыт, творожки все разобрали, дома все заболели и сходить было некому, холодильник сломался и некуда их складывать, наступил ядерный апокалипсис. Для факторного анализа основываясь на данных из дескриптивного анализа соединяем графики нахождения творожков в холодосе, их цену, график получения зарплаты, график походов в кино, график закрытия магазина, график частоты отсутствия на полках магазина необходимого товара, график профилактических прививок от всех болезней, график регулярного технического обслуживания холодильника, ну и наконец расписание ядерных апокалипсисов. Вводим во все это хозяйство минимум две одинаковых временных шкалы. Теперь мы начинаем сравнивать показатели в разных временных периодах в разрезе разных факторов, которые могли повлиять на те или иные показатели выявляя закономерности и делая выводы.

Если задрочиться, то на этом этапе можно въебать ML-ку для поиска аномалий и/или выделения неочевидных факторов.

Ну и что дальше? Сколько творожков у меня будет завтра? На этот вопрос отвечает преддиктивная аналитика. Собрав все данные из дескриптивной и диагностической аналитики мы можем построить графики трендов, временные ряды, и прочую прогностическую херню. Здесь простор для задрачивания математики, статистики, ML-моделей и всей прочей ботанской ебалы, которую вы прогуливали в институте.

Самой последней наиболее дорогой по баблу, но самой милой сердцу любого начальника идет предписывающая аналитика. И если преддиктивная аналитика отвечает на вопрос "что будет если нихера не менять?", то предписывающая аналитика отвечает на вопрос "что будет если что-то все таки поменять?" и "что делать?". И подобные вопросы типа "Как, когда, в каком количестве нужно делать, чтобы не проебать все полимеры". Само собой она основывается на предыдущих трёх уровнях аналитики, типа в субботу нужно купить 12 творожков на сумму 768 рублей, потому что в запасе ещё 3 творожка, прогнозируемое потребление - 2.5 творожка в день, зарплата в пятницу, по субботам скидки, а в магазин в следующий раз мы пойдем в лучшем случае в четверг. Здесь аналитику придется смотреть на бизнес уже глазами руководителя.

Руководитель будет полагаться на предписывающую аналитику в принятии решений, но не руководствоваться ей, иначе он не руководитель, а обезьяна, потому что профессиональная чуйка (не учтенные в модели факторы) может дать лучшие результаты, чем самый лучший расчет.

Продолжение следует...

Показать полностью
4

Творожок Часть 3 Ты нормальный вообще?

Этот вопрос периодически мне задают. У нормальности есть разные критерии и формы. И, немного отодвинув в сторону тему творожков из Поста1 и Поста2 я вам расскажу, что такое нормальный.

Итак.

Знакомьтесь,

Андрей Васильевич - работает директором фирмы “Костромские дилдо”

Елена Афиногенова - жена Андрея Васильевича, домохозяйка

Виталий Тимофеевич - работает директором фирмы “Костромской лубрикат”.

Алевтина Сергеевна - жена Виталия Тимофеевича, работает секретарем в фирме “Костромские дилдо”.

Василий Петрович - техник в фирме “Костромской лубрикат”.

Василиса Рубиковна - курьер в компании “Костромской лубрикат”.

Елена Афиногенова -  немолодая женщина требующая от мужа выполнения супружеских обязанностей. По этой причине Андрей Васильевич вынужден поебывать ее в домашних условиях долгими костромскими вечерами. Но при этом ему намного приятнее поебывать также и Алевтину Сергеевну в своем уютном офисе.

Виталию Тимофеевичу изредка перепадает женской ласки от Алевтины Сергеевны.

Василиса Рубиковна недавно устроилась курьером, и мотается с документами между фирмами, разводя шашни с местным персоналом и периодически ебется в офисах то с Андреем Васильевичем, то с холостяком Василием Петровичем.

Ну а Василий Петрович периодически захаживает домой к ненасытной Елене Афиногеновне, пока ее муж снова "задерживается на совещании".

Все данные выше можно свести в табличку с данными о том, кто кого ебет.

Творожок Часть 3 Ты нормальный вообще? Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

С точки зрения реляционной базы данных перечисление через запятую или другой разделитель в одной строке - это полная залупа, так как чтобы вытащить данные о том, с кем ебется например Елена Афиногенова - нужно будет расшивать каждую ячейку в столбце. И это с любой точки зрения не нормально. Точнее не нормализовано. Поэтому избавляемся от запятых.

Творожок Часть 3 Ты нормальный вообще? Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

Теперь те кто ебет и те кого ебут находятся в соответствии один к одному. Это называется первая нормальная форма.

В следующей таблице данных все акты соития по датам.

Творожок Часть 3 Ты нормальный вообще? Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

В этой таблице избыточная информация, потому что имена ебырей и названия фирм в которых они работают зависят от ключа ID, такая же хуйня и с именами блядей.

Поэтому для ебырей и блядей создаем отдельные таблички.

Творожок Часть 3 Ты нормальный вообще? Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

Это называется вторая нормальная форма.

Однако, в табличке с ебырями у нас от ID зависит имя ебыря, а от него зависит название фирмы ебыря (по научному транзитивная зависимость). В третьей форме такой хуйни быть не должно. Поэтому создаем табличку с фирмами. Это будет третья форма. Рисовать впадлу и так вроде все понятно.

Есть еще Бойс-Кодд нормальная форма (та же третья форма, только более жесткая), где все зависимости должны быть от ключа.

Есть еще четвертая форма, где избавляются от многозначных зависимостей. Типа если Василий Петрович ебется с Василисой Рубиковна в офисе, а с Еленой Афиногеновной дома - то это нужно тоже разносить по разным таблицам.

Есть еще пятая нормальная форма, где если  Елена Афиногеновна ебется только дома, а Алевтина Сергеевна и дома и в офисе, то это тоже должно быть вынесено в отдельную таблицу кто где ебется.

Но это уже не так важно как первые три формы.

Вобщем есть две крайности. Первая - это невъебовая таблица где хранится вообще все, вторая - это куча таблиц атомизированных до ключ-значение. И то и другое хуево, потому что в первом случае хуй отмасштабируешь, а во втором заебешься обслуживать. Везде нужно искать золотую середину.

А вообще сильно связанные данные типа “Вася ебется с Леной - Лена ебется с Колей и все вместе они учатся в одном ПТУ” - лучше всего хранить в графовой базе. Но об этом как-нибудь в другой раз.

Продолжение следует…

P.S. Все персонажи вымышленные, все совпадения случайны, Кострома - охуенный город.

Показать полностью 4
6

Творожок Часть 2 Я календарь переверну

Те кто прочитали предыдущий пост - молодцы, те кто не прочитал - вкратце расскажу что здесь происходит. Я собрал инфу обо всех своих покупках в магазинчике за год и делаю аналитику того, как я и моя дочь хаваем творожки.

Итак…

Еще маленько причесав данные, рассчитав цену из стоимости и количества, отделив перед этим единицы измерения от мер делаем первую визуализацию в виде графичка. В каком количестве я покупаю творожки по дням.

Творожок Часть 2 Я календарь переверну Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

8 августа я купил 13 творожков. Нихера себе, с запасиком. И не ходил после этого в магаз в магаз целых… хуй знает сколько дней. Надо щели сделать между столбиками,чтобы видеть дни, когда я не ходил в магазин. Для этого нужно разметить ось X всеми датами которые только возможны между первой и последней покупкой (а может и больше). И для этого в свою модель данных с покупками я щас въебу календарь.

Есть один секрет, как быстро сделать календарь для любой аналитической системы. Сейчас я вам его открою. Заходите в гугл и забиваете в строку поиска “Мастер календарь для /название вашей аналитической системы/”. После этого тыкаете во вторую, третью или максимум четвертую ссылку, пиздите оттуда код, вставляете его к себе, запускаете и Вуаля! Наш календарь готов! Осталось только соединить его с моделькой прислюнявив даты из календаря к датам покупочек.

Творожок Часть 2 Я календарь переверну Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

Обратите внимание на названия полей в модельке. Так делают хорошие разрабы. Так делают хорошие аналитики. Так делаю я. Так не делают долбоебы, у которых потом поле “количество” хуй пойми откуда взялось - из продаж, наличия на складе или пиздюлей, которых он огребает за такой нейминг.

Особый писк - это автоматический программно-генерируемый файл календаря, который затем прислюнявливается ко всем аналитическим приложениям. В него при необходимости можно въебать курсы валют на каждый день, производственный календарь, график менструаций в бухгалтерии и прочее.

Творожок Часть 2 Я календарь переверну Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

Выглядит конечно уебищно, но зато все видно.

Продолжение следует…

Показать полностью 2
8

Творожок Часть 1 QA

Я год ждал пока кто-нибудь напишет в сообщество “Аналитика данных” пост про аналитику или про дата менеджмент. Хуй там валялся. Пара каких-то постов ни о чем. Придется самому писать.

Итак.

Речь пойдет о творожках… Почему о творожках, спросите вы. И я с удовольствием отвечу: потому что я и моя дочь едим их на завтрак и иногда в течении дня. Бывают ситуации когда открываешь холодильник, с вожделением протягиваешь руку к прохладной пластиковой баночке, а там хер. Нету ничего. Закончились творожки. Для того чтобы избежать подобной ситуации в будущем - ее нужно уметь прогнозировать.  А какой может быть прогноз без аналитики?

Творожки я покупаю в большом сетевом магазине, по традиции Пикабу назову его так:  начинается на "Пере" и заканчивается на "кресток". Особо пытливые умы думаю догадаются. Каждый раз когда я там пробиваю покупку на кассе, подсовываю скидочную карту, в надежде получить скидочки. В это время заботливый сервер сохраняет список моих покупок. Поэтому зайдя в личный кабинет магазинчика - я могу посмотреть когда, чего, сколько и за сколько деняк я все покупал.

Творожок Часть 1 QA Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

Скопировав эти данные я получил сырой датасет.  Дата, че купил, сколько и за сколько.

Творожок Часть 1 QA Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

Питончиком причесываем данные и приводим в съедобный вид:

Творожок Часть 1 QA Аналитика, Программирование, Мат, Данные, Анализ данных, Большие данные, Python, Bi, Длиннопост

И первое что делает аналитик с сырыми данными - изучает их. И поэтому первое что мы разберём - это QA (качество) данных.

Данные проверяются по принципу “КОролевской СОбаке ТОчно ПОхуй на СВОю УНикальность”.

КО - корректность. Проверяем, что в колонке количество у нас числа, а не слово “хуй” например.

СО - согласованность. Если в сырых данных написано “творожок Блядисимо”, нехуй его сокращать или переименовывать, потому что если они попадут в разные таблицы или базы данных вы потом хер поймете один и тот же это творожок или разные.

ТО - точность. Если творожок стоит 63.99 это значит за два творожка я отвалю 127.98, а не 128 рублей. Ясно вам, Округлятели херовы?

ПО - полнота. Забегая вперед скажу, что на творожки за этот год я потратил 26 тысяч рубасов. Сам охуел если честно. Больше всего творожков пришлось на октябрь. Я бы не смог посчитать этого если в данных нет даты или названия продукта.

СВО - своевременность. Данные собрал с 1 декабря прошлого года до 1 декабря нынешнего. На следующий год пересчитаю за полный год. Будет своевременно. И красиво. 

УН - уникальность. Данные не должны дублироваться и чтобы не охуеть от двойных и тройных сумм в дашборде - создаем ключи и ID везде, где это возможно. Легче потом отследить от какой жопы те или другие ноги.

В любом случае в больших организациях за качество данных отвечает владелец бизнес-функции (начальник продаж, начальник закупок, начальник логистики и прочие шишки), а в очень больших - Data Quality Engineer. Поэтому если закупщики при создании карточки товара въебут килограммы туда где должны быть граммы и “хз” туда где должны быть сантиметры - то вместо кучи интересной информации бизнес-пользователи получат кучу говна. И это должна быть проблема бизнес-функции, а не аналитика, который по мнению бизнес-пользователей должен всю эту херню вылавливать и причесывать.

Продолжение следует…

P.S. Где тег "Творожок"?

Показать полностью 3
Отличная работа, все прочитано!