ФНС и МногоДата

Камрады, думаю что многим будет интересно утром посмеяться... А так как тут и налоговая, и данные, которые в теории можно открыть и в Экселе, думаю кому-то будет интересно... Но напомню - ОНИ собирают наши налоги.. (потому еще смешнее)
В общем кто не в курсе - скоро ФНС будет заместо Википедии - все знать про всех и каждого (кому интересно - гуглируйте, инфы много, но "песня не об этом")...
В рамках создания того самого реестра в  ФНС начали переезжать некоторые базы данных. Допустим переехал общий реестр адресов РФ. Уточню - фамилий там нет, а вот адрес КАЖДОГО дома в РФ - есть. И это не Кадастр, там другая структура и смыслово база другая. И данные эти данные достаточно объемны + ну не на расхват это уж точно. Развернутая СУБД должна "на слух" под 50Гб весить, а чтобы с ней работать нужен уже другой стэк софта и железа....  Но случилось так, что мне как раз "в коллекцию не хватает", что-то я проникся системой "Открытые данные", и по работе СЛИШКОМ частно все это использую. Дождавшись утречка - открываю ссылочку, обратите внимание на РАЗМЕР, ну просто для понимания...

ФНС и МногоДата Данные, Мат, Длиннопост, ФНС, Реестр, База данных

Там же и инструкция, ознакомимся пожалуй, пока эти бешеные гигабайты будут скачиваться... И вот уже на открытии инструкции уже "пробрало"..

Тут чуть лирического отступления - в РФ (что немного странно, но правда) достаточно хорошо работает система Открытые Данные. То есть вот прям настолько, что если данные не подпадают под закон (какой-нибудь) - то они будут в интернетах и будут обновляться раз  в неделю.. И для тех, кто с ними работает - это просто ПРАЗДНИК, но вернемся у ФэНесе...
Открытые данные, 10гб база, файл в ВОРДЕ. С ССЫЛКОЙ.НА САЙТ ФНС. То есть я скачал файл в с сайта чтобы получить ссылку на сайт.. Окич, лезем дальше..

ФНС и МногоДата Данные, Мат, Длиннопост, ФНС, Реестр, База данных

Про "может меняться IP" оставим, пустое... А вот "возвращает в формате Json".. Я от страха с интересом подумал что они на мидл-обработчике-ноSQL замутили 10гб архива с данными.. Потом полез читать описание. DBF... стоп... DBF?! БД написана в 1970х годах...  Кто с 1эсой работал - вот это ТО САМОЕ глючное говно, которое было в 1С вначале 2000х.. Ладно, пофигу, XML есть? Давайте его сюда. (за компанию посмотрел я на тот JSON - вопрос "А ЗАХУЙ им тут JSON?" я решил даже про себя задавать.. Ну оказалось JSON нам для JSONa, вот потому что...

ФНС и МногоДата Данные, Мат, Длиннопост, ФНС, Реестр, База данных
ФНС и МногоДата Данные, Мат, Длиннопост, ФНС, Реестр, База данных

Все, весь JSON... А ведь можно было бы ну там хотя бы ХЕШ АРХИВА? Не? Да и пес с ним - база как раз скача.. что?

ФНС и МногоДата Данные, Мат, Длиннопост, ФНС, Реестр, База данных

Ладно, думаю может повезло и как раз на серваке у них поменялся айпишник в это время... Ставлю еще разик на скачивание, а так как открывать 10Гб я с локалки и не собирался, то сразу и
ssh
sudo get update
get upgrade
CURl https://fias.nalog.ru/DownloadUpdates?file=fias_xml.zip&...

А курл мне и курлыкнул

ФНС и МногоДата Данные, Мат, Длиннопост, ФНС, Реестр, База данных

Ну и архив которых я скачал на локалку - тож кривой как и первый)
Вот такая автоматизация... все в порядке.. только чуть весело)

П.С. Если кому интересно - как я ее все-таки скачаю - могу скинуть кусочек для ознакомления. На самом деле это может и исправить ситуацию с такими косорезами.. а может и нет, все равно интересно посмотреть)

MS, Libreoffice & Google docs

722 поста15K подписчиков

Добавить пост

Правила сообщества

1. Не нарушать правила Пикабу

2. Публиковать посты соответствующие тематике сообщества

3. Проявлять уважение к пользователям

4. Не допускается публикация постов с вопросами, ответы на которые легко найти с помощью любого поискового сайта.

По интересующим вопросам можно обратиться к автору поста схожей тематики, либо к пользователям в комментариях


Важно - сообщество призвано помочь, а не постебаться над постами авторов! Помните, не все обладают 100 процентными знаниями и навыками работы с Office. Хотя вы и можете написать, что вы знали об описываемом приёме раньше, пост неинтересный и т.п. и т.д., просьба воздержаться от подобных комментариев, вместо этого предложите способ лучше, либо дополните его своей полезной информацией и вам будут благодарны пользователи.

Утверждения вроде "пост - отстой", это оскорбление автора и будет наказываться баном.