Как-то маловато...
Понятно, что движок крохи съедает, посты с комментами в базе данных сидят и много не занимают, видяхи внешние, но картинки-то! Картинки!
А почему бы после загрузке фотки, после сжатия её не проверить, не стало ли хуже (больше). По сравнению с временем самой обработки эта проверка будет практически незаметна.
я не пойму, а почему тут некоторые пиксели с градиентами? разве такое возможно при нормальном сжатии?
Есть такая вещь как "дедупликация", которая позволяет не хранить кучу одинаковых файлов, а делать как бы "ссылки" на один валидный. Думаю здесь что-то похожее тоже работает.
Да сделать это можно за 5 минут: делаем md5 загружаемого файла, если не найдено, добавляем в хэшмап табличку md5 -> link. Если нашли, то берем link
Будет весело, если где-либо таки найдутся 2 файла с одним и тем-же хешем. Я не говорю, что это будет, но пусть малая вероятность, но есть. Представляю лицо чувака, который будет вторым загружать файл и получит вовсе не то, что ожидал =)
Если считать что подлиннее - хватит на все файлы.
Онлайн-калькулятор, строка "w", SHA-256
50E721E49C013F00C62CF59F2163542A9D8DF02464EFEB615D31051B0FDDC326
в десятичной форме 3.6593403479552E+76
то есть сейчас можно различать до 3*10^76 файлов (с sha256). А когда мы начнён упираться - думаю, sha-1024 решит проблему ))
Веткой выше 3 шакала, картинки аналогичны, а файлы разные, и все хеш суммы значит тоже разные. Найдёт далеко не всё. Тут надо какая-нибудь система (нейронная сеть?), которая сравнивает все картинки, при том учитывая ихний их масштаб и размер. Считать дубликатами при, пусть, 99% визуальном совпадении. Оставлять версию с большим разрешением.
...хотя не всегда версия в большем разрешении лучше, тут надо смотреть. В лоб не выйдет.
Ветка шакалов, для лл #comment_79301495
Тогда можно каждую букву алфавита хранить отдельно и комментарии не будут занимать место на сервере.
Ладно, шучу.
А чо картинки - открой годичной давности посты и дальше - там в большинстве случаев уже нихуя нет
Сколько не заходил в старые посты - всегда все было. Решил проверить, нашел пост в сохраненном давности 727 дней: в комментах картинки тоже есть. http://pikabu.ru/story/miniobzor_na_komiks_supergod__superbo...
Busted.
Не могу) На это и намек, видимо? (я пытаюсь в "лучшем" выбрать дату, а мне показывает, что постов нет)
http://pikabu.ru/story/_554
http://pikabu.ru/story/_574
http://pikabu.ru/story/_70410
Примерно так, можешь цифры поменять в адресе и дальше уже по датам смотреть, но до 70к графического контента почти нет
Хм, и правда. Ща попробывал - все есть. Ну фиг знает, может я в тот день на профилактику архива попал. или типа того.
Битые появились после одного падения пикабу, когда у админа часть графики с сайта ушла в небытие.
Скриншоты комментов
57.7K постов40.4K подписчиков
Правила сообщества
В сообществе можно размещать ЛЮБЫЕ скрины (комментов) с любого сайта!!
ПРИКРЕПИТЬ ССЫЛКУ НА КОМЕНТ ЕСЛИ ОН С Пикабу желательно, но не обязательно!!!
Если скрин не с пикабу, а со стороннего сайта( Твиттер,. Вк, Одноклассники и т.д.) то ссылка не обязательна.
Для сообщества подходит любой скрин, набранный на клавиатуре, даже если это не диалог (под вид Твита) Так же подходит скрин с картинкой и хотя бы одним комментарием под ним, с любого источника.