80

Ответ на пост «Дело Долиной»3

Есть у меня интересное про цены на недвижимость. Лет 6-7 назад я уже создавал систему для оценки недвижимости, которая была куплена одним из федеральных застройщиков из топ-а. И вот недавно поступил запрос на разработку аналогичной системы, но конкретно под оценку новостроек. Просчитывать шахматку квартир и т.д.

Ниже упрощенное представление моего отчета для потенциального клиента и для себя чисто.

  1. Собираем данные с ЦИАН, Авито, ДомКлик. Вторичку и новостройки.

  2. Москва и Московская область рассматриваются совместно, из-за своей структуры на карте.

  3. Деление на сегменты

    1. Вторичка делится в среднем на 86 кластеров.

    2. Новостройки - на 31 кластер.

    3. Вторичка + новостройки делится на 102 кластера.

  4. Спред между вторичкой и новостройками внутри одного и того же кластера (в процентах к стоимости вторички).

    1. От 12% до 71% в различных кластерах.

    2. Разница в спреде внутри одного кластера никак не коррелируется по параметрам с другими кластерами. По крайней мере с достоверной точностью.

    3. Распределение не нормируется. Среднее – 32%, взвешенное – 24%.

  5. Точность оценки при делении выборки 90/10. 90 обучающей / 10 для проверки. Сначала делал предикт, потом очищал. Выхлопы за 3 сигма не учитывал. Отклонения фактической стоимости от оценочной, в процентах:

    1. Обучение на вторичке, оценка вторички: -5,2 … +4,7

    2. Обучение на общей, оценка вторички: -6,7 … +5,1

    3. Обучение на общей, оценка новостроек: -12,1 … +8,6

    4. Обучение на новостройках, оценка новостроек: -10,3 … +8,7

  6. Оценочная стоимость в среднем оказывается ниже фактической.

    1. Во вторичке: в 57% случаев.

    2. В новостройках: в 67% случаев.

Если кратно, то совершенно неприемлемые результаты оценки. Это лучшая совокупность моделей из всех рассмотренных вариантов и комбинаций разных подходов. На что обратил внимание:

  • Чем длительнее срок пребывания на рынке (на площадках), тем меньше отклонение, но всё равно сильно за рамками прежних оценок моих.

  • Точных цифр не сохранил, но если делать оценку только на тех объектах, которые на рынке более или равно 2 месяцам, то точность повышается.

  • Крупные агентства недвижимости и застройщики выкладывают различные объекты на различных площадках. Не деактивируют с последующей новой активацией одного и того же объявления, а просто удаляют и публикуют заново. Видимо, чтобы невозможно было отследить поведение конкретного объекта на рынке.

  • Для новостроек никакие ухищрение не работают от слова совсем.

  • Для новостроек добавлял и убирал различные параметры окружения, вводил/выводил данные по рынку с тех же дом.рф или СберИндекса. НИЧЕГО не работает.

Итог по оценке новостроек. Или я совсем сильно что-то не понимаю, или цены рисуются по наитию и не зависят просто ни от чего. Никаких паттернов я не смог выявить. Которые бы работали приемлемо хотя бы на половине кластеров. Про большую часть я вообще молчу.

Также стояла вторая задача для прогноза скорости выбывания с рынка по стоимости / оценка оптимальной стоимости для определенной скорости вымывания объектов.

Рассмотрел:

  • Модель Кокса

  • Random Survival Forest.

  • DeepSurv. (нейро версия модели Кокса).

  • Gradient Boosting Survival Trees.

  • DeepHit.

Ни один из подходов не дал вменяемых результатов. Деление делал по отбивке 2 месяца. Данные с возрастом от 2 месяцев для обучения, остальные данные для предсказания на "будущее". 1 / 2 месяца. 1 / 2 / 3 ... 9 недель.

По чисто временным рядам сходимость с фактом есть. Если чисто поведение рынка предсказывать. До 3 месяцев включительно очень хорошие результаты. Но этого мало.

Выводы:

  1. Рынок на текущий момент АБСОЛЮТНО не прогнозируемый.

  2. Цены на новостройки нарисованы и не имеют никакого отношения к чему-либо вообще.

  3. Цены на вторичку тоже, мягко говоря, не всегда адекватны. Но связаны, скорее всего, с тем, что люди просто выкидывают на рынок свои квартиры по заведомо завышенным ценам в расчете на "а вдруг продастся".

P.S. Раньше такой фигни не было )

Лига Недвижимости

2.8K постов5.8K подписчиков

Правила сообщества

Ну тут как обычно: оскорбления там всякие, поведение плохое, флуд и все дела,короче ничего мудрёного.

18
Автор поста оценил этот комментарий

Банальный пример. Квартира новостройка в ипотеку по семейной ипотеке стоит 30 млн, за наличку застройщик отдает её за 20 млн.

О каком адекватном рынке недвижимости может идти речь?

раскрыть ветку (1)
4
Паниковского бьют!
Автор поста оценил этот комментарий

Именно так. Мне примерно в таком же ключе знающие люди объяснили тренды.
А еще комиссии за привлечение клиента с крупными агентствами сейчас могут составлять вплоть до 15% от цены договора. Это просто финиш.

показать ответы
4
Автор поста оценил этот комментарий
Так а че делать? Как понять куда слить мат кап? И адекватная стоимость или нет? И как воспользоваться семейной ипотекой, чтобы не проебаться
раскрыть ветку (1)
1
Паниковского бьют!
Автор поста оценил этот комментарий

Камеди Клаб «Экономика»
https://www.youtube.com/shorts/ovOs8IZef6Q

Предпросмотр
YouTube0:59
1
Автор поста оценил этот комментарий

Добрый день. У меня оценочная компания. Как бы нам пообщаться на тему автоматизации оценочной деятельности?

раскрыть ветку (1)
1
Паниковского бьют!
Автор поста оценил этот комментарий

Напишите ваш email или сайт, свяжусь с вами

показать ответы
0
Автор поста оценил этот комментарий

Точность оценки при делении выборки 90/10. 90 обучающей / 10 для проверки. Сначала делал предикт, потом очищал. Выхлопы за 3 сигма не учитывал. Отклонения фактической стоимости от оценочной, в процентах:

Обучение на вторичке, оценка вторички: -5,2 … +4,7

Обучение на общей, оценка вторички: -6,7 … +5,1

Обучение на общей, оценка новостроек: -12,1 … +8,6

Обучение на новостройках, оценка новостроек: -10,3 … +8,7

я это понял как тс погрешность и точность перепутал - что часто бывает

ну и такое называть

АБСОЛЮТНО не прогнозируемый

это как то слишком

раскрыть ветку (1)
0
Паниковского бьют!
Автор поста оценил этот комментарий

тс погрешность и точность перепутал

Да, так и есть. Просто так доступней для понимания.

0
Автор поста оценил этот комментарий

Я от всего это далек но любопытно спросить у того кто этим занимается


Вот в продуктиве предполагается дообучать модель на новых данных?

Если да то вы тоже будете выкидывать "Выхлопы за 3 сигма"?

Если да то как при этом не пропустить появление новых факторов?

И другой вопрос

По идее если все систематическое учтено результаты должны бы подчиняться нормальному распределению?

Если да то если достаточно результатов то получается можно проверить все учел или нет ?

раскрыть ветку (1)
0
Паниковского бьют!
Автор поста оценил этот комментарий

Это не одна какая-то модель. Это каскад из множества решений. И чистый ML и конкретные нейронки.
Могу сказать, что и тексты объявлений, и фотографии также анализируются, не только типовые параметры "в лоб".
В более развернутом виде рассказывать, как всё устроено - не целесообразно для меня, по понятным причинам.

0
Автор поста оценил этот комментарий

По каким признакам делили на кластера?

раскрыть ветку (1)
0
Паниковского бьют!
Автор поста оценил этот комментарий

На кластеры делил не по признакам. По признакам классифицировал. И уже на основании классификации и близости тех или иных параметров делил на кластеры.

Темы

Политика

Теги

Популярные авторы

Сообщества

18+

Теги

Популярные авторы

Сообщества

Игры

Теги

Популярные авторы

Сообщества

Юмор

Теги

Популярные авторы

Сообщества

Отношения

Теги

Популярные авторы

Сообщества

Здоровье

Теги

Популярные авторы

Сообщества

Путешествия

Теги

Популярные авторы

Сообщества

Спорт

Теги

Популярные авторы

Сообщества

Хобби

Теги

Популярные авторы

Сообщества

Сервис

Теги

Популярные авторы

Сообщества

Природа

Теги

Популярные авторы

Сообщества

Бизнес

Теги

Популярные авторы

Сообщества

Транспорт

Теги

Популярные авторы

Сообщества

Общение

Теги

Популярные авторы

Сообщества

Юриспруденция

Теги

Популярные авторы

Сообщества

Наука

Теги

Популярные авторы

Сообщества

IT

Теги

Популярные авторы

Сообщества

Животные

Теги

Популярные авторы

Сообщества

Кино и сериалы

Теги

Популярные авторы

Сообщества

Экономика

Теги

Популярные авторы

Сообщества

Кулинария

Теги

Популярные авторы

Сообщества

История

Теги

Популярные авторы

Сообщества