3819

Я сделал программу, которая анализирует историю сообщений в Telegram и/или ВК. Вот визуализация отношений на расстоянии с моей девушкой

Я сделал программу, которая анализирует историю сообщений в Telegram и/или ВК. Вот визуализация отношений на расстоянии с моей девушкой Отношения, График, Программирование, Python, Длиннопост

FAQ


• Все данные взяты с нашей с девушкой переписки в Telegram и ВКонтакте. Мы перешли на Telegram где-то в мае 2017.


• Код на GitHub: https://github.com/vlajnaya-mol/message-analyser


• Если хотите попробовать на своей переписке, то все инструкции можно найти в файле README на репозитории. Необходима будет установка Python3.6+ и нескольких пакетов для него, с кодом можно не работать - я добавил простенький графический интерфейс. Сама программа делает немного больше чем то, что я вместил в пост.


• Слова в посте перед визуализацией были профильрованные вручную мной так, что остались только наиболее употребляемые и наполненные смыслом слова (без "я", "ну", "да" и так далее). А также я перевел их с украинского на русский :)


• Несколько слов насчет самих графиков. Я приезжал в родной город к девушке где-то раз в месяц и на зимние/летние каникулы в университете (скачки вниз в графике в эти периоды). Этой осенью она сама приехала учиться в мой город и университет, поэтому мы стали больше времени проводить вместе. Это и то, что мы уже почти все о друг-друге знаем, обьясняет постепенное падение в количестве сообщений.

Найдены возможные дубликаты

+919

Батя использовалось чаще, чем люблю? Это прекрасно!

График сообщений за минуту странный. Или он показывает самый активный период времени?

раскрыть ветку 135
+134
Иллюстрация к комментарию
раскрыть ветку 4
+88

"Время срать. Тобой воняет. Смываю."

раскрыть ветку 3
+201

Это все сообщения за 2.5 года.

Но признаюсь, я там немного соврал. Каждый столбик - 2 минуты. Пост уже слепил и решил не путать читателя и оставил "за минуту"

раскрыть ветку 91
+351

А что вы про батю-то все время пишете?

раскрыть ветку 34
+42

короче можно сделать вывод что ты с обычных сообщений перешел на голосовухи, поэтому сообщений стало меньше, еще ты живешь с батей в одной квартире и у тебя нет девушки, но ты ходишь в зал так что возможно есть парень

раскрыть ветку 1
+22

я составил свою за год: "ясно", "понятно", "ага", "давай" ))

раскрыть ветку 3
+10

В отфильтрованных словах сразу видно: понял хочу знаю сегодня очень сейчас  спать....

раскрыть ветку 1
+34
А вы знатный любитель по пиздеть)
+52

1200 сообщений за 2 минуты? 10 сообщений в секунду? Вы что побайтово общаетесь?

раскрыть ветку 9
+18

Ок, аналитика и таймтрекинг есть. Пора проводить ретроспективу и планировать новый спринт.

раскрыть ветку 3
+4
Кстати, а можно прогу?) Если можно в таком виде, что бы ее смог запустить не программист без танцев с бубном)
раскрыть ветку 5
0
Spyder?
раскрыть ветку 1
-1
Красавец, тож задумываюсь об изучении данного ЯПа
-1

В дог.апи уже есть такая функция и там чуть удобнее реализована статистика.

-1
Офигеть ты программист
-1

Боже, если честно, ситуация практически идентичная. Тоже примерно такие даты, тоже пересели на телегу в мае 2017, и тоже постепенно снижается количество переписки, т.к. по большей части общаемся по видеосвязи. Если так логически подумать, то кто-то из вашей пары из Украины.

раскрыть ветку 4
-2

Не подскажите, как импортировать диалог из WhatsApp в txt?

раскрыть ветку 15
-4

Ох.. бабу тебе надо. И не на расстоянии)))

+6
- Очень хочу сегодня и сейчас! Завтра батя дома!
- Понял...
раскрыть ветку 1
0

Ещё слово "спать" нужно уместить. Видимо, батя им мешает нормально выспаться.

+4
Может он ее отец, а она его девушка? Инцест дело семейное...
+3
Заметьте, хочу использовалось чаще чем батя.
+6

Самое грустное, что используется слово "шутка"

+6
У неё прозвище "Батя"
+2
Видимо, "батя дома"
+4

там рядом еще "Нрав, чувак, тел, спс, кул, матем"...чет косноязычием попахивает.

раскрыть ветку 1
0

Для 13-летней нормально

+1

Ух бля

0

Т.е. никого не смутило "интересТно"?!

раскрыть ветку 1
+1

Нет, тебя одного
#comment_134517283

0
Все таки ХОЧУ использовалось чаще)
0
Е-бать
0

Сегодня очень хочу .. батя, это так - ...запугивает

0

просто ХОЧУ заменяло))

-1
Понял что сегодня очень хочет батю
-6

По-моему часто использовать слово "люблю" - плохо, так пропадает его ценность и размываются границы. Лучше заменять какими-нибудь аналогами, которые более подходят для предмета и контекста разговора. Еще не понимаю людей которые говорят "сильно люблю", "очень сильно люблю". Разве есть какие-то градации любви по которым можно ее оценить? Разве у любви есть какая-то качественная характеристика? Сильно любить это как? Что должно измениться, чтобы просто любить человека, а не сильно? Разве нельзя просто любить?


Тоже интересно что у них там с батей, надеюсь, что не общий) Автору рекомендую сделать еще отдельные облака используемых слов для каждого участника беседы. Полагаю, друг-другу будет интересно.

раскрыть ветку 15
+67
Он и заменял "люблю" на "батя"
раскрыть ветку 4
+12

Конечно есть градации - люблю картошку или очень сильно люблю жареную картошку с беконом/тушенкой

+9
Комментарий удален. Причина: данный аккаунт был удалён
+1

А почему Вы решили, что "люблю" использовалось только в адрес друг друга? На этапе знакомства часто, наверняка, используется это слово для описания своих увлечений: люблю музыку/не люблю зефир/люблю кошек/не люблю зиму и т.д.

+1
Можно узнать на что можно заменить слово Любовь?
раскрыть ветку 5
-1

интересное мнение

-8
Я думаю, что не чаще, размер и положение слова не зависит от частоты использования, это дизайн облака такой
раскрыть ветку 4
-3
Либо те, кто минусят, никогда облака тегов не создавали, то ли что
раскрыть ветку 3
ещё комментарии
+267

Капец, за 1 день больше сообщений с 1 человеком чем у меня за год со всеми

Иллюстрация к комментарию
раскрыть ветку 11
+13
а у меня за всю жизнь (
+21
Это все потому что ты не добрый...."злой" какой-то...простихоспаде "пр"...поделом!
раскрыть ветку 6
+3

ПР это Party Recall?

раскрыть ветку 5
+1

Дай пять! Стараюсь меньше сообщении. КРЧ на свидании не вспомнить о чем переписка была вообще. И тем более не вспомнить хотя бы одну из всех переписок, когда уже пора рассказать внукам

-3

а тебе хочется столько сообщений в день? да ну его на хуй такое счастье

-10

Ну правильно, лучше один раз выебать, чем сто раз потрогать. В смысле я лучше позвоню, чем буду писать

ещё комментарий
+77
Я кружку с вордклаудом нашей переписки жене дарил. Вроде и фильтровал всякие ненужные слова, но "блеять", "пиздец" и "говно" проскочили. Увидел уже после печати :)
Иллюстрация к комментарию
раскрыть ветку 6
+32

а как увидел результат подумал: "пиздец, блеать"

раскрыть ветку 3
+5
Я боюсь, что именно это жена и подумала, когда увидела подарок...
раскрыть ветку 2
+15

ЛЮБЛЮ БОЛЬШЕ СПАТЬ

Иллюстрация к комментарию
раскрыть ветку 1
+3
ХОРОШО!
+337
Иллюстрация к комментарию
раскрыть ветку 9
+100
Какой же ты зануда если число ровное?) почему только один экземпляр?) даже не заверенный) нет листа согласования) вообщем лига зануд не принимает тебя на основании 17 раздела пункт 5.4.18 )
раскрыть ветку 6
+28
Господа, будьте внимательнее. Пункт 5.4.18 говорит о лишении членского билета лиги зануд на основании анализа криптографической активности индивидума в социальных сетях и прочих электронных ресурсах, позволяющих производить обмен информацией. Нарушение данного пункта не является основанием для отказа в приёме в лигу зануд, читайте 6 раздел, с пункта 3 по пункт 6.11.
раскрыть ветку 3
+8

Больше похоже на лигу бюрократов

раскрыть ветку 1
+7

188088 слов в "Война и Мир". Автор с девушкой настрочили друг другу 354780 слов. Что, блять, можно обсуждать таким количеством слов?

раскрыть ветку 1
0
Судя по частоте употребления батю.

А если серьезно пугает количество времени слитого на "поболтать" в телефон. Но это лишь моё имхо.
+27

хех, у меня тут было бы везде по нулям

+77
4 декабря 2016
Спокойной ночи
спокойной ночи
Отключайся
Нет, ты первый
Нет, ты
нет, ты
Сначала ты, я после тебя
+89

FAQ


• Все данные взяты с нашей с девушкой переписки в Telegram и ВКонтакте. Мы перешли на       Telegram где-то в мае 2017.


• Код на GitHub: https://github.com/vlajnaya-mol/message-analyser


• Если хотите попробовать на своей переписке, то все инструкции можно найти в файле README на репозитории. Необходима будет установка Python3.6+ и нескольких пакетов для него, с кодом можно не работать - я добавил простенький графический интерфейс. Сама программа делает немного больше чем то, что я вместил в пост.


• Слова в посте перед визуализацией были профильрованные вручную мной так, что остались только наиболее употребляемые и наполненные смыслом слова (без "я", "ну", "да" и так далее). А также я перевел их с украинского на русский :)


• Несколько слов насчет самих графиков. Я приезжал в родной город к девушке где-то раз в месяц и на зимние/летние каникулы в университете (скачки вниз в графике в эти периоды). Этой осенью она сама приехала учиться в мой город и университет, поэтому мы стали больше времени проводить вместе. Это и то, что мы уже почти все о друг-друге знаем, обьясняет постепенное падение в количестве сообщений.

раскрыть ветку 112
+10

@moderator , можно прикрепить этот комент к посту?

раскрыть ветку 6
+14

Да, сделано :)

раскрыть ветку 5
+19

Если подкрутишь юзер френдливость для тех кто не шарит в этих ваших питонах и удавах - будет супер. например закинуть сцыль на сам питон и инструкцию по грамонтой его установке, и подробнее что и как делать с самой прогой, а то в реадме как-то не сильно понятно, честно говоря (ИМХО)

+47
• Найдите девушку.
раскрыть ветку 1
+22

У него там "батя"

+8

Тааак. Есть пара моментов:

Out of memory. На двух разных текстовых файлах переписок с разными людьми.

И я не знаю, следствие out of memory или наоброт, или это не бага, но с графики как то странно уперлись в потолок.

Ну и с большими временным отрезками истории тоже надо что-то делать. Или менять масштаб оси времени, или я не знаю :)

Иллюстрация к комментарию
Иллюстрация к комментарию
раскрыть ветку 13
+16

Хмм, я не ожидал, что настолько большие отрезки времени будут анализироваться, по-этому сделал гибкий масштаб только для меньших отрезков (месяцы на недели заменяются)
Насчет out of memory интересно - сколько всего сообщений в диалоге?

раскрыть ветку 11
+2

или это не бага, но с графики как то странно уперлись в потолок.

Это нормализация на 100%

+3

Спасибо за интересную либу


Подскажите, пожалуйста, как создать облако слов ("Слова за частотой")

У меня в папке results есть всё, кроме картинки с облаком слов https:// i.ibb.co/Q896Qkz/Selection-029.png

раскрыть ветку 6
+3

На начале поставь галочку на "Add file with words" и добавь файл со словами, которые тебя интересуют. Просто по слову в новой строке.

раскрыть ветку 5
+3

Огонь!!

+2

Еее, петон

+1

Как я понял, скрипт не работает, если включена двухфакторная аутентификация

раскрыть ветку 3
0

Да(

Не знал о ее существовании

раскрыть ветку 2
+1

Вечер добрый, хочу повторить на своей переписке, но не могу разобраться как это запустить. Установил Питон и все необходимые модули (с этим тоже долго разбирался, устанавливал через pip), а когда пытаюсь из командной строки с помощью команды .\python setup.py запустить, он мне выдаёт: ".\python : Имя ".\python" не распознано как имя командлета, функции, файла сценария или выполняемой программы. Проверьт

е правильность написания имени, а также наличие и правильность пути, после чего повторите попытку.

строка:1 знак:1

+ .\python setup.py

+ ~~~~~~~~

+ CategoryInfo : ObjectNotFound: (.\python:String) [], CommandNotFoundException

+ FullyQualifiedErrorId : CommandNotFoundException"

А если двойным кликом, то загружается командная строка питона где я не могу вводить текст
Как быть? :(

раскрыть ветку 6
0
Так пиши просто python setup.py
раскрыть ветку 2
0

Python неправильно установился, или скорее всего недоустановился. Погугли, как добавить Python в PATH, должно помочь

раскрыть ветку 2
0

а я что то не понял, в чем проблема, библиотеки и тд и тп все поставил..)

Иллюстрация к комментарию
раскрыть ветку 9
0

wordcloud не установился

Попробуйте через pip install wordcloud

Или так, как описано в этой ветке: #comment_134558040

раскрыть ветку 8
0

что такое «матем»?

0
А можно сделать некую прогу под ведро?
0

Здравствуй. Извини, не программист, поэтому очень сложно понять некоторые моменты.

Что значит Install requirements.txt? Установить то, что там перечислено, или установить файл? Вообще не понимаю этого пункта.

На команду python main.py выдаёт это:

Иллюстрация к комментарию
раскрыть ветку 15
+1

Установить файл можно командой "pip install -r requirements.txt"

Эту, и команду "python main.py" нужно вводить в командную строку, не ту, что на скрине. Нужная командная строка вызывается через Shift+Правая клавиша мыши на папку -> PowerShell

раскрыть ветку 13
-1

Подожду ответа, так выскакивает то же самое

0

Привет)
Выскакивает вот такая ошибка:

Иллюстрация к комментарию
раскрыть ветку 8
+1

В 3.6 питоне должно работать без out of memory. Буду смотреть почему такая проблема с 3.7

раскрыть ветку 1
0

Ласка, правда? :D

Пишет, что памяти нема. Странная ошибка

раскрыть ветку 3
0

После distplot_messages_per_day выскакивает?

раскрыть ветку 1
0

Не совсем понятно как вывел облако популярных слов, как понимаю, в выгрузке они все зашифрованы

раскрыть ветку 3
0

Не знаю о какой шифрации идет речь, у меня с этим проблем не было.

раскрыть ветку 2
0

студент что-ли?

раскрыть ветку 13
+22

Ага, третий курс

раскрыть ветку 12