Регулярки это интересно)
Какой будет результат выполнения этого кода?
Варианты:
1
1 1 1 1
1 2 3 4 5 6 7 8 9 10 11
Источник
Ответ на пост «1 из 3»1
Ооооо, священные регулярки, сразу вспомнил ответ на вопрос на СО, который закреплен и помечен как (дальше будет мой корявый перевод)
Заметка подератора
Этот пост закреплен дабы избежать некорректных корректировок. Пост выглядит именно так как он и должен выглядеть - с содержанием нет никаких проблем. Пожалуйста не помечайте его никак, чтобы не привлекать наше внимание.
Собствено вопрос довольно прозаичен: (условно) "как парсить хтмл с помощью регулярок"
а вот и ответ (ух, поехали, время устроить челленж моему английскому)
некоторые части перевода скорее всего неверные, а часть - просто отсылки которые я не знаю, но скорее всего суть вы поймете :D
Невозможно распарсить [X]HTML с помощью регеса. Потому что ХТМЛ не может быть распарсен регексом.Регес - не та тулза, которая может быть использована для корректного парса ХТМЛа. Как я уже отвечал много раз в вопросах хтмл-и-регес, использование регеса не позволит процессить хтмл. Регулярки недостаточно утонченная тулза для понимания конструкций используемых в ХТМЛ. ХТМЛ не "регулярный" язык, тем самым он не может быть запарсен регулярками.. У регулярок нет возможности парсить ХТМЛ в имеющие смысл части. так много раз, но оно так и не дошло до меня. Даже улучшенные нерегулярные регулярные выражения используемые в Perl'e не справятся с этой задачей. Вы никогда не расколете меня. ХТМЛ - язык достаточной сложности, который не может быть распарсен регулярками. Даже Jon Skeet не сможет парсить ХТМЛ регулярками. Каждый раз когда вы пытаетесь распарсить ХТМЛ регулярками нечестивое дитя плачет кровью девственниц и русские хакеры взламывают твое веб приложение. Парсинг ХТМЛа регулярками призывает запятнанные души в мир живых. Хтмл и регулярки настолько же хорошая пара, как и "любовь, брак" и "ритуальное детоубийство". <Центр> больше не справляется, слишком поздно. Насильное использование регулярок и ХТМЛа в концептуальном пространстве расплавит твой разум в жижу. Если ты распарсишь ХТМЛ регексом то ты отдашься Им и их дьявольским путям, которые обрекут всех нас к нечеловеческому труду во имя Его кого невозможно назвать используя обычный человеческий язык, он грядёт. ХТМЛ-плюс-регулярки размозжит нервы разумности пока ты наблюдаешь за ними, твоя психика затухнет под натиском ужаса. Парсерсы-ХТМЛа-основанные-на-регексах это рак, который убивает Stackoverflow слишком поздно слишком поздно нас не спасти трансгрессия ребенка гарантирует что регекс поглотит всех живых существ (кроме ХТМЛ, который он не способен переварить, как говорили ранее) господь помоги нам как мы можем пережить это бедствие использование регекса для парсинга ХТМЛа обрекло на человечество на вечные ужасные пытки и дыры в безопасности использование регекса как тулзы для процессинга ХТМЛа дыру между этим миром и миром ужаса испорченных сущностей (как SGML сущности, только испорченнее) лишь мгновение мира регекс парсеров для ХТМЛА моментально перемещает сознание разработчика в мир нескончаемых криков, он грядет, ядовито-склизская зараза регулярок поглотит твой ХТМЛ парсер, приложение и всё существование вроде Visual Basic только хуже он грядёт он грядёт не борись он грядёт, его нечестивая аура разрушает всё сущее, ХТМЛ теги текут из твоих глаз как жидкость боли, песнь парсинга с помощью регулярных выражений заглушит голоса смертных из сферы я вижу это ты видишь это это прекрасно окончательное гашение лжи человечества ВСЁ ПОТЕРЯНО ВСЁ ПОТЕРЯНО пони он грядёт он грядет гной проникает всё МОЁ ЛИЦО МОЁ ЛИЦО неееЕЕЕттт НЕТ неТ остановить углы не реально ZALGO ЭТО ТОНИ-ПОНИ ОН ГРЯДЁТ
ФУХ, это было тяжело, там дофига опечаток, неточностей перевода, но я старался
ссылка на пост: https://stackoverflow.com/a/1732454
Массовая замена данных в файлах
Все привет, сегодня я вам расскажу про один из 3х способов, как массово заменить / удалить какие-либо ссылки или параметры в текстовых файлах.
Например: есть html файл, в котором нужно заменить все ссылки. Звучит просто? А если ссылок будет 500? Руками заниматься таким геморроем точно желания не будет.
Для WINDOWS пользователей существует отличный текстовый редактор Notepad++
Для пользователей macOS рекомендую редактор ATOM, работу с которым, я подробно описал в блоге.
Приступаем!
Прямая замена:
– Открываем файл, и нажимаем ctrl+F
– В поле Find what вводим то, что нужно заменить
– В поле Raplace with вводим то, на что нужно произвести замену
– Жмем кнопку Replace All
– Проверям и сохраняем файл.
Массовая замена в файлах:
– Жмем ctrl+F
– Вкладка Find in files
– В поле Directory жмем три точки и выбираем категорию с файлами
– Жмем Finde all
– После замены жмем Replace in files
– Сохраняем файлы
Вот и все, мы успешно освободили себе кучу времени и сил.
Но бывают такие ситуации, когда в файле нужно заменить кучу ссылок, которые отличаются доменом, параметром, ютм метками и прочим. Тут нам на помощь приходят регулярные выражения, работу с которыми я очень подробно описал в этой статье.
Надеюсь этот пост кому-то поможет.
Всем спасибо!








