Так сложилось, что моя дипломная работа была связана со словарями синонимами, а потому мне пришлось произвести небольшой анализ существующих ресурсов. И чтобы результаты не пылились, я расскажу, почему же до сих пор не сделали адекватный ресурс и доколе мы будем страдать.
Изначально существование синонимов обусловлено необходимостью решения двух речевых проблем: уменьшения повторов, которые считаются стилистическим недостатком текста, и подбора наиболее точного слова к конкретной ситуации. Конечно, существует изрядное множество самых разнообразных сборников синонимичных рядов, на, так сказать, любой вкус и цвет. Только... вы задумывались, как их составляли? А я сейчас расскажу примерную схему работы! Берётся, значит, текст, из него собирается какой-нибудь синонимичный ряд. Например, "дерево-дуб-берёза". Пока всё нормально. Теперь берём другой текст, с помощью которого оный синонимичный ряд дополняется, корректируется, и у нас получется, допустим, "дерево-дуб-берёза-доска-балка". Тоже ничего смертельного. Такая процедура повторяется ещё определённое количество раз.
Теперь следите внимательно за мыслью.
Уверена, хотя бы раз где-нибудь когда-нибудь вам приходилось слышать о такой фразе, как "туп как дерево" и аналогичных вариациях с другими представителями фауны. Таким образом, в определённом контексте слово "дерево" будет связано с умественно недалёким человеком, и синонимичный ряд пополнится словом "тупой", "дурак" и т.д. Чуете, куда я клоню? Знаете, я очень долго смеялась, когда один из онлайн-ресурсов в первых четырёх вариантах синонимов к слову "дерево" выдал мне "дурак", "козёл", "идиот" и "дура". Только потом пошло что-то адекватное.
Громче я только орала, когда обрабатывала честно утянутый с просторов интернета словарь синонимов и увидела синонимы к слову "двойка". Даю вам пару мгновений подумать, что же могло пойти не так.
Двойка-цифра-баранка-дуэт-плохо-два-лодка-пара-неудовлетворительно-банан-лебедь-цифра-козёл-гусь-двувеселка-неуд.
Большая часть синонимов логична, однако что тут делает лодка, банан, лебедь, козёл и гусь – это вопросы, на которые я предлагаю порассуждать в комментариях.
А какое веселье творится во всех поголовно словарях синонимов, если вогнать туда местоимения! Кстати, корректнее называть местоимения контекстными синонимами, значение которых меняется от, вау, контекста. Но существующие словари только смеются над этим и выдают такую дичь.
Предлагаю всем дружно подумать в комментариях, почему рядом с "дьяволом" не стоит "бог", ведь именно "бога" чаще всего в текстах упоминают как "он" с особенной, религиозной интонацией. А о том, что здесь делает спирт, думаю, ясно всем.
Чтобы был понятен масштаб трагедии, ресурсов для подбора контекстных синонимов, нет. Точнее, существует сайт, который я делала для диплома, но он сыр, недоделан и требует многих корректировок, поэтому нет, я его не покажу. Зато я вам продемонстрирую, почему не стоит пользоваться ресурсами, которые повышают уникальность текста, автоматически заменяя слова на синонимы (некоторые утверждают, что они ещё и контекстные, ага).
Для примера мы рассмотрим как художественный, так и научный тексты. Все ссылки на ресурсы я приведу в первом комментарии к посту.
Владимир Дубровский воспитывался в Кадетском корпусе и выпущен был корнетом в гвардию; отец не щадил ничего для приличного его содержания, и молодой человек получал из дому более, нежели должен был ожидать.
Пушкин А.С. "Дубровский"
Textorobot – синонимайзер
Владимир Дубровский воспитывался в Кадетском корпусе и выпущен был корнетом в гвардию; отец не щадил ничего для
солидного его содержания, и
юноша получал из дому более,
ежели был должен ждать.
Rustxt – синонимайзер
Владеть миром Дубровский
прививался в Кадетском корпусе и выпущен был корнетом в гвардию;
родитель далеко не миловал прилично для приличного его содержания, и молодой человек
зарабатывал из дому более,
ежели вынужден был ожидать.
Онлайн – синонимайзер
Владимир Дубровский воспитывался в Кадетском корпусе и выпущен был корнетом в гвардию;
основатель не щадил ничего для
интеллигентного его содержания, и
молоденький человек получал из
жилищу больше, ежели обязан был
ждать.
Синонимайзер текстов
Владимир Дубровский воспитывался в Кадетском корпусе и
отпущен был корнетом в гвардию;
основоположник не щадил ничего для приличного его содержания, и
парень получал из дому более,
чем те был должен ожидать.Потоки – это отдельные выполняемые последовательности команд в рамках одного процесса. Создание потока или переключение контекста выполняется приблизительно в 10 раз быстрее, чем аналогичные действия с процессами.
«Тюнинг веб-сервер» П. Киллелиа
Textorobot – синонимайзер
Потоки – это
некоторые выполняемые последовательности команд в рамках
1-го процесса. Создание потока либо переключение контекста
производится примерно в 10 раз резвее, чем подобные
деяния с
действиями.Rustxt – синонимайзер
Потоки – это отдельные
производимые очередности установок в рамках одного процесса. Создание потока или переключение контекста
проделывается предположительно в 10
два – и обчелся быстрее, чем аналогичные
воздействия с процессами.
Онлайн – синонимайзер Синонимайзер текстов
Струи – это отдельные
производимые очередности команд в рамках
1-го процесса. Создание
струи или же переключение контекста
производится ориентировочно в 10
один скорее, чем
подобные воздействия с процессами.
Синонимайзер текстов
Ручьи – это отдельные выполняемые
очередности порядка команд в рамках одного
хода развития дела. Создание
течения или переключение контекста
производится ориентировочно в 10 раз быстрее, чем аналогичные
воздействия с процессами.
Как видите,
очень плохая идея -- загонять в подобные программы научные тексты.
Какой же можно сделать вывод на основе всего этого? А такой, что компьютерной лингвистике (а именно данная сфера занимается разработками в направлении взаимодействия естественного языка с компьютерными системами) уделяется крайне мало внимания. Что, в общем-то, неудивительно, тема довольно специфичная, не всем интересная и не всем ясная в том, а зачем, собственно, копать в этом направлении. А потом смеёмся и записываем видосики с Алисой, которая выдаёт упоротые ответы, негодуем, взаимодействуя с чат-ботами, которые не в состоянии понять, что хочет от него пользователь, и всё гадаем, когда же изобретут настоящий искусственный интеллект. Только ведь без возможности адекватно работать с полиморфизмом слов не получится нормально реализовать диалог между машиной и человеком. Так что "мем смешной, а ситуация страшная".
Всем спасибо за внимание :D