Как быстро удалить дублирующиеся строки в CSV, Excel и таблицах Markdown?

Как быстро удалить дублирующиеся строки в CSV, Excel и таблицах Markdown?

Если вы используете CSV, Excel или Markdown таблицы, вы можете столкнуться с дублирующимися строками. Это может произойти, если вы вручную ввели одинаковые данные или импортировали дубликаты из других источников. Какова бы ни была причина, удаление дублирующихся строк — важная часть очистки данных. В этой статье мы расскажем о нескольких способах быстрого удаления дублирующих строк из CSV, Excel и Markdown таблиц.

1. Онлайн-инструмент для таблиц (рекомендуется)

Вы можете использовать онлайн-инструмент под названием "TableConvert" для удаления дублирующих строк. С помощью этого инструмента вы легко сможете проверить и удалить дублирующиеся строки в ваших CSV, Excel и Markdown таблицах. Просто откройте браузер и перейдите по ссылке https://tableconvert.com/excel-to-excel, вставьте или загрузите ваши данные и нажмите кнопку "Deduplicate" в редакторе таблиц. Это быстро и легко. Посмотрите на изображение ниже:

Удаление дублирующихся строк из таблиц CSV, Excel, Markdown

Удаление дублирующихся строк из таблиц CSV, Excel, Markdown

2. Удаление дублирующихся строк в Excel

Удаление дублирующихся строк в Excel очень просто. Сначала откройте файл Excel и выберите столбец, в котором хотите проверить дублирующиеся строки. Затем нажмите на меню "Данные" и выберите "Удалить дубликаты". Excel покажет диалоговое окно, в котором вам нужно выбрать столбцы для удаления дубликатов. Нажмите "ОК", и Excel удалит все дублирующиеся строки.

3. На Linux или Mac вы можете использовать команды uniq и sort для удаления дубликатов.

/tmp ❯ cat test.txt

test 1

test 2

test 3

test 3

test 4

test 1

/tmp ❯ cat test.txt | uniq

test 1

test 2

test 3

test 4

test 1

/tmp ❯ cat test.txt | sort | uniq

test 1

test 2

test 3

test 4

/tmp ❯ cat test.txt | sort -u

test 1

test 2

test 3

test 4