Содержание
Удаление повторяющихся строк
Задача. Есть текстовый список разбитый по строкам. В списке присутствуют некоторые дубли строк. Необходимо удалить дубликаты строк из списка.
.tg td, .tg th {text-align: center;vertical-align:center;}
Есть | Должно получиться |
---|---|
строка1 строка2 строка4 строка3 строка4 строка1 строка5 |
строка1 строка2 строка4 строка3 строка5 |
Сделать операцию по удалению дублей можно несколькими способами, предварительно вставив список в программу в которой будем работать.
Удалить дубликаты в Microsoft Excel
Удаление дубликатов в Microsoft Excel:
- Выделяем список (столбец)
- Переходим во вкладку Date (Данные), нажимаем команду Remove Duplicates (Удалить дубликаты)
- В открывшемся диалоговом окне «Remove Duplicates» (Удалить дубликаты) снимаем флажок My data has headers (Мои данные содержат заголовки)
- Нажимаем OK. Все повторяющиеся строки будут удалены, кроме первой (оригинала).
Фильтровать дубликаты в LibreOffice
- Выделяем нужные ячейки (столбец целиком);
- Открываем меню Date (Данные);
- «Ещё фильтры»;
- «Стандартный фильтр…»;
- В открывшемся диалоговом окне в поле «Имя поля» выбираем необходимый столбец;
- В поле «Условие» устанавливаем знак равно «=»;
- В поле «Значение» указываем «Не пусто»;
- Внизу в разделе «Параметры» обязательно отмечаем флажок «Без повторений» ;
- Жмем OK. В столбце останутся только единичные экземпляры и можно их скопировать.
Google-Таблицы
Google Таблицы не имеют встроенных функций удаления дублей, поэтому можно использовать установить дополнение «Remove Duplicates». Установить это расширение можно бесплатно.
После установки расширения заходим в Гугл-таблицу:
- Выделяем столбец (строки) где нужно почистить от дублей;
- нажимаем в меню «Дополнения»;
- Remove Duplicates (Удалить дубликаты);
- Find duplicates or uniques rows (Найти дубликаты или уникальные);
- В открывшемся окне на 1-м шаге нажимаем «Next»;
- Во 2-ом шаге выбираем «Duplicates» и далее;
- Пропускаем 3-й шаг далее;
- И на 4-ом шаге выбираем, что делать с найденными дублями: перенести (Move), копировать (Copy) в другое место, очистить (Clear) или удалить (Delete). Выбираем «Delete rows within selection» (Удалить выделенные строки);
- Всё, готово.
NotePad++
Для удаления ненужных дублей строк в NotePad++ необходимо установить плагин TextFX если не установлен.
Удаление повторяющихся строк:
- Переходим в документ со списком и выделяем (Ctrl+A);
- нажимаем в меню TextFX;
- TextFX Tools;
- проверяем отмечена ли функция Sort outputs only UNIQUE lines (Сортировать вывод только по УНИКАЛЬНЫМ строкам);
- если да, то сразу выбираем Sort lines case insensitive (Сортировка строк без учета регистра).
Удаление дублей онлайн
Для удаления повторяющихся строк (например, это может быть список ключевых слов из KeyCollector, Excel, NotePad и пр.) можно воспользоваться онлайн инструментом удаления дубликатов «Сервис удаления дублей строк».
Удаление дублей строк вместе с оригиналами
Дубликаты с оригиналом в Microsoft Excel
Данная задача выполняется чуть сложнее чем в случае выше. Суть заключается в том, что нужно выделить дубли строк другим цветом, а потом отсортировать по цвету и удалить одинаковые строки.
- Выделяем диапазон строк (столбец) ➤ Условное форматирование ➤ Правила выделения ячеек ➤ Повторяющиеся значение ➤ в диалоговом окне нажимаем OK.
- Выделяем диапазон строк (или столбец) ➤ Сортировка и фильтр ➤ Фильтр. В первой строке появится квадратик контекстного меню.
- Нажимаем ЛКМ на появившийся квадратик в первой строке ➤ Фильтр по цвету ➤ фильтруем по цвету ячейки.
- В таблице остались только одинаковые строки, выделяем все строки ➤ правой кнопкой мыши вызываем контекстное меню в области над номерами строк ➤ Удалить строку.
Изображение ниже поможет сориентироваться в действиях.
Программа удаления строк-дублей bvsDupDelet
Программу bvsDupDelet нашел на форуме forum.antichat.ru. Она быстро удаляет дубли строк. В настройках нужно выбрать Unique, чтобы удалить повторяющиеся строки вместе с их оригиналом. В Input необходимо выбрать txt файл редактируемого списка, а в Output — папку куда будет сохранен новый документ.