Недавно передо мной возникла задачи очистить файлы и каталоги моего отца. Что делало задачу сложной, так это ненормальное количество файлов-дубликатов с некорректными именами. Поддерживая резервную копию на внешнем диске, одновременно редактируя множество версий одного и того же файла, или даже меняя структуру каталогов, один и тот же файл копируется много раз, меняет имена, изменяет места расположения и просто засоряет дисковое пространство. Охотиться за каждым отдельным файлом может стать проблемой гигантских масштабов. К счастью существует маленькая программка, которая может сохранить ваши драгоценный часты поиска и удаления дубликатов файлов на вашей системе: dupeGuru. Написанная на Python, эта программа по поиску дубликатов файлов перешла на лицензию GPLv3 несколько часов назад. Поэтому начнём новый год с очистки системы!
Установка dupeGuru
На Ubuntu вы можете добавить Hardcoded Software PPA:
$ sudo apt-add-repository ppa:hsoft/ppa $ sudo apt-get update
А затем установить её:
$ sudo apt-get install dupeguru-se
На Arch Linux пакет представлен в AUR.
Если вы предпочитаете самостоятельно компилировать, источники на GitHub.
Базовое использование dupeGuru
DupeGuru задуман быть быстрым и безопасным. Это означает, что программа не будер берсеркером на вашей системе. Очень невелик риск удаления чего-то, что вы не собирались удалить. Тем не менее, мы ведь говорим об удалении файлов, поэтому оставайтесь всегда бдительным и осторожным: всегда необходимо хорошее резервное копирование.
После того, как вы приняли ваши меры предосторожности, мы можем запустить dupeGuru командой:
$ dupeguru_se
Вас должно поприветствовать вот такое окно, где вы можете выбрать каталоги для сканирования дубликатов.
После того, как вы выбрали ваши каталоги и запустили сканирование, dupeGuru покажет результаты, сгруппировав вместе в списке дубликаты файлов.
Обратите внимание, что по умолчанию dupeGuru ищет совпадения файлов основываясь на их содержании, а не на их именах. Для уверенности, что вы не удалите случайно что-нибудь важное, колонка соответствия показывает вам точность алгоритма соответствия. Отсюда вы можете выбрать дубликаты файлов к которым вы хотите применить действие и кликните кнопку «Действие» для просмотра доступных действий.
Выбор действий достаточно обширен. Кратко говоря, вы можете удалить дубликаты, переместить их в другой каталог, проигнорировать их, открыть их, переименовать их или даже вызвать пользовательскую команду на них. Если вы выбрали удалить дубликат, вы можете быть приятно удивлены, как и я, доступными опциями удаления.
Вы можете не только отправить дубликаты файлов в корзину или удалить их навсегда, но вы также можете выбрать оставить ссылку на оригинальный файл (хоть символическую, хоть жёсткую). Другими словами, дубликаты будут стёрты, а вместо оригиналов останется ссылка, сохранив много дискового пространства. Это может быть отчасти полезно, если вы импортировали эти файлы в рабочей области или имеете зависимости, основанные на них.
Другая модная опция: вы можете экспортировать результаты в файлы HTML или CSV. Не совсем уверен, для чего бы это можно было сделать, но я подозреваю, что это может быть полезным, если вы предпочитаете следить за дубликатами, а не применять к ним какие-либо действия dupeGuru.
Наконец, последнее, но не менее важное, меню настроек сделает реальностью все ваши мечты о переборах дубликатов.
Здесь вы можете выбрать критерий для проверки, или основанный на содержании, или основанный на имени и порог для признания файлов дубликатами. Также возможно определить пользовательскую команду, которую вы можете выбрать в действиях. Среди мириад других маленьких опций, неплохо будет заметить, что по умолчанию dupeGuru игнорирует файлы размер которых меньше, чем 10KB.
Для дополнительной информации я предлагаю вам проверить официальный веб-сайт, который заполнен документацией, форумом поддержки и другими плюшками.
Подытожим, dupeGuru это та программа, в которой я буду обращаться каждый раз, когда мне нужно подготовить бэкап или освободить место. Я нашёл её достаточно мощной для продвинутых пользователей и в то же время интуитивной для использования новичками. Вишенка на торт: dupeGuru является кросс-платформенной, что означает, что вы также можете использовать её на Mac или Windows PC. Под специфичные нужды, если вы хотите почистить музыку или файлы изображений, есть два вариации: dupeguru-me и dupeguru-pe, которые, соответственно, ищут дубликаты аудио треков и картинок. Главное их отличие от обычной версии — они выходят за пределы файлового формата и принимают во внимание специфичные медийные метаданные, вроде качества и битрейта.
$ sudo apt-get install dupeguru-me # (установка версии для поиска музыки) $ sudo apt-get install dupeguru-pe # (установка версии для поиска картинок) $ dupeguru_me # (запуск версии для поиска музыки) $ dupeguru_pe # (запуск версии для поиска картинок)
Что вы думаете по поводу dupeGuru? Собираетесь ли вы использовать её? Или у вас есть своя альтернатива, которую вы могли бы предложить? Расскажите об этом в комментариях.
Связанные статьи:
- Какие есть полезные инструменты с интерфейсом командной строки для системных администраторов Linux (50%)
- Как в Linux подключить новый диск, разметить и отформатировать разделы (50%)
- Какие файлы можно удалить при нехватке места на диске Linux (50%)
- Диск Windows монтируется только для чтения (РЕШЕНО) (50%)
- Как смонтировать сетевую папку Windows/Samba в Linux (50%)
- Как пользоваться lsof для просмотра открытых файлов (в Linux всё является файлами) (RANDOM - 34.5%)