zaLinux.ru

Как найти дубликаты файлов на Linux с помощью dupeGuru


Недавно передо мной возникла задачи очистить файлы и каталоги моего отца. Что делало задачу сложной, так это ненормальное количество файлов-дубликатов с некорректными именами. Поддерживая резервную копию на внешнем диске, одновременно редактируя множество версий одного и того же файла, или даже меняя структуру каталогов, один и тот же файл копируется много раз, меняет имена, изменяет места расположения и просто засоряет дисковое пространство. Охотиться за каждым отдельным файлом может стать проблемой гигантских масштабов. К счастью существует маленькая программка, которая может сохранить ваши драгоценный часты поиска и удаления дубликатов файлов на вашей системе: dupeGuru. Написанная на Python, эта программа по поиску дубликатов файлов перешла на лицензию GPLv3 несколько часов назад. Поэтому начнём новый год с очистки системы!

Установка dupeGuru

На Ubuntu вы можете добавить Hardcoded Software PPA:

$ sudo apt-add-repository ppa:hsoft/ppa
$ sudo apt-get update

А затем установить её:

$ sudo apt-get install dupeguru-se

На Arch Linux пакет представлен в AUR.

Если вы предпочитаете самостоятельно компилировать, источники на GitHub.

Базовое использование dupeGuru

DupeGuru задуман быть быстрым и безопасным. Это означает, что программа не будер берсеркером на вашей системе. Очень невелик риск удаления чего-то, что вы не собирались удалить. Тем не менее, мы ведь говорим об удалении файлов, поэтому оставайтесь всегда бдительным и осторожным: всегда необходимо хорошее резервное копирование.

После того, как вы приняли ваши меры предосторожности, мы можем запустить dupeGuru командой:

$ dupeguru_se

Вас должно поприветствовать вот такое окно, где вы можете выбрать каталоги для сканирования дубликатов.

01

После того, как вы выбрали ваши каталоги и запустили сканирование, dupeGuru покажет результаты, сгруппировав вместе в списке дубликаты файлов.

02

Обратите внимание, что по умолчанию dupeGuru ищет совпадения файлов основываясь на их содержании, а не на их именах. Для уверенности, что вы не удалите случайно что-нибудь важное, колонка соответствия показывает вам точность алгоритма соответствия. Отсюда вы можете выбрать дубликаты файлов к которым вы хотите применить действие и кликните кнопку «Действие» для просмотра доступных действий.

03


Выбор действий достаточно обширен. Кратко говоря, вы можете удалить дубликаты, переместить их в другой каталог, проигнорировать их, открыть их, переименовать их или даже вызвать пользовательскую команду на них. Если вы выбрали удалить дубликат, вы можете быть приятно удивлены, как и я, доступными опциями удаления.

04

Вы можете не только отправить дубликаты файлов в корзину или удалить их навсегда, но вы также можете выбрать оставить ссылку на оригинальный файл (хоть символическую, хоть жёсткую). Другими словами, дубликаты будут стёрты, а вместо оригиналов останется ссылка, сохранив много дискового пространства. Это может быть отчасти полезно, если вы импортировали эти файлы в рабочей области или имеете зависимости, основанные на них.

Другая модная опция: вы можете экспортировать результаты в файлы HTML или CSV. Не совсем уверен, для чего бы это можно было сделать, но я подозреваю, что это может быть полезным, если вы предпочитаете следить за дубликатами, а не применять к ним какие-либо действия dupeGuru.

Наконец, последнее, но не менее важное, меню настроек сделает реальностью все ваши мечты о переборах дубликатов.

05

Здесь вы можете выбрать критерий для проверки, или основанный на содержании, или основанный на имени и порог для признания файлов дубликатами. Также возможно определить пользовательскую команду, которую вы можете выбрать в действиях. Среди мириад других маленьких опций, неплохо будет заметить, что по умолчанию dupeGuru игнорирует файлы размер которых меньше, чем 10KB.


Для дополнительной информации я предлагаю вам проверить официальный веб-сайт, который заполнен документацией, форумом поддержки и другими плюшками.

Подытожим, dupeGuru это та программа, в которой я буду обращаться каждый раз, когда мне нужно подготовить бэкап или освободить место. Я нашёл её достаточно мощной для продвинутых пользователей и в то же время интуитивной для использования новичками. Вишенка на торт: dupeGuru является кросс-платформенной, что означает, что вы также можете использовать её на Mac или Windows PC. Под специфичные нужды, если вы хотите почистить музыку или файлы изображений, есть два вариации: dupeguru-me и dupeguru-pe, которые, соответственно, ищут дубликаты аудио треков и картинок. Главное их отличие от обычной версии — они выходят за пределы файлового формата и принимают во внимание специфичные медийные метаданные, вроде качества и битрейта.

$ sudo apt-get install dupeguru-me # (установка версии для поиска музыки)
$ sudo apt-get install dupeguru-pe # (установка версии для поиска картинок)

$ dupeguru_me # (запуск версии для поиска музыки)
$ dupeguru_pe # (запуск версии для поиска картинок)

Что вы думаете по поводу dupeGuru? Собираетесь ли вы использовать её? Или у вас есть своя альтернатива, которую вы могли бы предложить? Расскажите об этом в комментариях.


Рекомендуемые статьи:

Оставить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *