Fichiers en double

zags

Membre actif
29 Avril 2010
307
15
Sud-Est
Bonjour,

J'ai rassemblé sur mon MacBook Pro quelques milliers de fichiers perso (si si) provenants d'environ 20 disques durs (si si) que j'ai utilisé ces dernières années (pfiou).

Je sais qu'il y a PLEIN de doublons.

Existerait-il une application qui :
- serait gratuite de préférence (... ou pas chère)
- ferait une méga-recherche de tous les fichiers de "Documents" dans d'inombrables sous-dossiers
- m'afficherait une liste de fichiers soupçonnés comme doublons (précisément le même nom, même type, même nombre d'octets)
- et me permettrait de, manuellement, décider (ou non) d'effacer les fichiers de mon choix


Je soupçonne qu'une telle application m'indiquerait plusieurs dizaines de fichiers doublons (dont certains seraient même présents 8 fois).

Bref ça me simplifierait pas mal la vie :-)

Merci

Stéphane
 
Je ne peux pas te donner de nom, j'ai un peu la mémoire qui flanche, mais je sais que ça existe sous Mac OS.

EDIT : à noter qu'avec Google, "Mac recherche doublons" semble renvoyer plus de résultats que ce à quoi je m'attendais. :siffle:
 
Bonjour,

Je suis en train de tester un utilitaire (gratuit) qui s'appelle Magican (lu u article dans le dernier n° de VVM) qui permet de trouver et éradiquer les doublons :

capturedcran20111228145.png
 
D'un autre côté ça ne me parait pas "insurmontable" à programmer (.... je ne suis pas développeur).

Il "suffit juste" qu'une ptite appli créé un tableau avec :
- nom du fichier
- emplacement
- date de création
- dernière date de modification
- type
- nombre d'octets

Et de classer la liste selon les deux derniers paramètres.


* Les fichiers étant à la fois du même type et pile de la même taille sont soupçonnés d'être des doublons (l'application les surligne en orange).

* Les fichiers étant de même type, exactement de même taille, de même nom, de même date de création, de même "dernière date de modification" sont indiqués en doublons (surligné en rouge, et en tête de liste)


Devant chaque ligne présentée (rouge et orange), la possibilité de "cocher" et un bouton pour "supprimer le fichier".


Je ne suis pas développeur (dommâge), mais je pense pas que ce soit impossible. Quelqu'un se porte volontaire ? :D
 
Ca me semble être une piste intéressante ... merci de nous tenir au courant :-)

Je vais l'essayer également. Tu es certain qu'il recherche les doublons des fichiers (photos, mp3, ...)?

Alors j'ai fait ce soir un essai rapide sur la recherche de doublons.
Il n'a pas cherché dans mes fichiers iPhotoLibrary ou Aprture Library. Mais il m'a trouvé des images en doublon (sur la base du nom, probablement) dès lors qu'elles n'étaient pas "encapsulées" dans une library.
Il a bien cherché mes fichiers musicaux en double, dans ma bibliothèque iTunes. Je n'ai pas trouvé d'erreur dans tous mes fichiers musicaux (mais je n'ai pas tout regardé non plus).

Par contre, en regardant les fichiers considérés comme doublons j'ai vu ça :

capturedcran20120102202.jpg



Le logiciel a donc considéré qu'il s'agissait du même fichier :eek:, alors que les noms sont différents… Je n'ai pas comparé mes deux fichiers, mais il y a quelques Ko d'écart, j'ai donc dû faire qqs modifications entre les deux versions (v8 et v9).

Bref, avant de cliquer sur le bouton "Remove all" il est impératif de vérifier ce que le logiciel considère comme doublons ;)
 
Alors j'ai fait ce soir un essai rapide sur la recherche de doublons.
Il n'a pas cherché dans mes fichiers iPhotoLibrary ou Aprture Library. Mais il m'a trouvé des images en doublon (sur la base du nom, probablement) dès lors qu'elles n'étaient pas "encapsulées" dans une library.
Il a bien cherché mes fichiers musicaux en double, dans ma bibliothèque iTunes. Je n'ai pas trouvé d'erreur dans tous mes fichiers musicaux (mais je n'ai pas tout regardé non plus).

Par contre, en regardant les fichiers considérés comme doublons j'ai vu ça :

capturedcran20120102202.jpg



Le logiciel a donc considéré qu'il s'agissait du même fichier :eek:, alors que les noms sont différents… Je n'ai pas comparé mes deux fichiers, mais il y a quelques Ko d'écart, j'ai donc dû faire qqs modifications entre les deux versions (v8 et v9).

Bref, avant de cliquer sur le bouton "Remove all" il est impératif de vérifier ce que le logiciel considère comme doublons ;)

OK, merci de ce dévouement et de cet essai.
Ce logiciel n'est pas fait pour moi car j'ai beaucoup de cas similaires.

certains de mes fichiers ont exactement le même nom, la même date de création, mais pas le même nombre d'octect : donc fichiers différents à ne surtout pas effacer.


Et via automator , on ne pourrait pas faire quelque chose de similaire ?

Ou alors, rechercher "tous les fichiers" de "Documents" et les classer par taille (et se farcir la liste un à un :( ) .... Y a t il une possibilité d'afficher la taille en "octet" pour la totalité de la liste ?
Y a t il une possibilité d'extraire la liste et de l'envoyer dans un tableau excel ? ;-)
 
A moins qu'en allant dans le terminal .....

Une petite ligne de commande à base de ls avec recursive etc ....

je m'en vais aller voir cette piste, il ya souvent des miracles de ce côté là ... :-)
 
OK, merci de ce dévouement et de cet essai.
Ce logiciel n'est pas fait pour moi car j'ai beaucoup de cas similaires.
Disons que je conçois ce logiciel (enfin, cette partie spécifique de Magican, qui fait quand même bcp d'autres choses) comme une aide à la recherche de doublons : charge ensuite à l'utilisateur de vérifier…

De toute façon, je n'aime pas trop les trucs tout auto : je préfère vérifier par mi même. L'intelligence artificielle c'est bien, mais point trop n'en faut :D
 
D'un autre côté ça ne me parait pas "insurmontable" à programmer (.... je ne suis pas développeur).

Il "suffit juste" qu'une ptite appli créé un tableau avec :
- nom du fichier
- emplacement
- date de création
- dernière date de modification
- type
- nombre d'octets

Et de classer la liste selon les deux derniers paramètres.


* Les fichiers étant à la fois du même type et pile de la même taille sont soupçonnés d'être des doublons (l'application les surligne en orange).

* Les fichiers étant de même type, exactement de même taille, de même nom, de même date de création, de même "dernière date de modification" sont indiqués en doublons (surligné en rouge, et en tête de liste)


Devant chaque ligne présentée (rouge et orange), la possibilité de "cocher" et un bouton pour "supprimer le fichier".


Je ne suis pas développeur (dommâge), mais je pense pas que ce soit impossible. Quelqu'un se porte volontaire ? :D

Même nom et même taille ne signifie pas doublon...

Un doublon est un fichier qui fait la même taille et qui possède le même checksum (par exemple CRC, MD5...), là ça commence à ressembler à quelque chose de probant (quelque soit son nom, extension...)

Bref des outils faisant ça, il en existe plein mais je n'en connais aucun gratuit.

J'ai trouvé ça, je n'ai pas testé: http://mac.softpedia.com/get/System-Utilities/Duplicate-Files-Searcher.shtml

Après il y a des outils spécifiques pour les doublons de fichiers audio ou images qui traque les "doublons" même si le format est différent. Mais on sort du sujet là...
 
Même nom et même taille ne signifie pas doublon...

Même nom, même type, même taille (octet), même date de création, même date de derniere modification, ..... c'est possible que ça ne soit pas un doublons ?


Un doublon est un fichier qui fait la même taille et qui possède le même checksum (par exemple CRC, MD5...), là ça commence à ressembler à quelque chose de probant (quelque soit son nom, extension...)

C'est pas faux.


Bref des outils faisant ça, il en existe plein mais je n'en connais aucun gratuit.


Du côté de la Console de Mac OS X y a pas ?


Après il y a des outils spécifiques pour les doublons de fichiers audio ou images qui traque les "doublons" même si le format est différent. Mais on sort du sujet là...

tout à fait.
 
J'ai trouvé ! :-)

Enfin presque car ça n'est pas "gratuit".

"Gemini : The Duplicate Finder"

Disponible sur App Store.

Simplement magique ;-)


Interface simple. Performant. Quelques clics pour le fénéant que je suis. Décompose par type. Permet de cocher les fichers à supprimer.

Interface en anglais, mais vraiment très simple de compréhension.
 
Petite note supplémentaire :

* Une recherche dans tout mon dossier "Documents" me sort 38Go de doublons ... apparemment il y en avait bien besoin :D

* l'application sort tous les doublons et les proposent aussi par 'type' : images, films, , musiques, documents, autres, et également "dossier".
Ce dernier sous entend qu'il y aurait des dossier complet qui seraient identiques (ce qui ne m'étonne pas). Mon petit doigt me dit qu'il faut quand même faire gaffe au maniement de ce dernier.
J'aurai donc envie de m'occuper des autres types et d'ignorer ces dossiers. D'autant que pour les autres 'types' il y a automatiquement un aperçu.

---------- Nouveau message ajouté à 18h17 ---------- Le message précédent a été envoyé à 18h09 ----------

A titre d'exemple (par rapport aux dossier complet). Gemini m'indique deux dossiers potentiellement en double :

/Users/XXX/Documents/z-RECUP/backup global/photos pc XXX/9999-CD-YYY/CD_3/Cartes-Postales/

/Users/XXX/Documents/z-RECUP/backup global/photos pc XXX/9999-CD-YYY/CD_4/Cartes-Postales/

A l'intérieur de ces deux dossiers le contenu est différent ! :hein:


C'est le seul soucis qui me saute aux yeux. Tout le reste à l'air vraiment bien fait. :love:

---------- Nouveau message ajouté à 18h20 ---------- Le message précédent a été envoyé à 18h17 ----------

Encore autre chose.
L'application Gemini propose une option "baguette magique" pour sélectionner automatiquement les doublons.

J'étais méfiant quant à l'utilisation de cette baguette magique .... mais ça m'a sélectionner pile ce dont le logiciel était sûr sûr sûr que c'était des doublons. Il indique également une phrase du style "désolé mais les autres fichiers sont trop important pour les sélectionner automatiquement". Bref, il prend pas de risque. :up:
 
  • J’aime
Réactions: FrançoisMacG