|
|
#1 (permalink) |
|
Der Erlöser
|
Hallo zusammen,
ich habe zurzeit ein kleines Problem. Und zwar hat ein Kollege auf seiner Festplatte ca. 50.000 mp3-Dateien. Er bat mich nun, ob ich helfen könnte, dass die Duplikate gelöscht werden können. Ich dachte, ich kann das für ihn übernehmen und habe nun versucht, mit Tools (The GodFather, Audio DeDupe) die Duplikate ausfindig zu machen. Allerdings scheint dies nicht ganz trivial zu sein. Denn die Geschwindigkeit der Tools lässt zu wünschen übrig. Kurz: Bei dem Tempo, das die Tools vorlegen, kann ich das Wochen laufen lassen, bis ein Durchlauf fertig ist. Kennt jemand ein gutes Programm, das auch mit großen Sammlungen fertig wird? - Nett sein kostet nichts und tut jedem gut - - besser spät als gar nicht - - Signatur ohne Werbung - - Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
|
|
|
|
| Gesponsorte Links |
|
|
#3 (permalink) |
|
Der Erlöser
|
Ich nutze kein iTunes (Apple ->
)Ich habe eine alternative (Jajuk). Auch dort gibt es sowas. Allerdings taugt dies garnichts. Zumindest in Jajuk findet nur ein Namensvergleich statt, der garnichts bringt. Ich bezweifle, dass iTunes das besser macht, lass mich gerne aber eines besseren belehren. - Nett sein kostet nichts und tut jedem gut - - besser spät als gar nicht - - Signatur ohne Werbung - - Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
|
|
|
|
|
#4 (permalink) |
|
Erfahrener Benutzer
Reg: 14.10.2007
Beiträge: 666
![]() ![]() ![]() |
Hallo
Ich würde das Unter Linux mit der bash, oder per python lösen, unter win dürften die meisten c bevorzugen. Also en kleines Progarmm in den obigen Sprachen sllte das Problem lösen. Wäre jetzt nur zu klären, was und wie du Duplikate finden willst ? per mp3tags per Dateiname per Länge alles eigentlich unzureichend, bei einrr großen Menge und mit vielen doppelten Dateien. |
|
|
|
|
|
#5 (permalink) | |
|
Kaffeejunkie
|
Das Problem ist wohl, daß MP3's verschiedene "Qualitäten" haben und diese Vergleichsprogramme alle MP3's auf eine "Standartqualität" umrechnen müssen um diese überhaupt vergleichen zu können und das dauert eben.
Zitat:
Über anonyme
rege ich mich nicht mehr auf |
|
|
|
|
|
|
#7 (permalink) |
|
Der Erlöser
|
Naja, Hash-Vergleich ist ja nur eine Sache.
Dann gibts noch Lieder, die wohl in unterschiedlichen Bitraten gespeichert sind (aber Dateinamen nicht 100% identisch), wovon natürlich nur die höhere Qualität behalten werden soll. Im Prinzip kann das ja "The GodFather". Aber das Programm ist abartig langsam. Vielleicht verlange ich auch zuviel?! - Nett sein kostet nichts und tut jedem gut - - besser spät als gar nicht - - Signatur ohne Werbung - - Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
|
|
|
|
|
#8 (permalink) | ||
|
Kaffeejunkie
|
Zitat:
Zitat:
Über anonyme
rege ich mich nicht mehr auf |
||
|
|
|
|
|
#9 (permalink) |
|
Der Erlöser
|
Core2Duo E6750 2,66GHz und 4 GB Ram.
- Nett sein kostet nichts und tut jedem gut - - besser spät als gar nicht - - Signatur ohne Werbung - - Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
|
|
|
|
|
#11 (permalink) | |
|
abgemeldet
Reg: 01.05.2006
Beiträge: 32.944
![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() |
Zitat:
Jede Picosekunde wäre für einen Hashvergleich entscheidend. Wenn nun auch noch unterschiedliche Bitraten oder im worstcase Datein mit variablen Bitraten pro Sek. dabei sind, solltest du froh sein, wenn das überhaupt ein Programm auch nur im Ansatz löst. |
|
|
|
|
|
|
#12 (permalink) |
|
bekämpft die Mächte des Bösen
|
Naja einfach:
Erst alle Dateien hashen, dann nach Hash sortieren. Bei mehreren Dateien mit gleichem Hash: alle bis auf eine löschen. Aufwand: O(n) zum Hashen + O(n log n) zum Sortieren + O(n) zum Vergleichen und Löschen = O(n log n) gesamt Die obige Variante, irgendwie alle Dateien "normieren" und "vergleichen" zu wollen, hört sich für mich stark nach O(n²) an, was die Laufzeit erklärt. |
|
|
|
![]() |
| Gesponsorte Links |
| Anzeige |
| Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1) | |
| Themen-Optionen | |
| Ansicht | |
|
|
Ähnliche Themen
|
||||
| Thema | Autor | Forum | Antworten | Letzter Beitrag |
| bugs finden | Xindo | Scripts & Software | 1 | 17.03.2008 15:27:17 |
| Filmgroßhandel finden | Liquid0815 | Gott und die Welt | 9 | 22.11.2007 14:07:27 |
| Seitenbesitzer finden | zickenpower | News & Infos | 3 | 22.05.2007 11:14:10 |
| Duplikate finden und automaisch löschen | towercrew69 | Software/Windows | 6 | 20.03.2007 21:40:14 |
| Fehler im CSS finden | decision | Lose4Graphics | 7 | 18.07.2006 10:23:02 |