Alt 22.12.2010, 19:36:01   #1 (permalink)
Der Erlöser
Benutzerbild von tobias1985

ID: 37913
Lose-Remote
Reallife

tobias1985 eine Nachricht über ICQ schicken
Reg: 24.04.2006
Beiträge: 3.858
tobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehen
Frage mp3-Duplikate finden

Hallo zusammen,
ich habe zurzeit ein kleines Problem. Und zwar hat ein Kollege auf seiner Festplatte ca. 50.000 mp3-Dateien.
Er bat mich nun, ob ich helfen könnte, dass die Duplikate gelöscht werden können.
Ich dachte, ich kann das für ihn übernehmen und habe nun versucht, mit Tools (The GodFather, Audio DeDupe) die Duplikate ausfindig zu machen.

Allerdings scheint dies nicht ganz trivial zu sein. Denn die Geschwindigkeit der Tools lässt zu wünschen übrig.
Kurz: Bei dem Tempo, das die Tools vorlegen, kann ich das Wochen laufen lassen, bis ein Durchlauf fertig ist.

Kennt jemand ein gutes Programm, das auch mit großen Sammlungen fertig wird?
- Nett sein kostet nichts und tut jedem gut -
- besser spät als gar nicht -
- Signatur ohne Werbung -
- Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
tobias1985 ist offline   Mit Zitat antworten
Gesponsorte Links
Alt 22.12.2010, 20:58:18   #2 (permalink)
Ex-Waldorfschüler
Benutzerbild von Hinicher

ID: 68384
Lose-Remote

Reg: 21.04.2006
Beiträge: 666
Hinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes AnsehenHinicher genießt hohes Ansehen
Standard

Hallo,

so ganz spontan fällt mir ein, dass iTunes einen Funktion in einem Untermenü hat
Datei -> Duplikate anzeigen

...oder hast du das schon mal ausprobiert?

Lg Hinicher

Hinicher ist offline   Mit Zitat antworten
Alt 22.12.2010, 21:11:55   #3 (permalink)
Der Erlöser
Benutzerbild von tobias1985

ID: 37913
Lose-Remote
Reallife

tobias1985 eine Nachricht über ICQ schicken
Reg: 24.04.2006
Beiträge: 3.858
tobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehen
Standard

Ich nutze kein iTunes (Apple -> )
Ich habe eine alternative (Jajuk). Auch dort gibt es sowas.

Allerdings taugt dies garnichts. Zumindest in Jajuk findet nur ein Namensvergleich statt, der garnichts bringt. Ich bezweifle, dass iTunes das besser macht, lass mich gerne aber eines besseren belehren.
- Nett sein kostet nichts und tut jedem gut -
- besser spät als gar nicht -
- Signatur ohne Werbung -
- Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
tobias1985 ist offline Threadstarter   Mit Zitat antworten
Alt 22.12.2010, 21:15:03   #4 (permalink)
Erfahrener Benutzer

Reg: 14.10.2007
Beiträge: 666
papslf58 papslf58 papslf58
Standard Duplikat finden

Hallo


Ich würde das Unter Linux mit der bash, oder per python lösen, unter win dürften die meisten c bevorzugen.
Also en kleines Progarmm in den obigen Sprachen sllte das Problem lösen.

Wäre jetzt nur zu klären, was und wie du Duplikate finden willst ?
per mp3tags
per Dateiname
per Länge

alles eigentlich unzureichend, bei einrr großen Menge und mit vielen doppelten Dateien.
papslf58 ist offline   Mit Zitat antworten
Alt 22.12.2010, 21:18:48   #5 (permalink)
Kaffeejunkie
Benutzerbild von MoonmanXL

ID: 18474
Lose-Remote

Reg: 04.05.2006
Beiträge: 466
MoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer Anblick
Standard

Das Problem ist wohl, daß MP3's verschiedene "Qualitäten" haben und diese Vergleichsprogramme alle MP3's auf eine "Standartqualität" umrechnen müssen um diese überhaupt vergleichen zu können und das dauert eben.
Zitat:
Zitat von Jerzy Jurandot
Hätte ein Bürokrat die Welt erschaffen,wir wären noch nicht bei der Sintflut.
Über anonyme rege ich mich nicht mehr auf
MoonmanXL ist offline   Mit Zitat antworten
Alt 22.12.2010, 21:19:53   #6 (permalink)
bekämpft die Mächte des Bösen
Benutzerbild von theHacker

ID: 69505
Lose-Remote

theHacker eine Nachricht über ICQ schicken theHacker eine Nachricht über AIM schicken theHacker eine Nachricht über MSN schicken theHacker eine Nachricht über Yahoo! schicken theHacker eine Nachricht über Skype™ schicken
Reg: 20.04.2006
Beiträge: 20.471
theHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes Ansehen
Standard

Dateien hashen; das is ne Sache von 5 Minuten - Funktioniert natürlich nur, wenn es wirklich identische Duplikate sind.
theHacker ist offline   Mit Zitat antworten
Alt 22.12.2010, 21:25:56   #7 (permalink)
Der Erlöser
Benutzerbild von tobias1985

ID: 37913
Lose-Remote
Reallife

tobias1985 eine Nachricht über ICQ schicken
Reg: 24.04.2006
Beiträge: 3.858
tobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehen
Standard

Naja, Hash-Vergleich ist ja nur eine Sache.
Dann gibts noch Lieder, die wohl in unterschiedlichen Bitraten gespeichert sind (aber Dateinamen nicht 100% identisch), wovon natürlich nur die höhere Qualität behalten werden soll.

Im Prinzip kann das ja "The GodFather". Aber das Programm ist abartig langsam. Vielleicht verlange ich auch zuviel?!
- Nett sein kostet nichts und tut jedem gut -
- besser spät als gar nicht -
- Signatur ohne Werbung -
- Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
tobias1985 ist offline Threadstarter   Mit Zitat antworten
Alt 22.12.2010, 21:28:57   #8 (permalink)
Kaffeejunkie
Benutzerbild von MoonmanXL

ID: 18474
Lose-Remote

Reg: 04.05.2006
Beiträge: 466
MoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer AnblickMoonmanXL ist ein wunderbarer Anblick
Standard

Zitat:
Zitat von tobias1985 Beitrag anzeigen
Im Prinzip kann das ja "The GodFather". Aber das Programm ist abartig langsam. Vielleicht verlange ich auch zuviel?!
Vielleicht ist Dein Rechner nur zu langsam
Zitat:
Zitat von Jerzy Jurandot
Hätte ein Bürokrat die Welt erschaffen,wir wären noch nicht bei der Sintflut.
Über anonyme rege ich mich nicht mehr auf
MoonmanXL ist offline   Mit Zitat antworten
Alt 22.12.2010, 21:40:58   #9 (permalink)
Der Erlöser
Benutzerbild von tobias1985

ID: 37913
Lose-Remote
Reallife

tobias1985 eine Nachricht über ICQ schicken
Reg: 24.04.2006
Beiträge: 3.858
tobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehentobias1985 genießt hohes Ansehen
Standard

Core2Duo E6750 2,66GHz und 4 GB Ram.
- Nett sein kostet nichts und tut jedem gut -
- besser spät als gar nicht -
- Signatur ohne Werbung -
- Unberechtigte Kritik nehme ich zur Kenntnis, berechtigte Kritik zu Herzen. Es bleibt die Kunst, berechtigte und unberechtigte Kritik zu unterscheiden. -
tobias1985 ist offline Threadstarter   Mit Zitat antworten
Alt 22.12.2010, 21:41:18   #10 (permalink)
zeitw. Abwesend

ID: 375607
Lose-Remote

Reg: 18.12.2009
Beiträge: 3.476
Bounty kann auf vieles stolz seinBounty kann auf vieles stolz seinBounty kann auf vieles stolz seinBounty kann auf vieles stolz seinBounty kann auf vieles stolz seinBounty kann auf vieles stolz seinBounty kann auf vieles stolz seinBounty kann auf vieles stolz seinBounty kann auf vieles stolz sein
Blinzeln

Zitat:
Zitat von theHacker Beitrag anzeigen
Dateien hashen; das is ne Sache von 5 Minuten - Funktioniert natürlich nur, wenn es wirklich identische Duplikate sind.
Dabei ist nur ein Problem, wie macht man das?
Bounty ist offline   Mit Zitat antworten
Alt 22.12.2010, 21:46:44   #11 (permalink)
abgemeldet

Reg: 01.05.2006
Beiträge: 32.944
Benutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende ZukunftBenutzer-2472 hat eine strahlende Zukunft
Standard

Zitat:
Zitat von tobias1985 Beitrag anzeigen
[...]
Im Prinzip kann das ja "The GodFather". Aber das Programm ist abartig langsam. Vielleicht verlange ich auch zuviel?!
Überlege mal welchen Aufwand du dem Prozessor zumutest. Das ist im Prinzip schon ein in vernünftiger Zeit nicht algorithmisch lösbares Problem.

Jede Picosekunde wäre für einen Hashvergleich entscheidend. Wenn nun auch noch unterschiedliche Bitraten oder im worstcase Datein mit variablen Bitraten pro Sek. dabei sind, solltest du froh sein, wenn das überhaupt ein Programm auch nur im Ansatz löst.
Benutzer-2472 ist offline   Mit Zitat antworten
Alt 22.12.2010, 21:50:49   #12 (permalink)
bekämpft die Mächte des Bösen
Benutzerbild von theHacker

ID: 69505
Lose-Remote

theHacker eine Nachricht über ICQ schicken theHacker eine Nachricht über AIM schicken theHacker eine Nachricht über MSN schicken theHacker eine Nachricht über Yahoo! schicken theHacker eine Nachricht über Skype™ schicken
Reg: 20.04.2006
Beiträge: 20.471
theHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes AnsehentheHacker genießt hohes Ansehen
Standard

Zitat:
Zitat von Bounty Beitrag anzeigen
Dabei ist nur ein Problem, wie macht man das?
Naja einfach:
Erst alle Dateien hashen, dann nach Hash sortieren.
Bei mehreren Dateien mit gleichem Hash: alle bis auf eine löschen.

Aufwand:
O(n) zum Hashen
+ O(n log n) zum Sortieren
+ O(n) zum Vergleichen und Löschen
= O(n log n) gesamt

Die obige Variante, irgendwie alle Dateien "normieren" und "vergleichen" zu wollen, hört sich für mich stark nach O(n²) an, was die Laufzeit erklärt.
theHacker ist offline   Mit Zitat antworten
Antwort

Gesponsorte Links

Anzeige


Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1)
 
Themen-Optionen
Ansicht

Forumregeln
Es ist Ihnen nicht erlaubt, neue Themen zu verfassen.
Es ist Ihnen nicht erlaubt, auf Beiträge zu antworten.
Es ist Ihnen nicht erlaubt, Anhänge hochzuladen.
Es ist Ihnen nicht erlaubt, Ihre Beiträge zu bearbeiten.

BB-Code ist an.
Smileys sind an.
[IMG] Code ist an.
HTML-Code ist aus.
Trackbacks sind an
Pingbacks sind an
Refbacks sind an


Ähnliche Themen
Thema Autor Forum Antworten Letzter Beitrag
bugs finden Xindo Scripts & Software 1 17.03.2008 15:27:17
Filmgroßhandel finden Liquid0815 Gott und die Welt 9 22.11.2007 14:07:27
Seitenbesitzer finden zickenpower News & Infos 3 22.05.2007 11:14:10
Duplikate finden und automaisch löschen towercrew69 Software/Windows 6 20.03.2007 21:40:14
Fehler im CSS finden decision Lose4Graphics 7 18.07.2006 10:23:02


Alle Zeitangaben in WEZ +1. Es ist jetzt 23:18:36 Uhr.