|
|
#1 (permalink) |
|
King with a crown
|
Heyho,
angenommen, ich will einen News-Artikel-Crawler schreiben, welcher ständig die 10 größten Newswebseiten durchforstet und dabei zu jedem Artikel möglichst viele Informationen speichern will. Also beispielsweise den Titel, die Anzahl Kommentare, die User-Bewertung, wie oft die News angeschaut wurden und noch ein paar Sachen mehr. Jetzt ist es aber so, dass diese 10 Webseiten die genannten Kriterien sehr unterschiedlich ausgestaltet haben, z.B. hat Webseite A bei den Bewertungen ein "Gefällt mir"-System, wo man nur sagen kann, dass einem ein Artikel gefällt. Webseite B hat aber ein "Finde ich gut / Finde ich schlecht"-System und Webseite C hat 1-5 Sterne, die man vergeben kann. Und eine andere Seite hat vielleicht gar keine Bewertungen. Wie erfasse ich diese Daten jetzt trotzdem möglichst ohne Informationsverlust in einer DB? So, dass ich zumindest die Artikel innerhalb einer Plattform untereinander vergleichen kann. Natürlich sollen, wenn neue Daten erfasst werden, die alten weiterhin gespeichert werden. Natürlich sollte das auch flexibel sein, falls eine Webseite ihr Datenformat ändert oder eine neue Webseite dazukommt.
Oder vielleicht noch irgendwas anderes, was nicht unsauber oder unperformant ist? ^^ Wenn man halt mal wirklich davon ausgeht, dass es mehrere dieser Kriterien gibt, die von Plattform zu Plattform in sehr unterschiedlichem Format sind, und man sie trotzdem erfassen will… Und natürlich die Frage "macht das alles Sinn / ist das erlaubt" mal völlig außen vor gelassen, geht ja nur um die technische Seite ^^ LG, flo |
|
|
|
| Gesponsorte Links |
|
|
#2 (permalink) | ||||||
|
return void
|
Zitat:
Bei letzterem musst du die Daten bei dir eben in eine gemeinsame Struktur bringen, ist schwer, aber meist findet man doch ein System. Zitat:
Zitat:
Zitat:
Wenn du schon eine Datenbank nutzt, warum die Datenhaltung kaputt machen indem du wieder Daten speicherst, die für die Datenbank nicht auswertbar sind? Zitat:
![]() Zitat:
|
||||||
|
|
|
|
|
#3 (permalink) | ||
|
King with a crown
|
Zitat:
All diese WTFs sind durchaus angebracht, weil du hast ja Recht… außer diesen "schmutzigen" Lösungen ist mir aber halt nix anderes eingefallen ^^ Hätte ich beim Gedanken daran kein Bauchweh, hätte ich gar nicht gefragt sondern implementiert und mich dann in 2 Monaten gewundert, wieso alles scheiße ist ![]() Zitat:
Danke also auf jeden Fall schon mal |
||
|
|
![]() |
| Gesponsorte Links |
| Anzeige |
| Aktive Benutzer in diesem Thema: 1 (Registrierte Benutzer: 0, Gäste: 1) | |
| Themen-Optionen | |
| Ansicht | |
|
|
Ähnliche Themen
|
||||
| Thema | Autor | Forum | Antworten | Letzter Beitrag |
| [MySQL] datenbankstruktur | adblue | Programmierung | 4 | 08.02.2011 16:42:34 |
| [PHP/MySQL]Datenbankstruktur überprüfen | BartTheDevil89 | Programmierung | 19 | 17.08.2008 10:41:14 |
| [MySQL] Datenbankstruktur: Gruppen | BenArt | Programmierung | 3 | 02.01.2008 22:11:05 |
| [mysql] Datenbankstruktur | T-Rex | Scripts & Software | 7 | 28.12.2007 08:53:45 |
| [MySQL] Idee für Datenbankstruktur gesucht =/ | eggman | Programmierung | 4 | 29.05.2006 21:49:18 |