PHP statische Dateien durchsuchen

baserider

Well-known member
ID: 174417
L
10 März 2007
682
23
Hi,

für eine Suchfunktion sollen auch die auf dem Server liegenden statischen Seiten durchsucht werden.
Meist findet sich ja der Text dort entweder im Title oder im Container <div="content">.

Ich wollte den Text dort auslesen und in eine DB schreiben, so das man das dann per SELECT... auslesen kann.

Ist das das richtige Vorgehen? Es gibt ja eine DOM-Klasse in PHP. Ist die fürs Auslesen geeigent oder gibt es da noch besser Alternativen?
 
wozu soll das ganze denn dienen ???

ich würde ein statisches Template basteln, aber die Werte nicht in einer DB ablegen. Was passiert, wenn die DB ausfällt ? Leere seiten ...
 
Zuletzt bearbeitet:
Prinzipiell spricht nix dagegen, die Dateien in der Datenbank zu indexieren. DB-Zugriffe kosten in aller Regel weniger als umfangreiche Dateizugriffe.
 
DB-Zugriffe kosten in aller Regel weniger als umfangreiche Dateizugriffe.
Ein cleverer Dateizugriff wäre auch eine Möglichkeit: Ich spreche von Lucene. Speziell bei Textsuchen klingelts da in meinen Ohren.

Muss allerdings zugeben, dass ich mit Lucene und PHP keine Erfahrungen hab. Laut Wikipedia gibts es aber Portierungen :)
 
Hi,

danke für die Hinweise. Lucene kann ich bei meinem Webpaket leider nicht installieren, aber Zend werde ich mir mal ansehen.
 
Lucene im Zend Framework ist arsch langsam, das kann man total vergessen kein Vergleich zu der Java-Variante. Da ist selbst die MyISAM-Volltextsuche besser.
 
Hi,

das klingt ja nicht so gut. Wollte es eigentlich mal ausprobieren. Dann werde ich wohl doch in die DB schreiben und wieder auslesen, denn eine andere, bessere und schnellere Möglichkeit fällt mir eben auch nicht ein.

Das Geschwindigkeitsproblem habe ich eben auch in dem genannten Blogbeitrag in den Kommentaren gelesen.
 
Das mit dem Template als statische Vorlage ist schon ok.
Was ist denn wirklich schneller!

-einmal aus der DB lesen
oder
- einmal mittels require_once() eine Datei in den Speicher laden,
wo alle dynamischen Inhalte hinterlegt sind für die Templates
die in den Templates dann halt nur benutzt werden...
Liegt ja eh alles intern im Speicher, also wozu das gemucke...
 
ich dachte er meint folgendes:

ein statisches html gerüst in einer datei, welches aus der DB mit daten gefüttert wird, also alles gleich aussieht nur der inhalt ändert sich...
Das wäre für mich ein template ...
 
Dann könnte er doch einfach die Daten aus der DB durchsuchen und hätte das zugrundeliegende Problem gar nicht... :think: