Hallo,
ich habe eine generelle Frage zum Aufbau einer URL. Ich bin zurzeit dabei mir einen Webcrawler zu schreiben und möchte nun doppelte URL's filtern. Da jedoch manchmal zB klamm.de verlinkt wird und manchmal www.klamm.de ist es schwieriger doppelte URL's zu erkennen.
Nun bin ich mir nicht sicher, ob alle URL's die man ohne www erreichen kann auch mit www erreichen kann (Da es umgekehrt ja manchmal nicht geht!). Kann jemand mehr dazu sagen?
MfG
Xot
ich habe eine generelle Frage zum Aufbau einer URL. Ich bin zurzeit dabei mir einen Webcrawler zu schreiben und möchte nun doppelte URL's filtern. Da jedoch manchmal zB klamm.de verlinkt wird und manchmal www.klamm.de ist es schwieriger doppelte URL's zu erkennen.
Nun bin ich mir nicht sicher, ob alle URL's die man ohne www erreichen kann auch mit www erreichen kann (Da es umgekehrt ja manchmal nicht geht!). Kann jemand mehr dazu sagen?
MfG
Xot