4images Forum & Community
4images Issues / Ausgaben => Discussion & Troubleshooting => Topic started by: edelstoff on January 13, 2006, 03:29:54 PM
-
Hallo,
die google Bildersuche zeigt meine Bilder blank und ohne meine Seite per Direktem link ins Media Verzeichnis an, obwohl die Bilder in einer nur für registrierte Benutzer zugänglichen Kategorie sind.
Was muss ich ins Media Verzeichnis meines Webservers legen, um das zu verhindern? Gegen Direktory Browsing habe ich schon eine index.html. Aber gegen die direkte Verlinkung meiner Bilder bin ich machtlos.
Genauso verlinken user die Bilder direkt in ein fremdes Forum. Das möchte ich auch unterbinden, blos wie?
Es betrifft diese Seite:
http://www.bwfotos.de
und das ist das Google Suchproblem:
http://images.google.de/images?q=bwfotos&hl=de&btnG=Bilder-Suche
da wird dann z.B dieses Bild angezeigt:
http://www.juergen-baur.de/bund/data/media/53/1031473.jpg
ich will aber, dass so ein Aufruf unmöglich ist.
-
Du kannst in der robot.txt definieren welche Folder die Spieder durchsuchen dürfen, hast Du es dort mal definiert das der Folder data nicht durchsucht werden darf?
Ich würde sonst mal bei google suchen wie man das mit der Bildersuche abschalten kann.
-
Ein Bild aus dem Bildsuchdienst von Google entfernen
Um ein Bild aus dem Google-Bildindex zu entfernen, fügen Sie dem Stammverzeichnis des Servers eine robots.txt-Datei hinzu. (Falls diese Datei nicht ins Stammverzeichnis des Servers eingefügt werden kann, kann sie auch auf Verzeichnisebene platziert werden.)
Beispiel: Wenn die Website beispielsweise www.IhreWebsite.de/images/dogs.jpg ist und Sie nicht möchten, dass Google das Bild dogs.jpg aufnimmt, erstellen Sie eine Seite unter www.IhreWebsite.de/robots.txt und fügen Sie folgenden Text hinzu:
User-agent: Googlebot-Image
Disallow: /images/dogs.jpg
Um alle Bilder Ihrer Website aus unserem Index zu entfernen, platzieren Sie die folgende robots.txt-Datei in das Stammverzeichnis Ihres Servers:
User-agent: Googlebot-Image
Disallow: /
Hierbei handelt es sich um das Standardprotokoll, das die meisten Webcrawler im Hinblick auf das Ausschließen eines Webservers oder eines Verzeichnisses aus einem Index berücksichtigen. Weitere Informationen über die Datei robots.txt stehen unter folgender Adresse zur Verfügung: http://www.robotstxt.org/wc/norobots.html.
Darüber hinaus hat Google durch den Einsatz von Sternchen die Flexibilität des robots.txt-Dateistandards erhöht. Die Syntax für den Ausschluss von Dateien kann z.B. ein "*" enthalten, um eine beliebige Zeichenfolge anzugeben, und ein "$" am Ende einer Zeichenfolge gibt das Ende eines Namens an. Zum Entfernen aller Dateien eines bestimmten Dateityps (z.B. .jpg-Bilder einbeziehen, .gif-Bilder jedoch nicht) verwenden Sie den folgenden robots.txt-Eintrag:
User-agent: Googlebot-Image
Disallow: /*.gif$
Das habe ich eben hier gefunden:
http://www.google.com/webmasters/remove.html
Also lege eine robot.txt im 4images root Ordner an und dort drin muss dann folgendes stehen:
User-agent: Googlebot-Image
Disallow: /data/
Oder Du machst es so:
User-agent: Googlebot-Image
Disallow: /*.gif$
Disallow: /*.jpg$
Disallow: /*.jpeg$
usw...
Dann sollten die Bilder nicht mehr gefunden werden und um Hotlinking zu vermeiden musst Du ggf. noch eine .htaccess Datei anlegen.
-
@Acidgod
vielen Dank für die Informationen.
Es sollte allerdings schon so sein, dass die Bilder noch gefunden werden, denn das ist ja mein "Kapital" , allerdings sollen die Besucher nicht die Mögllichkeit haben unter Umgehung meiner Seite die Fotos direkt anzuzeigen oder zu verlinken.
Mit einer htaccess könnte man das in den Griff bekommen?
-
Ja das kann man... Und Du solltest dann lieber noch eine robot.txt mit folgendem Inhalt anlegen um die orginale vor google zu schützen:
User-agent: Googlebot-Image
Disallow: /data/media/
So werden die Thumbnails noch aufgenommen die Orginale aber nicht mehr...
Und zum Thema Bilder Sicherheit/Trafficklau gibt es hier einen eng. Thread:
http://www.4homepages.de/forum/index.php?topic=6997.0
ODer schaue dort mal vorbei:
www.trafficklau.de