Index.html als Double Content

ZX-Sinclair

Mitglied
Hallo

ich traue mich kaum die Frage zu stellen, aber ich komme nicht mehr weiter.

Google watscht mich ab wegen double content.

Einmal wegen meiner Website: www.domain.de und einmal www.domain.de/index.html

Für mich ist das beides das gleiche!

In der index.html steht im Header: <base href="https://www.domain.de">

Aber das bringt nichts. Ich möchte alle user von domain.de/index.html umleiten auf domain.de

In der .htaccess ruft ein

"Redirect https://www.domain.de/index.html https://www.domain.de"  einen Umleitungsfehler auf.

"Redirect 301 https://www.domain.de/index.html https://www.domain.de" ist wirkungslos.

Es kann nicht sein, daß ich der einzige Mensch mit diesem Problem bin, weiß aber nicht mehr wonach ich eigentlich googeln soll.

Wer kann weiterhelfen?

 
Es kann nicht sein, daß ich der einzige Mensch mit diesem Problem bin, weiß aber nicht mehr wonach ich eigentlich googeln soll.
Bestimmt nicht, auch der redirect wird den DB nicht verhindern. Es ist eben Google at his finest. Ein Problem kreiert von Google das die Nutzer ausbaden. Rewrite könnte es bringen. DB sollte allerdings auch nicht bestraft werden. Schlimmer sind die Seiten eines Kunden dran mit kann gerade nicht indexiert werden. Ohne Grund. Bei mir habe ich canonical Seiten wie Kontakt Seiten und der Index. Meine Seite hat 37 Unterseiten, und 40 wurden laut GSC nicht indexiert, 7 aber schon. Man kann der GSC (Google Search Console) nicht trauen. Und noch weniger den Nachrichten den die GSC rausgibt. Einer aus dem Produktforum meinte einfach verwerfen und nicht ernst nehmen. Wenn das die Googler schon sagen.    

How do you remove an index.html or index.php and redirect to the root?
RewriteEngine On
RewriteCond %{THE_REQUEST} /index.php HTTP [NC]
RewriteRule (.*)index.php$ /$1 [R=301,L]
RewriteEngine On
RewriteCond %{THE_REQUEST} /index.html HTTP [NC]
RewriteRule (.*)index.html$ /$1 [R=301,L]

How do you redirect a site from HTTP to HTTPS to eliminate duplicate content?
RewriteEngine On
RewriteCond %{HTTPS} on
RewriteRule (.*) http://%{HTTP_HOST}%{REQUEST_URI}

Wer eine Seite neu einträgt verhindert solche Nachrichten mit sich auf eine Version beschränkens. Als Tipp: setze in die GSC nur https://deineSeite.xxx ein. Damit wirst du auch keine Nachrichten und Daten bekommen für die anderen Versionen. Dadurch das die GSC wenig widergibt was der Wirklichkeit entspricht macht es Sinn.  

 
Danke für die Info.

Ich habe damit bereits ein wenig herumexperimetiert.

Sobald ich in die htaccess nach dem "ErrorDocument" eintrage kommt "internal Server Error 500"

RewriteEngine On
RewriteCond %{HTTPS} off
RewriteRule .* https://www.domain.de/$1 [R=301,L]

ErrorDocument 401 /404.html
ErrorDocument 403 /404.html
ErrorDocument 404 /404.html
ErrorDocument 410 /404.html

RewriteEngine On
RewriteCond %{THE_REQUEST} /index.html HTTP [NC]
RewriteRule (.*)index.html$ /$1 [R=301,L]


Was kann denn da falsch sein?

 
Ich habe die Reihenfolge auch schon umgestellt. Ergibt auch den Error 500.

Habe bei Google und Hoster die Adresse www.domain.de eingestellt (nicht domain.de, ohne www)

und .com wird auch auf .de umgeleitet.

aus dem Link werde ich nicht recht schlau. Ich arbeite im Bereich Maschinenbau und nicht Serveradministration :-(

 
Hallo ZX-Sinclair,

Du darfst Dich ohne weiteres getrauen. Kennst Du die Sesamstrasse? "Wer nicht fragt bleibt dumm..." heisst es da. Zudem waren wir alle irgend einmal Anfänger und haben nicht gewusst was wir tun. Also zögere nicht, frage ohne weiteres.

Deine Fragen helfen mir auch, mich selbst weiter zu entwickeln, indem ich, wenn ich etwas schreibe, mir die Fragen, welche aus meinem Text entstehen könnten, überlege und somit in einer Form schreibe, in der es für die Leser noch verständlicher sein könnte. Und das, so glaube ich, geht in unserer Welt heute leider immer mehr verloren. Also bitte ich Dich darum, frag, frag, frag so viel wie Du nur kannst.

@arnego2  "alter Haase". Sorry, aber wenn ich Deine Nachrichten hier lese, dann fällt mir auf, dass Du vermutlich ziemlich verbittert sein musst. Insbesondere scheinst Du eine grosse Aggression gegen Google zu haben. Als ob Google nur schlecht ist und alles immer falsch macht. So kommt das bei mir rüber, was ich von Dir in verschiedenen Posts hier im Forum lese. Oft verstehe ich Deine Antwort im Bezug zur gestellten Frage nicht. Bitte verzeih mir meine offenen Worte und lass Dich durch meine Offenheit nicht davon abhalten, weiterhin Antworten zu schreiben. Auch auf das Risiko hin, dass ich mal wieder etwas "zu motzen" habe.  Ich grüsse Dich ganz herzlich und freundlich...

@ZX-Sinclair: Ich persönlich würde die Search Console sehr ernst nehmen. Denn bisher konnte ich feststellen, dass alle Warnungen welche ich von dort bekommen habe und ich korrigiert habe, später zu einer bessern Positionierung geführt haben. Das Redirect Problem hatte ich auch einst. Und ich musste feststellen, dass sehr viele Provider selbst nicht wirklich wissen, wie die Syntax eines Redirectes wirklich geht. Und ich bin mir bei meinen eigenen Seiten heute selbst noch nicht sicher, ob ich es richtig eingebaut habe. <Arngo2 Augen Zu>Aber sowohl die SearchConsole als auch Analytics geben immer wieder wertvolle Informationen was die Besucher auf meiner Webseite erleben.<Arngo2 Augen Auf> ;-)

Sobald ich auf eine sehr gute Erklärung zum Redirect stosse, werde ich Dich informieren.

Grüsse auch an alle Anderen.

 
@arnego2  "alter Haase". Sorry, aber wenn ich Deine Nachrichten hier lese, dann fällt mir auf, dass Du vermutlich ziemlich verbittert sein musst. Insbesondere scheinst Du eine grosse Aggression gegen Google zu haben.
Verbittert wie kommst du darauf? Wir hatten in den Anfängen von Adsense eine Seite die sich ca. 120$ erarbeitet hatte. Nur bezahlt wurde es nicht und das anscheinend  da wir aus einem Land kommen und so gut wie keine Chance auf eine Klage haben. So wie die Amis einen einladen doch mal bei ihnen vorbeizuschauen woll wissend das eh keiner kommt.

Je mehr du überprüfst was Google erzählt desto eher wirst du verstehen wie Google drauf ist. Bei dir gut wenn dir die GSC hilft. Freut mich für dich. Nur bei meinen Kunden ist es so das die Vollständige Indexierung sich locker über 6 Wochen hinzieht. Und das obwohl ich hinter den nicht indexieren her bin.

Wer wie ich schon 15 Jahr im Geschäft ist und Tag ein Tag aus die gleichen Märchen ala Matt Cutts hört der die Aufgabe hatte Desinformation zu verbreiten. Ist vielleicht nicht so Jolly Google tralala  In D ist es weit verbreitet das zu glauben was gesagt wird. Außerhalb D ist es nicht so normal die Wahrheit zu hören sondern eher das was du hören willst. Klar ist es meine Meinung.    

 
Ohjee. Das sind so viele Seiten mit Infos! 

Teilweise hilfreich, der Rest ist verwirrend.

Seltsamerweise bestätigt dieses Test-Tool auch diese komischen URL's die ich nie hatte wie z.B.: _acme-challenge......

Ebenso sind die SSL Zertifikate buggy und veraltet (erst vor kurzem vom Provider neu eingetragen, getestet und für ok befunden).

Ich wurstel mal weiter... Danke an alle!

Nachtrag. Gerade mit meinem Provider (DomainFactory = eigentlich sehr zufrieden) telefoniert. Der hat mir im Ernst geraten die index.html per robots.txt mit nofollow zu belegen. (ich denke das ist keine gute Idee!)

 
Zuletzt bearbeitet von einem Moderator:
Guten Abend ZX-Sinclair,

Habe mir Deine Ausgangsfrage nochmals kurz durch gelsesn. Du schreibst:

>Einmal wegen meiner Website: www.domain.de und einmal www.domain.de/index.html
>Für mich ist das beides das gleiche!

Grundlage: Wenn die Domain www.domain.de aufgerufen wird, dann sucht der WebServer eine Datei welche Index heisst und jetzt kommt es auf die konfiguration des Servers an. Es könnte php htm html oder bei einem Windows Server auch default.htm sein. Der Betreiber des Servers legt die Reihenfolge fest, in welcher die index Datei beachtet wird.

Frage an Dich: Hast Du im Root Verzeichnis Deines Domains mehr als eine Datei die mit Index. beginnt? Eventuell eine index.php und eine index htm?

Weitere Grundlagen: bei Domain Factory habe ich deren Reihenfolge für die index gefunden:

o lange Sie mittels einer .htaccess-Datei keine anderweitige Konfiguration vornehmen, wird die DomainFactory-Standardkonfiguration des Webservers für den DirectoryIndex herangezogen.

Der regulär für unsere Webserver festgelegte DirectoryIndex lautet wie folgt:

  1. index.html
  2. index.htm
  3. index.shtml
  4. index.php
  5. index.php3
  6. index.php4
  7. index.php5
  8. index.phtml
  9. index.pl
  10. index.cgi
  11. index.wml
Bei einem Aufruf der entsprechenden Domain bzw. des entsprechenden Verzeichnisses wird nun in der oben angegebenen Reihenfolge nach einer Startseite gesucht.

Wenn in dem Verzeichnis beispielsweise eine Datei "index.htm" und eine Datei "index.php4" liegt, so würde standardmäßig immer die Datei "index.htm" verwendet werden, da diese in der Reihenfolge gegenüber "index.php4" vorangestellt ist!

Zurück auf Deine Ausgangsfrage:

>Einmal wegen meiner Website: www.domain.de und einmal www.domain.de/index.html
>Für mich ist das beides das gleiche!

Wenn Du keine Umleitung definierst, dann ja.

Kontrolliere ob Du wirklich Deine index.html aufrufst wenn Du auf www.domain.de gehst. Setze zum Beispiel irgendwo auf der Seite klein einfach ein Datum. Zum Beispiel so: <p><small><small>07.05.2019</small></small></p>

Wenn Du jetzt sicher bist, dass www.domain.de Deine index.html aufruft, dann können wir einen Schritt weiter gehen.

Du schreibst:

>Ich möchte alle user von domain.de/index.html umleiten auf domain.de

Nein, das möchtest Du nicht. Denn wenn die index.html auf domain.de umleitet, wird der Server per obiger Standardeinstellung wieder die index.html aufrufen welche auf domain.de weiter geleitet wird welche wiederum auf index.html umgeleitet wird welches wiederum auf domain.de....  HALT !!! STOP !!! wie gesagt, das willst Du nicht! Sonst hast Du einen Loop.

Also keine Umleitung, keine htaccess... einfach nur die Standard Einstellung stehen lassen.

Du schreibst:

>Wer kann weiterhelfen?

Meine Antwort: ich

Eventuell fragst Du: Wie?

Meine Antwort: ist mit obigem Text bereits geschehen.

Danke für den Applaus...

;-)

Arnego, ab hier bitte weghören, ich meine, weg lesen, ich meine Augen zu.

ZX-Sinclair, Du schreibst, dass Dich Google abwatscht wegen Doppelten Inhalt. Kannst Du mal kurz die ganz genaue Meldung hier rein kopieren? Denn wenn obiges ausgeführt ist, ist Domain.de und Domain.de/index.html die selbe (nicht die gleiche, die selbe) Datei.

Viele liebe Grüsse
Markus

Huch, ich habe vergessen, Arnogo, selbstverständlich darfst Du wieder weiter lesen... wir sprechen nicht mehr über Google...  ;-)

PS: Dein Nachtrag, der könnte vom Schweizer Provider ServerTown.ch sein. Der hat mich auch mal mit falschangaben versucht rein zu legen welche keiner Prüfung Stand gehalten hatte. Und also ich seine Aussagen dann in seine <arnego stop>  google Bewertungen geschrieben habe  <Arnoge weiter>  dann hat er die sachlich geschriebene Bewertung einfach gelöscht. Die index.html sofern sie dann die erste Datei ist die in Domain.de aufgerufen wird (hast Du ja oben getestet) ist die wichtigste Datei für Deine Domain. Dort beginnt ja alles Auch die XXXXXX-Indexierung.

Viele liebe Grüsse
Markus

PS: Sag, bist Du von der GERWAN gmbh?

 
Verbittert wie kommst du darauf? Wir hatten in den Anfängen von Adsense eine Seite die sich ca. 120$ erarbeitet hatte. Nur bezahlt wurde es nicht und das anscheinend  da wir aus einem Land kommen und so gut wie keine Chance auf eine Klage haben. So wie die Amis einen einladen doch mal bei ihnen vorbeizuschauen woll wissend das eh keiner kommt.

Je mehr du überprüfst was Google erzählt desto eher wirst du verstehen wie Google drauf ist. Bei dir gut wenn dir die GSC hilft. Freut mich für dich. Nur bei meinen Kunden ist es so das die Vollständige Indexierung sich locker über 6 Wochen hinzieht. Und das obwohl ich hinter den nicht indexieren her bin.

Wer wie ich schon 15 Jahr im Geschäft ist und Tag ein Tag aus die gleichen Märchen ala Matt Cutts hört der die Aufgabe hatte Desinformation zu verbreiten. Ist vielleicht nicht so Jolly Google tralala  In D ist es weit verbreitet das zu glauben was gesagt wird. Außerhalb D ist es nicht so normal die Wahrheit zu hören sondern eher das was du hören willst. Klar ist es meine Meinung.    
Weil ich in Vielen Deiner Beiträge immer wieder lese, wie schlecht und falsch dies oder das wäre.

>  Es ist eben Google at his finest. Ein Problem kreiert von Google

und 

> So gut wie alle Tools bieten diese Art von Blödsinn an. 

um nur zwei Indizien von vielen welche mir aufgefallen sind, zu nennen.

Und dann frage ich mich, was kann ich tun, um die Verbittertheit zu versüssen?

>Je mehr du überprüfst was Google erzählt desto eher wirst du verstehen wie Google drauf ist.

Und hier frage ich mich, hat das mit dem Unterschied zwischen der Schweiz und Venezuela zu tun? Arbeitet Google in Venezuela anders als bei uns in der Schweiz? Dabei meine ich jetzt nicht die  einzelnen Menschen, sondern das System an sich.

>Adsense eine Seite die sich ca. 120$ erarbeitet hatte. Nur bezahlt wurde es nicht
Verstehe natürlich sehr gut, dass Dich sowas ärgert. Habe aber grosse Schwierigkeiten zu verstehen, warum das nicht bezahlt wurde. Meine AdSensen wurden und werden alle immer bezahlt. Darf ich mutmassen? Ev falsche Kontonummer angegeben? Wurde der bei der Kontoerstellung bezahlte Testbetrag von Google bezahlt? Hast Du eine Mindestauszahlung definiert welche über der 120$ liegt? 

>Nur bei meinen Kunden ist es so das die Vollständige Indexierung sich locker über 6 Wochen hinzieht.

Was wir ja mit dem DecInSwiSec Test bewiesen haben, dass dem nicht so ist.

>Wer wie ich schon 15 Jahr im Geschäft ist

Grins, verzeih, ich bin seit 1983 in der Informatik tätig. Das sind, ich habe gerade nachgerechnet, mittlerweile 36 Jahre. Also mehr als doppelt so viel wie Du. Aber bitte entschuldige, die Länge einer Tätigkeit zeigt nicht zwingend die Qualität der Tätigkeit. Also anders gesagt: Respekt vor Deinen 15 Jahren.

>sondern eher das was du hören willst

Ja, das ist bei sehr vielen Menschen so. Und sehr viele "Verkäufer" nutzen das auch sehr geschickt aus. Darum mache ich sehr gerne eine Testumgebung und prüfe die Aussagen nach. Nicht mit Indizien, sondern mit Handfesten Beweisen.

Wollen wir zusammen einen DecInVenArn Test machen? Um zu beweisen welche Aussagen für Dein Land, für Venezuela Gültigkeit haben?

Viele liebe Grüsse
Markus

 
Zuletzt bearbeitet von einem Moderator:
Nachtrag: ich habe was gefunden...

In der von www.sitemaps.org erzeugten sitemap.xml steht der Eintrag domain.de und mittendrin nochmal der Eintrag domain.de/index.html.

Wenn das nicht richtig ist, so müssen alle dieses Problem haben?

Habe ich jetzt mal rausgelöscht

 
Öhhh, wenn ich nochmal auf mein Problem zurückkommen könnte.

@MaWi  Natürlich gibt es nur eine index.html, keine sonstigen index....

Was kann ich noch tun?

In der SearchConsole wird meine Seite als double content aufgeführt:

https://www.domain.de/index.html

aber auch:

https://www.domain.de/?utm_source=SherlockWho&utm_medium=Lieferantensuche&utm_campaign=Sherlock40-PRO-Eintrag&utm_term=Suchbegriffe_nur_mit_PRO-Eintrag

Die ist nicht von mir!
Guten Abend,

Und die Redirects hast Du gelöscht? Oder leitest Du noch immer um?

Und was bitte genau (mach mal copy paste) ist die Meldung von Google? 
Zeig es mal im Klartext, damit ich es nachvollziehen kann...

Viele Grüsse
Markus

 
Ja und ein Teil verzweifelt an den Google Richtlinien. Ob es allerdings helfen wird ist fraglich. https://www.xml-sitemaps.com/forum/index.php/topic,2015.html

DB verursacht keine direkte Penalty das heißt in deinem Fall das du theoretische 2 identische Indexe hast von denen nur einer gezählt wird. 
Lieber Arnego, wer verzweifelt? Du? Warum denn, die Regeln sind doch klar und deutlich. Ich verstehe Dich einmal mehr nicht.
Viele Grüsse zu Dir...

 
Hallo!

Hier nochmal die vollständige htaccess:

RewriteEngine On
RewriteCond %{HTTPS} off
RewriteRule .* https://www.domain.de/$1 [R=301,L]

ErrorDocument 401 /404.html
ErrorDocument 403 /404.html
ErrorDocument 404 /404.html
ErrorDocument 410 /404.html


Ich habe nur drei Seiten "Duplikat – eingereichte URL nicht als kanonisch festgelegt" :

../index.html

../de/consultingde.html

../en/consultingen.html

Alle drei Seiten sind völlig unterschiedlich!

Gerade noch ein Fehler dazugekommen: "Duplikat – vom Nutzer nicht als kanonisch festgelegt" :

https://www.domain.de/?utm_source=SherlockWho&utm_medium=Lieferantensuche&utm_campaign=Sherlock40-PRO-Eintrag&utm_term=Suchbegriffe_nur_mit_PRO-Eintrag

Wo kommt das denn schon wieder her? Heute Morgen war das weg!

 
Zuletzt bearbeitet von einem Moderator:
Zurück
Oben