Det kan Google da godt gennemskue..

Nogle gange støder jeg på undren over, hvorfor forskellige elementer i SEO-arbejdet er nødvendige. Især når det gælder forskellige former for duplicate content-fnidder, kan det være svært at forstå, at Google og de andre søgemaskiner ikke bare kan gennemskue problemstillingerne uden at det skulle give problemer. Altså, at Google bare selv bør kunne gennemskue, at f.eks. www og ikke-www-versionen af et website er det samme og ditto med domæne.dk/index.html og domæne.dk.

En sjælden gang møder jeg også det stålsatte “Det kan Google godt selv gennemskue, og det behøver vi ikke tage os af”.

Rådet fra undertegnede og andre SEO-folk lyder så altid, at man ikke skal overlade valg til Google. Stol ikke på, at Google selv kan håndtere f.eks. duplicate content og vise det rigtige.

Her er et godt eksempel på, at Googles sorteringsevner og “intelligens”, om man vil, ikke altid er i top.

Linket fører til en Google-søgning, som viser de URL’er på .dk-domæner, der indeholder “utm_source”. Hvis du ikke er med på min pointe, så er “utm_source” en del af den tilføjelse, der kommer af at benytte sig af Googles egen kampagnesporing til Analytics. Det giver en adresse, som viser præcis det samme indhold som på URL’en uden Analytics-tilføjelsen. Men på trods af, at URL’en genereres til gavn for en Google-tjeneste, bliver nogle af disse adresser alligevel indekseret.

Når Googles egne produkter kan medvirke til at skabe duplicate content, tør du så overlade væsentlige beslutninger til Google selv?

Bare lidt til eftertanke, næste gang du er ved at tænke “Det kan Google da godt gennemskue”.

19 meninger om “Det kan Google da godt gennemskue..”

  1. Hejsa Frank

    Godt indlæg. Et andet eksempel på DC fra URLer genereret af en Google-tjeneste er indeksering af gclid.

    Jeg er helt enig med dig, og det er meget vigtigt at mange tager disse ting seriøst.

  2. Hej Frank

    Det er så sandt så sandt. Og faktisk er det temmelig underligt, at Google vælger at indeksere de tracking URLs fra deres eget Analytics. Det dokumenterer jo blot, at vi IKKE kan overlade de vigtige sager til Google.

    Problemet med Analytics URL’er er ikke nyt, og som du måske husker, har jeg beskrevet problemet – og leveret en løsning på det – i SEO-LEX 11.

  3. Hej Frank

    Jeg har mange gange været ude for at firmaer der lever af at lave hjemmesider og søgeoptimerer dem går i netop den fælde der. Det er virkelig værd at være opmærksom på!

  4. Enig! – det bør være meget simpelt at forstå for de fleste, men desværre glipper den meget tit.

    En anden typisk kandidat er indekseringen af sider med affiliate tracking.

  5. Tak for kommentarerne.

    @Rune,
    Ja, gclid er et andet glimrende eksempel i samme boldgade, hvor Google gerne indekserer duplicate content, som de selv er med til at skabe.

    @Kasper,
    Som Rosenstand gør opmærksom på, har han en løsning i SEO-Lex, hvor man piller ved Google Analytics-koderne. Og den vil jeg anbefale frem for Canonical, ekskludering i GWT eller hvad man ellers kan finde på af andre lappeløsninger.

    @Rosenstand,
    Nogle gange kan man undre sig over sådan noget, der får lov til at løbe i årevis, uden at Google stopper det. Det er vel ikke fordi SÅ mange webmasters og CMS’er bruger utm_source i deres URL-stier..

    @Mikael,
    Jeg støder heldigvis ikke på så mange derude, som prøver at ignorere problemet, når de bliver gjort opmærksom på det.

    @Rasmus,
    Uh ja, affiliate-programmer er også en klassiker, der kan give alle slags problemer.

    @Jacob,
    Jeg har været så lidt aktiv på Twitter på det seneste, at jeg har misset en diskussion, kan jeg se. 🙂
    Men det er et godt spørgsmål, du har skrevet til Matt Cutts. Det ville jeg også gerne høre ham prøve at give et nogenlunde intelligent svar på. 🙂

  6. Rasmus: Vil det sige at en affiliate partner kan tjene penge på at hans link bliver indekseret, så han får kredit for al den trafik der kommer den vej. Eller er der taget højde for det, så de både kigger på linket men også referer?

  7. @Jacob,
    Jeg har i hvert fald set nogle hjemmesideejere brokke gevaldigt over, at de på deres væsentligste keyword var indekseret med en affiliate-URL med dertil hørende omkostninger. Så det kan ske.

  8. God pointe, jeg har også undret mig og irriteret mig over de url’s som genereres i adwords til diverse tracking, som kan skabe DC hvis google indekserer dem.

    Det er højst mærkværdigt, hvis der kommer et officielt svar fra google eller Matt Cutts ville jeg da ihvertfald meget gerne høre om det – og hvad de så anbefaler at man gør.

  9. What! Den med analytics havde jeg ik hørt om før, men Googles produkter gør sig lidt uheldigt bemærket for tiden…
    Først Website Optimizer og nu også problemer med Analytics…

  10. Du skriver:

    “Altså, at Google bare selv bør kunne gennemskue, at f.eks. www og ikke-www-versionen af et website er det samme og ditto med domæne.dk/index.html og domæne.dk.”

    I teorien kan man godt bruge www og non-www til to forskellige ting… Ikke at det måske er smart, men det er muligt. www er jo et underdomæne som alle andre – historisk har det bare været ment til HTTP-indhold. Så hvis google bare hovedløst indekserer non-www som www eller omvendt, vil de i hvert fald teoretisk risikere at miste informationer. …som jeg ser det 🙂

  11. Man kan jo vælge at ignorer et eller flere parameter under Google webmasterværktøjer og Parameterstyring.

    Men som andre siger i denne tråd, er det underligt at Google ikke selv gør det.

    🙂

  12. Har alle udviklere hørt det nu? Det må vi håbe – Det er nemlig et typisk programmør svar.. “Det kan Google da godt selv regne ud” 🙂

    Mht. UTM, så gælder det ikke kun små sites. Jeg kan huske Kwigger, fra Just-Eat, twittede http://yfrog.com/h8vyfp at Just Eat UK’s forside (med UTM) outrankede deres forside http://www.just-eat.co.uk/.

    Her taler vi om en side med 7000+ Linking root domains.

    Jeg kan se de stadig har udfordringer med UTM-parameter. Det ligner at deres nyhedsbrev-tracking-url outranker forsiden, as we speak: http://yfrog.com/hssk3p

  13. Super eksempel, Frederik.
    Når det rammer så store sider som just-eat-co.uk, så kan det også ramme den gennemsnitlige læser herinde. 🙂

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *