I nogle af mine Sherlock-indlæg har jeg skrevet lidt om, hvordan man kan finde forskellige former for indhold, der bevidst eller med tiden er blevet slettet.
Men hvad nu hvis du er i den situation, hvor det er dit eget indhold, du vil slette og gemme væk? Skjule det der hyldestdigt til Stein Bagger på otte vers, som du lagde online to dage før, han blev afsløret som svinder.
Først og fremmest må du indse, at du har et grundlæggende problem. Har du offentliggjort noget på nettet, kan du ikke være sikker på, at du nogensinde kan slette det helt (som allerede beskrevet i mit “Echoes in Eternity“-indlæg.
Men du kan gøre lidt for at prøve at gemme det lidt ad vejen eller hjælpe det til at forsvinde lidt hurtigere fra nettet.
Google cache
Hvis man har skrevet noget på sin hjemmeside, som man har fortrudt og slettet, er Google Cache en af de større udfordringer. Man kan løse problemet på forkant ved at bruge et noarchive meta tag i headeren på sin hjemmeside. Så vil Google aldrig lægge dette indhold i cachen.
Ligger det problematiske indhold allerede i Googles cache, skal der andre metoder til. Som jeg ser det løses udfordringen bedst ved i første omgang at ændre på teksten på den relevante side i stedet for at slette siden helt. Hvis siden er blot nogenlunde populær, kommer Googlebot ofte forbi, og Googles cache vil relativt hurtigt vise det nye indhold på siden i stedet for det problematiske, gamle indhold. Det vil næsten helt sikkert gå hurtigere end at vente på, at Google fjerner en slettet side helt fra cachen. Det kan nemlig godt tage lang tid, da Google giver 404-sider “benefit of the doubt” i ret lang tid, før de fjernes fra indekset og cachen. (Hvilket man som almindelig webmaster skal være glad for. Det ville gøre nas at blive smidt ud af indekset pga. nedetid, når Googlebot kom forbi).
Wayback Machine
Hvis det er noget ældre indhold, du vil skjule, er Wayback Machine også en udfordring. Men den er relativt nem at ordne. Hvis man disallower deres useragent i robots.txt, fjerner de det historiske indhold fra deres arkiv og indekserer ikke noget fra din side fremadrettet.
RSS feeds
Hvis det er på en side med RSS feed, du har skrevet det problematiske indhold, har du det tillægsproblem, at indholdet ligger i feedet hos dem, der abonnerer på det. Her kan en løsning være at ændre på indholdet af siden, som jeg anbefalede længere oppe, men at gøre det ved at slette indlægget – og så genudgive det på samme URL som et nyt indlæg med det nye indhold. Det kan måske løse problemet. (Beklager, at jeg udgiver en stump gætværk på min blog, men jeg har ikke helt styr på teknikken i RSS feeds og har ikke haft tid til en test.)
Den ultimative løsning
Og så her til sidst den ultimative løsning på den slags udfordringer: Tænk dig grundigt om, før du producerer noget til nettet – og prøv kun at gøre ting, du kan stå ved. (Ja ja, jeg lyder så hellig, jeg ved det godt).
Jeg har tidligere testet om ændringer i indlæg vil ændre posterne hos diverse RSS-læsere. I Google Reader, som jeg tror de fleste benytter sig af, var det tilfældet – og det skete endda efter kun halvanden time.
Men det er langt fra altid praksis. Hos Blogmix.dk bliver indlægget eksempelvis ikke ændret (som det ser ud nu) og sites, der scraper feeds vil være ret ligeglade, når først de har publiceret dit indhold. Og da vil det først blive rigtigt svært at få fjernet. Derfor er din konklusion lige i øjet!
Hej Martin,
Tak for supplementet. Det er rart med læsere, der selv tester ting, når jeg nu selv smed lidt ubekræftet snak ind i indlægget 🙂