Programmering

ISBN.nu blir borte og funnet i Google gaffe

Jeg trodde i forrige uke at jeg hadde fullført serien min på ISBN.nu, en online sammenligningstjeneste for bokpriser som får 135 000 av sidene sine til Google.coms indeks. Men det var før forholdet mellom webtjenesten og Google ble nyheter.

En dag etter 21. februar-utgaven min avslørte at ISBN.nu lagrer færre enn 4000 sider på serveren sin - de andre 131.000 sidene genereres dynamisk når en søkemotorspinn (eller et menneske) følger en lenke - nesten alle nettstedets sider forsvant plutselig fra Googles indeks. Da jeg sjekket lenken (gjengitt nedenfor) som viser antall ISBN.nu-sider som er i Googles indeks, hadde totalen falt til bare ni.

ISBN.nu Webmaster Glenn Fleishman trodde opprinnelig at en funksjonær på lavere nivå hos Google hadde hørt om historien min og bestemte seg for å forby nettstedet. Det satt ikke riktig med Fleishman. Han sier at han har snakket personlig med Googles toppledere gjennom årene. Som han beskriver det, har Google ikke noe problem med å indeksere dynamisk genererte sider, så lenge innholdet en edderkopp ser er nøyaktig det samme som et menneske ville sett. Mange databasedrevne nettsteder genererer legitimt sider etter behov i stedet for å lagre alle tenkelige sider på serverens harddisk.

Heldigvis ble avbruddet forårsaket av en feil i en programvarerutine hos Google. Søkemotorselskapet forsikrer meg om at ISBN.nu sine sider vil komme tilbake til Google-indeksen i løpet av få dager, hvis de ikke har gjort det da du leste dette.

Hvordan Fleishman håndterte problemet, gir oss imidlertid en verdifull opplæring. Samtidig avslører avbruddet hvordan en relativt ny "banning" -algoritme hos Google fungerer. Her er historien:

1. ÅPEN KOMMUNIKASJON. Da Fleishman oppdaget 6. mars at sidene hans manglet fra Google-indeksen, sendte han høflige, men bekymrede e-poster til kontaktene sine i søkemotoren, som han tidligere hadde møtt.

2. PRESSEFORHOLD. Fleishman varslet meg om problemet, hvoretter jeg sendte en egen e-post til kontaktene mine på Google (som jeg hadde betalt en høflighetsanrop ved et tilfeldighet tidlig i februar) og ba om avklaring.

3. ANALYSE. Da en talsmann fra Google svarte at de manglende sidene bare var forårsaket av en teknisk feil, ikke en politisk beslutning, analyserte Fleishman situasjonen og fant at det ikke var behov for endringer i databasedesignet.

Problemet? Hver prissammenligningsside på ISBN.nu inneholder lenker til hele ni forskjellige bokhandlere. Med 135.000 sider indeksert, gir det mange lenker. Og hver lenke inneholder viktige tilknyttede kodestrenger, slik at ISBN.nu kan tjene provisjon hvis en bruker ender opp med å kjøpe en bok.

Som Googles Nate Tyler uttrykker det: "Problemet ser ut til å ha noe å gjøre med det store antallet tilknyttede viderekoblinger, som utløser noe av vår automatiserte teknologi." Det betyr at en Google-programvarerutine gjettet at ISBN.nu var en "link farm". Dette er en falsk webring der hundrevis av nettsteder oppretter hundrevis av lenker til hverandre, og prøver å lure Googles velkjente "link popularitet" -system.

Fleishman rapporterer at Google-blackout forårsaket en nedgang til 5000 besøkende per dag fra 9000 (en nedgang på 45 prosent) og en nedgang på 30 prosent til 40 prosent i tilknyttede inntekter. Han legger til at Yahoo nylig har utelatt ISBN.nu i noen dager, og kuttet i et par tusen henvisninger per måned fra den kilden. Dette understreker viktigheten av søkemotortrafikk til noen e-handelsnettsteder, mens andre er langt mer avhengige av egen reklame- og markedsføringsinnsats.

Hvis du prøvde lenken min i forrige måned til antall ISBN.nu-sider hos Google, beklager jeg at den ikke avslørte de 135 000 sidene jeg lovet. Du kan prøve lenken nedenfor i noen dager for å se hvor mange av nettstedets sider som går tilbake til indeksen når Googles edderkopp gradvis gjennomsøker koblingene.

GLENN FLEISHMANS KOMMENTAR TIL GOOGLE UTAGE:

//[email protected]/?4e52

ET SØK VISER ANTALL ISBN.NU-SIDER PÅ GOOGLE

//[email protected]/?61da

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

E-BUSINESS TECH ANMELDELSE: TOM PRINGLES KAN TRÅDLØS ANTENNE

Ved å bruke en tom Pringles potetgull kan som en ekstern antenne, ondsinnede hackere lett finne og bryte inn i mange bedrifts trådløse nettverk, ifølge en analyse fra I-sec, en sikkerhetsrådgivningsgruppe.

Selskapet kjørte en bil rundt Londons finansdistrikt ved å bruke en tom Pringles-boks for å forstørre signaler fra trådløse nettverk. Mer enn to tredjedeler av selskapene som bruker trådløst eller Wi-Fi, hadde ikke implementert noen krypteringsfunksjoner, sa sikkerhetsgruppen. Slike nettverk er sårbare for tyveri av båndbredde eller inntrenging av data.

Den rørformede Pringles-beholderen lager en effektiv retningsantenn, også kjent som en Yagi-antenne. Planer om å bruke denne og andre enheter for å identifisere Wi-Fi-signaler begynte å sirkulere på Internett i fjor.

BBC News Online sier at det var vitne til at I-sec oppdaget nesten 60 ubeskyttede trådløse nettverk på en enkelt 30-minutters reise gjennom kløftene i byen. Rapporten beskriver problemet og foreslår enkle løsninger.

TOM PRINKLER KAN HJELPE HACKERE Å FINNE UBESKYTTET WI-FI:

//[email protected]/?7562

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

LIVINGSTONS TOPP 10 NYHETSBILDER O 'UKEN

1. Netscape Navigator 6 leser søk, sier Newsbytes

//[email protected]/?41a

2. Miniatyrbilder av bilder på nettet er OK, domstoler

//[email protected]/?802

3. Streaming av musikksider avviser arbitrerte royalty-priser

//[email protected]/?bea

4. Hvordan Miller Freemans papirkjøp b-til-b tjener penger

//[email protected]/?fd2

5. Å tilby gratis frakt over $ 99 øker ordrestørrelsen

//[email protected]/?13ba

6. Høyesterett kan reversere utvidelse av opphavsretten

//[email protected]/?17a2

7. Cool: Hvordan bygge et roterende galleri i ColdFusion

//[email protected]/?1b8a

8. Svindel er 19 ganger mer sannsynlig online enn offline

//[email protected]/?1f72

9. HTML-tips: Den rette måten å gjøre rollovers raskt

//[email protected]/?235a

10. Stopp hackere fra å bruke PayPal for å stjele innholdet ditt

//[email protected]/?2742

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

WACKY WEB UKE: TABLOID POP BAND SPLIT-UP GENERATOR

Kanskje dette kan tilfredsstille nettstedets behov for innhold. Skriv inn noen få nøkkelord i et webskjema og presto: Popjustice, et ærbødig musikkindieside, spytter ut en perfekt tabloidartikkel om det forestående oppbruddet av ethvert popband du ønsker.

Litt klippe og lime for å kopiere det velkjente rykte, og du kan også se ut som en musikkinnsider. Popjustices britiske side er en slags krysning mellom en fanzine og en av de mest forseggjorte bloggene du noensinne vil se. Prøv det, men vær advart: slem språk og ungdomshumor, røykere.

POPJUSTICE'S SPURIOUS BAND-SPLIT WEB MOTOR:

//[email protected]/?c382

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

E-BUSINESS SECRETS: Vårt oppdrag er å gi deg så nyttig og tankevekkende informasjon om nettet at du faktisk ser frem til å lese e-posten din.

OM FORFATTEREN: E-Business Secrets er skrevet av Contributing

Redaktør Brian Livingston (//SecretsPro.com). Forskningsdirektør er Ben Livingston (ingen relasjon). Brian har gitt ut 10 bøker, inkludert:

Windows Me Secrets:

//[email protected]/?0764534939

Windows 2000-hemmeligheter:

//[email protected]/?0764534130

Vinn et gavekort bra for en bok, CD eller DVD etter eget valg hvis du er den første som sender et tips Brian skriver ut. mailto: [email protected]

$config[zx-auto] not found$config[zx-overlay] not found