Sviđa vam se članak? Preporučite ga prijateljima i kolegama putem društvenih mreža:

URL parametri.
Svaka domena ima određeni broj stranica koje su dostupne ili indeksirane u Googleu. Mnoge od tih indeksiranih stranica nemaju jedinstven sadržaj i zbog toga ih Google jednostavno ne želi rangirati. Te indeksirane stranice bez jedinstvenog sadržaja imaju veliki utjecaj na rejting indeksiranih stranica koje imaju jedinstveni sadržaj.
Ukoliko spriječimo da Google dođe to tih manje bitnih stranica koje ovako i onako ne želi da će nam rejting na bitnije stranice biti bolji. Upravo tome služi URL parameters unutar Google Webmaster Centrala za koji smo vam pripremili vodič, da blokiramo sve što nema smisla tj. vrijednosti. To bi primjerice mogle biti print verzije članaka koje nemaju vrijednost, jer su kopije orginala i trebate ih blokirati. Njihovim blokiranjem orginalne verzije članaka će se bolje rangirati, kao i ostatak sadržaja na domeni.
Unutar svog Google Webmaster Central sučelja pod Site Configuration imate opciju URL parameters. Ova mogućnost služi za blokiranje pristupa URL-ovima koji sadrže određene parametre ukoliko oni ne mijenjaju sadržaj nekog većeg postojećeg URL- a ili ukoliko je njihov sadržaj s razlogom vrlo sličan nekom URL-u.
Drugim riječima: još jedan u nizu alata kojim se pokušava spriječiti nastajanje duplog sadržaja, ali i Googleu daje više informacija o tome zašto su dvije URL adrese vrlo slične. Blokiranje tih URL-ova omogućava drugim stranicama ili cijeloj domeni da se bolje rangiraju u rezultatima pretraživanja. Podrška Google Webmaster Helpa navodi:
Google’s goal is to crawl your site as efficiently as possible. Crawling and indexing pages with identical content is an inefficient use of our resources. It can limit the number of pages we can crawl on your site, and duplicate content in our index can hinder your pages’ performance in our search results. Duplicate content often occurs when sites make the same content available via different URLs—for example, by using session IDs or other parameters.
Googlebot vam je već sam dodao određene parametre iz vaših URL-ovova za koje smatra da ih je možda potrebno blokirati. Naći ćete ih pod URL parameters. Vi dakako možete dodati i svoje. Za svaki od parametara koji se prosljeđuju u URL-u postoji sljedeći odabir klikom na Edit:
Odnosno…
Razlika u prvoj opciji je očita. Parametri poput affiliateid ili ref najvjerojatnije ne utječu na mijenjanje sadržaja na nekom URL-u već imaju drugu funkciju. Zbog toga ćete to naznačiti. Kad Googlebot pronađe URL s tim parametrima neće ih uzimati u obzir te ih neće indeksirati. Time bitnije stranice na vašoj domeni dobivaju više “snage”.
Odabirom druge opcije Google traži da mu pomognemo i definiramo kroz nekoliko parametara čemu služe određeni URL-ovi i koja je njihova svrha.
Opcijom How does this parameter affect page content određujemo svrhu parametra:
Iduća opcija Which URLs with this parameter should Googlebot crawl? određuje koji su URL-ovi s odabranim parametrom bitni i kako će ih Googlebot shvatiti. Možete birati između:
Ovisno o odabranim parametrima Googlebot će pokupiti URL-ove ili ih filtrirati.
Većina URL-ova ima više parametara u sebi. Recimo da ima kategorija, sortiraj i redoslijed: Taj URL bi mogao izgledati ovako:
U ovom slučaju možete definirati da Google indeksira sve URL-ove koji imaju parametar “kategorija”, “sortiraj” i “redoslijed” s sljedećim postavkama:
Googlebot će zatim te URL-ove indeksirati, ali sve ostale URL-ove koji nemaju te postavke neće. Nekoliko primjera URL-ova koje Googlebot neće indeksirati:
U prvom primjeru parametar ima vrijednost “veličina” umjesto “cijena” stoga se URL neće indeksirati. U drugom primjeru parametar “redoslijed” ima vrijednost “desc” umjesto “asc” stoga se URL neće indeksirati. Da bi se URL mogao indeksirati svi definirani uvjeti moraju odgovarati.
Na svojoj domeni imate dvije vrste stranica, one koje imaju jedinstven sadržaj i one koje ga nemaju. Znatno je više onih koje nemaju jedinstven sadržaj. Te koje nemaju utječu na rejting onih koje imaju. Blokirate li one koje nemaju, rejting onih koje imaju će biti jednostavno bolji, jer na takav način funkcionira algoritam tražilica.
Pozor: Alat je odličan, ali i tehnički zahtjevan i potencijalno opasan. Postavljanjem krivih postavki možete sami sebi naškoditi, jer će vam stranice ispasti iz indeksa. Ukoliko ne shvaćate o čemu je riječ ili niste tehnički dovoljno potkovani možda je bolje da samo ostavite Let Googlebot decide.
Sviđa vam se članak? Preporučite ga prijateljima i kolegama putem društvenih mreža:
Otkrijte naše najkvalitetnije članke koje ste možda propustili. Danas izdvajamo:
Hm, što ako imamo slučaj domena.com/bomboni/ i domena.com/bomboni-1/, a sadržaj je identičan, samo je na jednoj stranici plavi bombon, a na drugoj zeleni? Zar se to ne bi moglo riješiti rel=canonical?
Kako je ispravno koristiti paginator u ovom slučaju: imam 10 itema po stranici, ukupno oko 50 stranica, ali nonstop se puni novi sadržaj i broj se povećava. Novi sadržaj ide uvijek na prvu stranicu i potiskuje ostali sadržaj na druge stranice, tako da će nakon nekog vremena sadržaj stranice 20 preći na stranicu 21.
Ako google ne idnexira dovoljno brzo, traženi pojam će biti usmjeren na krivu stranicu. Crawler vidi kako se sadržaj mijenja.
Da li je bolje složiti paginator da novi sadržaj ide na zadnju stranicu?
Opcija koju opisujem u članku je samo još jedna od opcija kojom se možete nešto blokirati ili riješiti. Tu su i sve ostale tipa robots.txt, noindex meta tag, canonical itd.
U tvom primjeru ukoliko je na jednoj stranici plavi bonbon, a na drugoj zeleni, onda znači da su obje stranice bitne pa zašto bi ih blokao, umjesto toga napiši kakav opis i za zeleni i za plavi bonbon jer to su dvije različite stvari, kaj ne?
Da, ali je opis za bonbone isti, samo navodim različite primjere bonbona. Možda je bolji primjer /naziv/, /naziv-1/, /naziv-2/, /naziv-3/ – sadržaj je isti (nema smisla pisati da je jedan plavi, a drugi zeleni), samo je src atribut promijenjen. Na ovaj slučaj često nailazim. Zamisli da imaš web shop gdje prodaješ laptope i imaš od nekog modela 5-6 sliki iz različitog kuta i želiš ih prikazati “na posebnoj stranici”, tj. da se sajt refresha, poprimi drugi URL. :)
@Hrvoje kužim primjer, no nisi mi sasvim jasan da li želiš te stranice u indeksu ili ne? Ako ne želiš onda ih blokaš, ako želiš onda ti je bolje da imaš neki opis u protivnom ti slabe druge stranice jer nisu unique
@Vladimir složi klasičnu paginaciju kakvu ima svaki normalni sajt, ono što tebi fali je kvalitetnija i detaljnija kategorizacija ukoliko ti kako kažeš stvari “bježe”. Google će uvijek usmjeriti na pravu stranicu, ako je kriva neće nikog niti usmjeravati.
@Bruno – da, jasno. Ili se stavi da tražilice “odbiju” tu stranicu ili se stavi rel canonicial na “glavnu sliku”, u principu ispada na isto – tražilica će uvijek prikazivati samo “glavnu” stranicu. Bitno je da ne ispadne dupliciranje sadržaja, a i da se mijenja url (tj. dizu se pageviewsi) od svake pojedine slike. Hvala.
Šta se dešava ako želim da izbacim iz google index-a sve strane koje sadrže index.php?
Smem li da se igram sa parametrima?
Recimo, želim da bude indeksirano
http://www.mojsajt.com
a ne želim
http://www.mojsajt.com/index.php
Evo to se i kod vas lepo vidi, postoje i “index.php” verzije strane a i one “non-index.php”
http://www.netokracija.com/index.php/google-kako-blokiranjem-stranica-bolje-pozicionirati-domenu-15311/comment-page-1#comment-11645
http://www.netokracija.com/google-kako-blokiranjem-stranica-bolje-pozicionirati-domenu-15311/comment-page-1#comment-11645
Oba linka daju isti sadržaj :))