piatok 30. mája 2014

Google Crowling a indexacia stranok

Co znamena Google Crowling a indexacia



Google neustale hlada, prehladava, uklada a triedi vsetky indexovatelne stranky na webe, aby ich bolo mozne vyhladat cez vyhladavac. Proces pomocou ktoreho nachadza a prehladava stranky na internete sa vola Crowling. Google k tomu pouziva niekolko programov, ktore sa volaju Boti, alebo Roboti, ktori Crowluju cely web. Spomedz nich je najhlavnejsi Googlebot, ale existuju aj ine velmi dolezite, ktore napriklad prehladavaju blogy, vola sa Google Blog Bot. Proces ukladania stranok pre dalsie pouzitie vo vyhladavani a triedenie stranok do spravneho poradia sa vola indexovanie.

 Preco na tom zalezi?

Ak je stranka zle crawled (prehladana), alebo niektore stranky nie su zaindexovane, takato stranka bude nenajditelna pomocou vyhladavaca Google. V texte sa budem opierat o vyhladavac Google, ale rovnake alebo podobne pravidla platia aj pre ostatne vyhladavace ako su Bing, Yahoo.

Problemy a ich riesenie

V prvom rade je tazke zmerat indexaciu velkych stranok. Aby sme mali prehlad, ktore stranky boli indexovane je dobre pouzivat sluzbu Webmaster Tools. Ak je stranka naozaj velka, tak neexistuje cesta pomocou korej by sme zistili presnu indexaciu vsetkych stranok. Pomocou Google Analytics, vieme zistit ktore stranky dosahuju navstevnost, tiez doporucujem  pouzivat funkciu cache: vo vyhladavaci, pre kontrolu najdolezitejsich stranok a aj podruznych stranok, aby sme dostali prehlad ako je stranka indexovana.

Frekvencia prehladania stranky nie je kontrolovatelny faktor, ale su veci ktore na to mozu pozitivne vplyvat (zopar ich tu uvediem v poradi podla dolezitosti)

  • Vyznamnost domeny. Matt Cutts nedavno v rozhovore povedal, ze frekvencia a hlbka prehladania stranok je zavisla od PR stranky. (PR=PageRank)
  • Spatne odkazy (backlinks). PR je vypocitane na zaklade backlinks, ktore su zasadne pre indexaciu. Pokial stranka rychlo rastie, ale neziskava dostatocne mnozstvo spatnych odkazov, toto moze viest k tomu ze Google ohodnoti obsah ako nizsko kvalitny (garancia znizenia frekvencie crowlingu aj indexacie)
  • Deep Linking. Spatne odkazy na individualnych strankach (tzv. hlboke prepojenie) je efektivna cesta ako dosiahnut indexaciu stranok a uchovat ich v indexe Google. Interne odkazy na rovnake stranky moze tiez pomoct. Snazte sa, aby aspon vase najdolezitejsie stranky mali oba spomenute druhy. Je potrebne aby linky boli "nasledovatelne" (nesmu obsahovat atribut rel="nofollow")
  • Navigacia a hierarchia na stranke. V maximalnej moznej miere by mala byt pouzita jednoducha navigacia na stranke. (ako priklad by som uviedol stranku fanbase.com, vsetky kategorie sa nachadzaju v hornej casti obrazovky) To znamena za a) vytvorit cim menej podadresarov a subdomen a za b) vsetky dolezite stranky by mali byt dostupne na par klikov z hlavnej stranky (viac ako 3-4 kliky su uz problem).
  • XML sitemaps. Je nutnost. Tu je stranka ktora vam sitemap vyhotovi online: xml-sitemaps.com. Po tom ako si vytvorite sitemaps, je potrebne ho nahrat pomocou Webmaster Tools. Okrem sitemaps mozete pouzit aj funkciu Fetch as Googlebot vo Webmaster Tools, efekt je rovnaky ako odoslanie aktualneho sitemaps suboru.
  • Odstranenie duplicitneho obsahu. Vseobecne plati, ze duplicitny obsah na stranke nie je postihovany penalizaciou zo strany vyhladavaca aj napriek aktualizacii Panda, ale duplicitny obsah je povazovany za spam. Mali by ste udrzovat zdravy obsah na stranke a minimalizovat duplicitny obsah na stranke. Obzvlast na velkych strankach moze duplicita na roznych strankach sposobyt zlu indexaciu. Typickym prikladom zdovjenia obsahu je pri strankach ktore pouzivaju subdomenu, stranky bez a so subdomenou mozu mat rovnaky obsah. Da sa s tym vysporiadat pomocou URL canonization (pozri dalsi bod)
  • URL canonization. Znamena vytvorit jednotnu a pouzivatelsky jednoduchu URL pre kazdu stranku cim dame vediet vyhladavacu, ze URL je canonical. Priklad: link <link rel="canonical" href="http://example.com/canonical-url-example.html"> ktory sa vlozi medzi <head> a </head> tag. Mozeme si pomoct aj so sluzbou Webmaster Tools funkcia Display URLs as. Je to jednoduchsie ako pisat kod. 
  • Stabilita URL a jedinecnost stranky. Niektore aplikacie sposobuju zobrazenie rozneho obsahu pod tou istou URL adresou. Okrem toho title tag moze byt tiez generovany automaticky. Automaticke generovanie moze sposobit problem pri spravnom indexovani obsahu. Pre najlepsie vysledky musi byt obsaj a aj nadpis unikatny (kazda stranka by mala mat iny nazot title tag) a mal by byt zobrazeny na unikatnej URL adrese. Ak pouzivate rovnaky nadpis pre vsetky stranky Google moze tieto stranky povazovat za duplicitne a nebude ich indexovat. Upravte si nadpisy aby boli unikatne.
  • Originalny obsah. Je dolezite aby obsah na najdolezitejsich strankach bol originalny.
  • Aktualizacie, kanaly. Casta aktualizacia obsahu ma za nasledok castejsie prehliadanie stranky. Zalozenie RSS kanala maju priaznive ucinky na crowling.
  • Socialne stranky. Linky so sicialnych stranok aj napriek tomu ze su "nofollow" pomahaju robotom indexovat novy obsah na strankach. Vratane tlacidiel na zdielanie a podpora stranky na socialnych sietach moze viest k rychlejsej indexacii. 

Technicka poznamka

Najdolezitejsia aktualizacia systemu indexacie Google sa vola Google Caffeine, prve spustenie bolo v Auguste 2009 a dokoncenie indexacie bolo 8 juna 2010. System prehladavania stranok sa stal dynamickym, prehladava web po castiach a prakticky v realnom case. Od spustenia Caffeine sa do zretele dostali aj socialne siete Facebook, Twitter a v sucasnosti aj dalsie.

Video ako Matt Cutts rozprava o zakladoch crowlingu a indexacie a spomenul aj zopar zaujimavych detailov

štvrtok 29. mája 2014

Ako funguju Rich Snippets a ako ich vytvorit



Výsledky vyhladavania vo vyhladavaci Google sa stava cim dalej konkurencieschopnejsie. A preto Google predstavil Rich Snippets, je to novy sposob ako zobrazit efektivnejsie obsah stranky priamo vo vyhladavaci. Je to metoda ako sa odlisit od ostatnych podobnych vysledkov vo vyhladavani.

Rich Snippets (strukturovane uryvky) sa stavaju novymi klucovymi slovami. Tieto male detaily (kusky kodu, ktore zadate do html kodu) sposobia "pop" zobrazenie vaseho obsahu aby sa odlisil od ostatnych bez ohladu na to ktoru poziciu mate na prvej strane. Spravne pouzitie Rich Snippets je v dnesnej dobe nevyhnutne aby sme sa odlisili od konkurencie.

Co su v skutocnosti Rich Snippets


Rich Snippets su kusky kodu, ktore zabezpecia zobrazenie viacerych doplnkovych informacii priamo vo vyhladavani. Tieto kusky kodu, ktore su potrebne implementovat do kodu stranky sa volaju Rich Markup (standard najdete na Schema.org). Tento standard samozrejme podporuje aj spolocnost Google.

Ukazme si konkretny priklad

Predstavme si ze nasa stranka je o filme Avatar, na stranke mame link na trailer k filmu, informacie o reziserovi atd. HTML kod bude vyzerat nasledovne:

<div>
 <h1>Avatar</h1>
 <span>Director: James Cameron (born August 16, 1954)</span>
 <span>Science fiction</span>
 <a href="../movies/avatar-theatrical-trailer.html">Trailer</a>
</div>

Zacneme s identifikaciou sekcie o stranke ktora je o filme Avatar. Urobime to tak, ze pridame polozku itemscope do kodu, ktory uzatvara tuto sekciu, nasledovne:

<div itemscope>
  <h1>Avatar</h1>
  <span>Director: James Cameron (born August 16, 1954) </span>
  <span>Science fiction</span>
  <a href="../movies/avatar-theatrical-trailer.html">Trailer</a>
</div>

Pridanim polozky itemscope specifikujeme, ze kod html obsiahnuty v <div>...</div> tagu patri k danej sekcii.

A to nie je vsetko co potrebujeme specifikovat. Dalsim krokom bude specifikacia o aky druh polozky sa jedna. Druh polozky zadefinujeme pomocou atributu itemtype ktory vlozime hned za itemscope.

<div itemscope itemtype="http://schema.org/Movie">
  <h1>Avatar</h1>
  <span>Director: James Cameron (born August 16, 1954)</span>
  <span>Science fiction</span>
  <a href="../movies/avatar-theatrical-trailer.html">Trailer</a>
</div>

Takto definujeme ze obsah v <div> tagu je o filme, tak ako je definovany v hierarchii schema.org. Typy poloziek su definovane ako URL adresy, v tomto pripade http://schema.org/Movie.

Co mozeme este zadefinovat o filme Avatar? Filmy maju dalsie zaujimave informacie ako mena hercov, rezisera, hodnotenie. Definovat vlastnosti poloziek mozeme pomocou atributu itemprop. Napriklad ked chceme identifikovat rezisera filmu zadame atribut itemprop="director" do prvku ktory uzatvara meno rezisera. (Na stranke http://schema.org/Movies najdete vsetky atributy k tejto sekcii)

<div itemscope itemtype ="http://schema.org/Movie">
  <h1 itemprop="name">Avatar</h1>
  <span>Director: <span itemprop="director">James Cameron</span> (born August 16, 1954)</span>
  <span itemprop="genre">Science fiction</span>
  <a href="../movies/avatar-theatrical-trailer.html" itemprop="trailer">Trailer</a>
</div>

Vsimnite si, ze som pridal <span>...</span> tag, do ktoreho som doplnil itemprop atribut k danemu textu na stranke. <span> tag nemeni vzhlad stranky ako ju renderuje prehliadac, takze su vhodne html prvky pre pouzitie s atributmi itemprop.

Vyhladavace teraz vedia nie len to, ze dana URL je http://wwwavatarmovie.com, ale aj to ze informacie v nej su o filme Avatar, ktory reziroval James Cameron.

Pouzitie slovnika schema.org


Nie vsetky stranky su o filmoch v nasledovnej sekci vam ukazem kde a ako najdeme dalsie typy poloziek, ktore mozete pouzit na stranke. Na stranke schema.org najdeme aj dalsie typy z ktorych kazda ma svoje vlastne atributy a nastavenia, ktore mozu byt pouzite na specifikaciu co sa na danej stranke nachadza.

Tu je zoznam najpouzivanejsich typov:


  • Creative works: CreativeWork, Book, Movie, MusicRecording, Recipe, TVSeries
  • Embedded non-text objects: AudioObject, ImageObject, VideoObject
  • Event
  • Organization
  • Person
  • Place, LocalBusiness, Restaurant ...
  • Product, Offer, AggregateOffer
  • Review, AggregateRating

A tu si mozete pozriet vsetky ostatne typy.
Copyright 2014, Optimalizacia SEO

Čo je to Google Plus



Google Plus je zaujimava stranka svojim druhom. Vela rokov vyvoja a aj mnozstvo neuspesnych produktov nakoniec vyustilo v solidnu socialnu platformu Google+. V jednom celku ponuka mnozstvo mensich sluzieb, aby ponukla co najlepsi zazitok pre osobne ale aj profesionalne pouzitie.

Plati jedna vec a to ta, ze Google je hnacou silou evolucie internetu. Svoje chapadla maju skoro vsade a casto tvoria nove trendy pokial ide o nove funkcie. Na druhej strane ak nieco nevymyslia samy, vedia velmi rychlo zapracovat aj inovacie ktore vymyslel niekto iny.

Google+ je vydarena socialna platforma, ktora rastie zo dna na den. Pravidelna aktualizacia a uzivatelsky privetive prostredie ich dava na poprednu priecku v pyramide socialnych sieti.

Google Reklamy Nakupy

Nový program od spolocnosti Google 

Je pre e-shopy ktore chcu propagovat svoje produkty v sieti Google. Kedykolvek uzivatel vyhladavaca Google.sk zada dotaz ktory je relevantny k nejakej polozke v ucte Google Reklamy Nakupy automaticky sa zobrazia dane produkty vo vyhladavani aj s obrazkom s cenou a nazvom. Tato forma reklamy umozni obchodnikom reklamovat na Google.sk celu radu svojich produktov. Zobrazenie produktov je samozrejme zadarmo, zadavatel reklamy plati az pri kliknuti na dany produkt, po kliknuti bude zakaznik presmerovany do vaseho e-shopu.

Platíte iba za výsledky


To znamena, ze platite az v momente ked niekto klikne na vas produkt a tym padom pride na vas web.

Čo k tomu potrebujete


K zalozeniu reklamy s produktovymi informaciami je potrebny ucet Adwords a ucet Merchant Center tu je prievodca v ceskom jazyku: https://support.google.com/adwords/answer/2454022?hl=cs

Ak mate produkt, ktory chcete spopagovat a je to nieco co by ludia chceli (budu na neho klikat), tak je to dobra moznost ako priviest novych zakaznikov do vaseho e-shopu. Je tu moznost ako prevalcovat konkurenciu, hlavne pre nove e-shopy.

Moj tip: Predavate sedacky, dajte si zalezat aby fotka predavala, to je zaklad predaja cez internet. Zalozte si konto na Google Reklamy Nakupy, ak ho este nemate a urobte ponuku ktora sa neodmieta. To znamena dajte taku cenu, ktora zaujme. Nemusite cakat dlho a ludia sa k vam prekliknu.

Viac informacii sa docitate priamo na stranke Google Reklamy Nakupy

Zmeny v algoritmoch Google

Zmeny v algoritmoch vo vyhladavaci Google prebiahaju stale castejsie (az nikolko krat do roka). Kto sa v tom ma vyznat? Chceme pisat o vacsich zmenach ktore sa udiali od roku 2012 po sucastnost a zmenili zasadne vysledky vo vyhladavani. Vyhľadávač Google zacal od roku 2010 masivne menit svoje algoritmy a zacal penalizovat zle optimalizovane weby. Vsetko sa toci okolo unikatneho textu (bez duplicity) v obsahu stranky a odkazy na web stranku (relevantne a prirodzene odkazy so spravnym anchor textom).

1.1 Google Pinguin 1.0 - ktory bol spusteny v roku 2012 a zasiahol hlavne stranky ktore boli preoptimalizovane. Tykalo sa to tych webov ktore mali nakupene odkazy a dalsich webov s duplicitnym obsahom. Dalsia zasadna optimalizacia algoritmov prebehla koncom roku 2012 a postihla hlavne eshopy a vela z nich sa prepadlo vo vyhladavani.

1.2 Google Panda - vela aktualizacii prebehlo od roku 2011 a postihla vela webov s neoriginalnym obsahom

1.3 Google Pinguin 2.0 - bol spusteny zaciatkom roku 2013 a bola to este komplexnejsia optimalizacia algoritmu so zameranim na duplicitu obsahu, nakúpene odkazy v patickach (kde primarne nejde o navstevnost, ale o zdroj spatnych odkazov), penalizacia nekvalitnych PR clankov na nekvalitnych weboch a trestanie webov s vysokym obsahom klucovych slov.

1.4 Cesky Seznam - zmenil svoj algoritmus po vzore Google koncom roku 2012 a postupne sa ho snazi zlepsovat, aby sa vyrovnal vysledkom Google. Zatial sa mu nedari penalizovat preoptimalizovane weby a stranky s velkym poctom nekvalitnych spatnych odkazov.

1.5 Google Kolibrik - tato novinka v algoritme z roku 2013, ktora postihla 90% webov, takze hovorime o najvacsej uprave algoritmu, kde sa vyhladavac zameriava na tvar vyhladavacieho dotazu, ked je vyhladavanie mierene na celu vetu a nie len na klucove slova. Vyhladavac sa nezameriava na spatne odkazy a unikatny obsah ako predtym, ale ovplyvnuje ho vyhladanie a dolezitost long tail klucovych slov.