Avaleht
uus teema   vasta Tarkvara »  WWW »  sitemap ja robots märgi kõik teemad loetuks
märgi mitteloetuks
vaata eelmist teemat :: vaata järgmist teemat
Hinnavaatlus :: Foorum :: Uudised :: Ärifoorumid :: HV F1 ennustusvõistlus :: Pangalink :: Telekavad :: HV toote otsing
autor
sõnum Saada viide sõbrale.  :: Teata moderaatorile teata moderaatorile
otsing:  
Plondiin
HV kasutaja


liitunud: 13.12.2001




sõnum 15.06.2009 16:14:38 sitemap ja robots vasta tsitaadiga

Mul tekkisid sitemapi kasutamisel mõned küsimused:

1. Kas verified kood (tingimusel et veebileht ei kasuta sisuhaldust, vaid on index.html, kontakt.html jne) tuleb kopeerida kõikide lehekülgede metasse või piisab ainult index.html failist?

2. http://www.xml-sitemaps.com annab 4 erineva laiendiga faili.
Download un-compressed XML Sitemap http://www.xml-sitemaps.com/download/www.minusait.ee/sitemap.xml
Download ROR Sitemap http://www.xml-sitemaps.com/download/www.minusait.ee/ror.xml
Download HTML Sitemap http://www.xml-sitemaps.com/download/www.minusait.ee/sitemap.html
Download Sitemap in Text Format http://www.xml-sitemaps.com/download/www.minusait.ee/urllist.txt

Millisel juhul ja millist varianti neist neljast oleks tark kasutada?

3. Milline Verification meetod on parem valida (google webmaster tools) -milleks on Meta tag parem ja milleks on HTML file parem?

4. Crawler access(google webmaster tools) annab võimaluse Generate robots.txt
Seal on mitmeid valikuid, kuid mida ma pean sealt valima?
Vaikimisi annab robots.txt sisuks niimoodi:
User-Agent: *
Allow: /


Kas sellest piisab?


5. Kuidas ma lisan sitemapi NETI-sse http://www.neti.ee/ping - ehk kas see on Õige, kui lisan sinna reale http://www.minusait.ee/sitemap.xml ?
tagasi üles
vaata kasutaja infot saada privaatsõnum
mikk36
HV Guru
mikk36

liitunud: 21.02.2004




sõnum 15.06.2009 17:01:58 vasta tsitaadiga

1. Html lehe puhul kasuta pigem eraldi html faili kaudu "verify" kontrolli.
2. Kasuta sellist mis sulle meeldib ülesehituselt enim ja on lihtsaim sulle aru saada.
3. Html faili puhul ei pea sa iga html faili muutma, seega sinu seisu puhul on see hulga mõistlikum variant, lisaks ei tea keegi teine sellest failist kui Google, meta tag on ka kõigile teistele näha.
4. Crawler access (robots.txt) on kontrollimaks mis robotid on lubatud su lehel ja mis mitte, ilma robots.txt failita on kõik lubatud, võid ka ise tekitada robots.txt faili, mis lubab kõik robotid (halbu roboteid ei takista see, kuna siis robot lihtsalt eirab robots.txt faili).
Kommentaarid: 85 loe/lisa Kasutajad arvavad:  :: 0 :: 2 :: 78
tagasi üles
vaata kasutaja infot saada privaatsõnum
Plondiin
HV kasutaja


liitunud: 13.12.2001




sõnum 16.06.2009 12:35:48 vasta tsitaadiga

1. selge, tähendab kui "verify" kontrolli puhul koodi kasutada, siis peaks selle ikka kopeerima kõikidele html lehtekülgedele sisse. Aga kui on eraldi Html fail google78u25a7c6b8e2cab.html siis sellest pääseb?

Kas sisuhaldusel (joomla) põhineva lehe puhul on "verify" kontrolli vahet kas kood või eraldi html leht?



2. aga kumb on otsimootoritele parem, kas (http://www.xml-sitemaps.com kaudu loodud) sitemap.html või sitemap.xml ?
Vaatasin, et sitemap.html faili on pandud lehekülje <title> vahel olevad sõnad koos täpitähtedega, nt Särgid õmblemine müük
aga sitemap.xml sisse on pandud html faili nimi <loc>http://www.minusait.ee/sargid-omblemine-myyk.html</loc>

kas tõesti pole siin sitemap.html ja sitemap.xml sisudes otsingumootorite jaoks mingit vahet?

Saan aru,et sitemap.xml fail tuleb iga kord uuesti luua ja üles laadida kui veebilehele on täiendusi tehtud (uued leheküljed, lehtede nimede muutmine)? Kas see asi kuidagi automaatselt ei võiks käia?



4. Milline on nn eeskujulikult koostatud robots.txt?
Millised on pahad robotid ja kas nii on õige kirjutada

User-agent: paharobot1
Disallow: /

User-agent: paharobot2
Disallow: /



mikk36 kirjutas:
1. Html lehe puhul kasuta pigem eraldi html faili kaudu "verify" kontrolli.
2. Kasuta sellist mis sulle meeldib ülesehituselt enim ja on lihtsaim sulle aru saada.
3. Html faili puhul ei pea sa iga html faili muutma, seega sinu seisu puhul on see hulga mõistlikum variant, lisaks ei tea keegi teine sellest failist kui Google, meta tag on ka kõigile teistele näha.
4. Crawler access (robots.txt) on kontrollimaks mis robotid on lubatud su lehel ja mis mitte, ilma robots.txt failita on kõik lubatud, võid ka ise tekitada robots.txt faili, mis lubab kõik robotid (halbu roboteid ei takista see, kuna siis robot lihtsalt eirab robots.txt faili).
tagasi üles
vaata kasutaja infot saada privaatsõnum
mikk36
HV Guru
mikk36

liitunud: 21.02.2004




sõnum 16.06.2009 12:47:53 vasta tsitaadiga

1. html fail on üldjuhul lihtsam ja mugavam variant, toimib alati, lisaks ei kanta igale kliendile (külastajale) kasutult seda verify koodi kaasa, hoiab andmemahtu kokku.
2. kui otsimootor aru saab sitemapist, siis ei ole vahet, kindluse mõttes võid sitemap.xml'i teed ka minna.
Jah, selle sisu tuleb uuendada, CMS'i puhul saab seda vastavalt andmebaasile genereerida, html failide puhul pead tõenäoliselt käsitsi uuendama.
4. http://www.google.com/support/webmasters/bin/answer.py?answer=35237
Kommentaarid: 85 loe/lisa Kasutajad arvavad:  :: 0 :: 2 :: 78
tagasi üles
vaata kasutaja infot saada privaatsõnum
asjameez
Kreisi kasutaja
asjameez

liitunud: 10.12.2006




sõnum 04.03.2010 13:58:20 vasta tsitaadiga

Kuidas kustutada sitemape ALL kategooriast?



Kas need kaovad ise mingi aja pärast ära, kui /blog kataloog kogu sisuga on kustutatud? Tulu hunnik 404 crawl erroreid juurde sellepärast, et mõne tunni hoidsin ühte ajutist portaali seal üleval.

Teine küsimus on üldiselt 404 crawl errorite kohta. Mul neid kogunenud juba üle 20, kas ka need kaovad mingi aja möödudes ära? Sest võin julgelt öelda, et praegusel ajahetkel on kõik vigased lingid kustutatud või parandatud.
Kommentaarid: 63 loe/lisa Kasutajad arvavad:  :: 0 :: 0 :: 61
tagasi üles
vaata kasutaja infot saada privaatsõnum
mikk36
HV Guru
mikk36

liitunud: 21.02.2004




sõnum 04.03.2010 14:06:04 vasta tsitaadiga

asjameez, 404'd peaksid vast ära kaduma kui sinna lingid enam ei vii.
Kommentaarid: 85 loe/lisa Kasutajad arvavad:  :: 0 :: 2 :: 78
tagasi üles
vaata kasutaja infot saada privaatsõnum
näita postitusi alates eelmisest:   
uus teema   vasta Tarkvara »  WWW »  sitemap ja robots
[vaata eelmist teemat] [vaata järgmist teemat]
 lisa lemmikuks
näita foorumit:  
 ignoreeri teemat 
sa ei või postitada uusi teemasid siia foorumisse
sa ei või vastata selle foorumi teemadele
sa ei või muuta oma postitusi selles foorumis
sa ei või kustutada oma postitusi selles foorumis
sa ei või vastata küsitlustele selles foorumis
sa ei saa lisada manuseid selles foorumis
sa võid manuseid alla laadida selles foorumis



Hinnavaatlus ei vastuta foorumis tehtud postituste eest.