Kaip blokuoti paieškos variklius (su nuotraukomis)

Turinys:

Kaip blokuoti paieškos variklius (su nuotraukomis)
Kaip blokuoti paieškos variklius (su nuotraukomis)

Video: Kaip blokuoti paieškos variklius (su nuotraukomis)

Video: Kaip blokuoti paieškos variklius (su nuotraukomis)
Video: How to Open ODS File OpenDocument in Excel 2021 2024, Gegužė
Anonim

Paieškos varikliuose yra robotai, dar žinomi kaip vorai ar robotai, kurie tikrina ir indeksuoja tinklalapius. Jei jūsų svetainė ar puslapis yra kuriamas arba juose yra neskelbtino turinio, galbūt norėsite užblokuoti robotus, kad jie negalėtų tikrinti ir indeksuoti jūsų svetainės. Sužinokite, kaip užblokuoti visas svetaines, puslapius ir nuorodas naudojant robots.txt failus ir užblokuoti konkrečius puslapius bei nuorodas naudojant HTML žymas. Skaitykite toliau, kad sužinotumėte, kaip užblokuoti tam tikrų robotų prieigą prie jūsų turinio.

Žingsniai

1 būdas iš 2: paieškos sistemų blokavimas naudojant robots.txt failus

576315 1
576315 1

Žingsnis 1. Supraskite robots.txt failus

„Robots.txt“failas yra paprastas arba ASCII tekstinis failas, kuris informuoja paieškos variklius, ką jiems leidžiama pasiekti jūsų svetainėje. Failų ir aplankų, išvardytų faile robots.txt, paieškos varikliai negali tikrinti ir indeksuoti. Jums gali prireikti failo robots.txt, jei:

  • Norite užblokuoti konkretų turinį iš paieškos variklių.
  • Kuriate tiesioginę svetainę ir nesate pasiruošę, kad paieškos vorai nuskaitytų ir indeksuotų svetainę
  • Norite apriboti prieigą prie gerbiamų robotų.
576315 2
576315 2

Žingsnis 2. Sukurkite ir išsaugokite ir robots.txt failą

Norėdami sukurti failą, paleiskite paprasto teksto arba kodo redaktorių. Išsaugokite failą kaip: robots.txt. Failo pavadinimas turi būti rašomas mažosiomis raidėmis.

  • Nepamirškite „s“.
  • Išsaugodami failą, pasirinkite plėtinį „.txt“. Jei naudojate „Word“, pasirinkite parinktį „Paprastas tekstas“.
576315 3 1
576315 3 1

Žingsnis 3. Parašykite visiškai neleidžiamą failą robots.txt

Galima užkirsti kelią visiems gerbiamiems paieškos varikams tikrinti ir indeksuoti jūsų svetainę naudojant „visiškai neleisti“failą robots.txt. Į teksto failą įrašykite šias eilutes:

    Vartotojo agentas: * Neleisti: /

  • Nerekomenduojama naudoti „visiškai neleidžiamo“failo robots.txt. Kai robotas, pvz., „Bingbot“, skaito šį failą, jis neindeksuos jūsų svetainės ir paieškos variklis nerodys jūsų svetainės.
  • Vartotojų agentai: tai dar vienas terminas paieškos varikliams ar robotams
  • *: žvaigždutė reiškia, kad kodas taikomas visiems vartotojo agentams
  • Neleisti: /: priekinis brūkšnys rodo, kad visa svetainė yra nenaudojama robotams
576315 4 1
576315 4 1

Žingsnis 4. Parašykite sąlyginio leidimo failą robots.txt

Užuot užblokavę visus robotus, apsvarstykite galimybę blokuoti tam tikrus vorus iš tam tikrų jūsų svetainės sričių. Įprastos sąlyginio leidimo komandos apima:

  • Užblokuokite konkretų robotą: pakeiskite žvaigždutes šalia Vartotojo atstovas su googlebot, googlebot-naujienos, googlebot vaizdas, bingbot, arba teoma.
  • Užblokuokite katalogą ir jo turinį:

    User-agent: * Neleisti: /sample-directory /

  • Blokuoti tinklalapį:

    Vartotojo agentas: * Neleisti: /private_file.html

  • Blokuoti vaizdą:

    User-agent: googlebot-image Neleisti: /images_mypicture.jpg

  • Blokuoti visus vaizdus:

    User-agent: googlebot-image Neleisti: /

  • Blokuoti konkretų failo formatą:

    Vartotojo agentas: * Neleisti: /p*.gif$

576315 5
576315 5

5 žingsnis. Skatinkite robotus indeksuoti ir tikrinti jūsų svetainę

Daugelis žmonių nori pasveikinti paieškos variklius, o ne užblokuoti, nes nori, kad visa jų svetainė būtų indeksuojama. Norėdami tai padaryti, turite tris galimybes. Pirma, galite atsisakyti kurti failą robots.txt-kai robotas neranda robots.txt failo, jis ir toliau tikrins ir indeksuos visą jūsų svetainę. Antra, galite sukurti tuščią failą robots.txt-robotas suras failą robots.txt, atpažins, kad jis tuščias, ir toliau tikrins bei indeksuos jūsų svetainę. Galiausiai galite parašyti visiškai leidžiamą failą robots.txt. Naudokite kodą:

    Vartotojo agentas: * Neleisti:

  • Kai robotas, pvz., „Googlebot“, skaito šį failą, jis drąsiai apsilankys visoje jūsų svetainėje.
  • Vartotojų agentai: tai dar vienas terminas paieškos varikliams ar robotams
  • *: žvaigždutė reiškia, kad kodas taikomas visiems vartotojo agentams
  • Neleisti: tuščia disallow komanda rodo, kad visi failai ir aplankai yra prieinami
576315 6
576315 6

Žingsnis 6. Išsaugokite txt failą savo domeno šaknyje

Parašę failą robots.txt, išsaugokite pakeitimus. Įkelkite failą į savo svetainės šakninį katalogą. Pavyzdžiui, jei jūsų domenas yra www.yourdomain.com, įdėkite failą robots.txt į www.yourdomain.com/robots.txt.

2 metodas iš 2: paieškos sistemų blokavimas naudojant meta žymas

576315 7
576315 7

Žingsnis 1. Supraskite HTML robotų meta žymas

„Robots“metažyma leidžia programuotojams nustatyti robotų ar paieškos variklių parametrus. Šios žymos naudojamos blokuoti robotams indeksuoti ir tikrinti visą svetainę ar tik jos dalis. Taip pat galite naudoti šias žymas, kad neleistumėte konkrečiam paieškos varikliui indeksuoti jūsų turinio. Šios žymos rodomos jūsų HTML failo galvutėje.

Šį metodą dažniausiai naudoja programuotojai, neturintys prieigos prie svetainės šakninio katalogo

576315 8
576315 8

Žingsnis 2. Blokuoti robotus iš vieno puslapio

Galima užblokuoti visus robotus, kad jie neindeksuotų puslapio ir nesektų puslapio nuorodų. Ši žyma dažniausiai naudojama, kai kuriama tiesioginė svetainė. Kai svetainė bus baigta, primygtinai rekomenduojama pašalinti šią žymą. Jei nepašalinsite žymos, jūsų puslapis nebus indeksuojamas arba jo nebus galima ieškoti paieškos sistemose.

  • Galite neleisti robotams indeksuoti puslapio ir sekti bet kurias nuorodas:
  • Galite neleisti visiems robotams indeksuoti puslapio:
  • Galite neleisti visiems robotams sekti puslapio nuorodų:
576315 9
576315 9

Žingsnis 3. Leiskite robotams indeksuoti puslapį, bet nesekite jo nuorodų

Jei leisite robotams indeksuoti puslapį, puslapis bus indeksuojamas; jei neleisite vorams sekti nuorodų, nuorodos kelias iš šio konkretaus puslapio į kitus puslapius nutrūks. Įveskite šią kodo eilutę į antraštę:

576315 10
576315 10

Žingsnis 4. Leiskite paieškos vorams sekti nuorodas, bet neindeksuoti puslapio

Jei leisite robotams sekti nuorodas, nuorodos kelias iš šio konkretaus puslapio į kitus puslapius liks taktiškas; jei apribosite jiems indeksuoti puslapį, jūsų tinklalapis nebus rodomas indekse. Įveskite šią kodo eilutę į antraštę:

576315 11
576315 11

Žingsnis 5. Užblokuokite vieną išeinančią nuorodą

Jei norite paslėpti vieną nuorodą puslapyje, įdėkite rel žymę nuorodos žymoje. Galbūt norėsite naudoti šią žymą, kad užblokuotumėte nuorodas kituose puslapiuose, nukreipiančiuose į konkretų puslapį, kurį norite užblokuoti.

    Įterpti nuorodą į užblokuotą puslapį

576315 12
576315 12

Žingsnis 6. Užblokuokite konkretų paieškos variklį

Užuot blokavę visus robotus iš savo tinklalapio, galbūt norėsite neleisti vienam robotui tikrinti ir indeksuoti puslapio. Norėdami tai padaryti, metažyme „robotą“pakeiskite konkretaus roboto pavadinimu. Pavyzdžiai: googlebot, googlebot-naujienos, googlebot vaizdas, bingbot, ir teoma.

576315 13
576315 13

Žingsnis 7. Skatinkite robotus tikrinti ir indeksuoti jūsų puslapį

Jei norite užtikrinti, kad jūsų puslapis bus indeksuojamas ir bus laikomasi jo nuorodų, galite įterpti stebėjimo leidimą meta „robotas“ pažymėti antraštėje. Naudokite šį kodą:

Rekomenduojamas: