Search Engine Crawling Guidelines (Detailed with Examples)



๐Ÿ“˜ Search Engine Crawling Guidelines (Detailed with Examples)


๐Ÿ”น A. Basic Crawling Guidelines (1–10)

  1. Website accessible เคฐเค–ें

    • เคฎเคคเคฒเคฌ: Server เคนเคฎेเคถा up เค”เคฐ fast เคนोเคจा เคšाเคนिเค।

    • Example: เค…เค—เคฐ server เคฌाเคฐ-เคฌाเคฐ down เคนोเค—ा, Googlebot pages crawl เคจเคนीं เค•เคฐेเค—ा।

  2. Robots.txt เคธเคนी เคฐเค–ें

    • Example:

      User-agent: *
      Disallow: /admin/
      Allow: /
      

      เค‡เคธเคธे admin page block เคฐเคนेเค—ा เค”เคฐ เคฌाเค•ी crawl เคนोंเค—े।

  3. Internal linking strong เคฐเค–ें

    • Example: Homepage → Category → Subcategory → Product.

    • เค‡เคธเคธे bots เคนเคฐ page เคคเค• เคชเคนुँเคšेंเค—े।

  4. XML Sitemap เคฌเคจाเคं

    • Example: sitemap.xml file เคœिเคธเคฎें เคธเคญी indexable URLs เคนों।

    • เค‡เคธे Google Search Console เคฎें submit เค•เคฐें।

  5. Duplicate content avoid เค•เคฐें

    • Example: เค…เค—เคฐ example.com/page เค”เคฐ example.com/page?ref=123 เคฆोเคจों เคนैं → canonical main URL เคชเคฐ เคฒเค—ाเคँ।

  6. Mobile-friendly design

    • Example: Responsive design → เคฎोเคฌाเค‡เคฒ เคชเคฐ site cut เคจा เคนो।

  7. Website speed improve เค•เคฐें

    • Example: Images compress เค•เคฐें, caching use เค•เคฐें, CDN เคฒเค—ाเคँ।

  8. Crawl budget เค•ा เคง्เคฏाเคจ เคฐเค–ें

    • Example: 1000 low-quality pages เคนเคŸाเค•เคฐ เคธिเคฐ्เคซ 200 high-quality pages index เค•เคฐें।

  9. HTTPS (Secure site)

    • Example: http://example.com เค•ो 301 redirect เค•เคฐเค•े https://example.com เค•เคฐें।

  10. Regular updates เค•เคฐें

  • Example: เคนเคฐ เคนเคซ्เคคे blog update → Googlebot เคฌाเคฐ-เคฌाเคฐ crawl เค•เคฐेเค—ा।


๐Ÿ”น B. Advanced Crawling Guidelines (11–20)

  1. JavaScript เคธเคนी handle เค•เคฐें

  • Example: Product details เคธिเคฐ्เคซ JS เคธे load เคจा เคนों, HTML fallback เคญी เคฆें।

  1. Clean URL structure

  • Example:
    example.com/product?id=123&color=blue
    example.com/product/blue-shirt

  1. Orphan pages avoid เค•เคฐें

  • Example: เคเคธा page เคœो เค•िเคธी internal link เคธे เคœुเคก़ा เคจเคนीं → Googlebot discover เคจเคนीं เค•เคฐ เคชाเคเค—ा।

  1. Infinite scroll crawl-friendly เคฌเคจाเคं

  • Example: “Load more” button เค•े เคธाเคฅ paginated URLs เคญी เคฆें (/page/2, /page/3)।

  1. Thin content pages เคนเคŸाเคँ

  • Example: เคธिเคฐ्เคซ 50 words เคตाเคฒा product page → delete เคฏा merge เค•เคฐें।

  1. Redirect chains minimize เค•เคฐें

  • Example:
    A → B → C → D
    A → D (direct redirect)

  1. Faceted navigation control เค•เคฐें

  • Example: Filters (?size=M&color=red) canonical main category เคชเคฐ เค•เคฐें।

  1. Server logs monitor เค•เคฐें

  • Example: Logs เคธे เคฆिเค–े เค•ि Googlebot เคฌाเคฐ-เคฌाเคฐ /cart crawl เค•เคฐ เคฐเคนा → robots.txt เคธे block เค•เคฐें।

  1. Hreflang tags (multi-language sites)

  • Example:

    <link rel="alternate" hreflang="en" href="example.com/en/page" />
    <link rel="alternate" hreflang="fr" href="example.com/fr/page" />
    
  1. Structured data add เค•เคฐें

  • Example:

    {
      "@context": "https://schema.org",
      "@type": "Product",
      "name": "Red Shirt",
      "price": "499"
    }
    

๐Ÿ”น C. Pro Crawling Guidelines (21–30)

  1. Crawl-delay avoid เค•เคฐें

  • Example: crawl-delay: 10 เคฎเคค เคฒเค—ाเคँ, เคตเคฐเคจा crawl slow เคนो เคœाเคเค—ा।

  1. Pagination tags use เค•เคฐें

  • Example:

    <link rel="next" href="page2.html" />
    <link rel="prev" href="page1.html" />
    
  1. Canonicalization เคธเคนी เคฐเค–ें

  • Example: Duplicate color pages เคนों เคคो canonical main product page เคชเคฐ เค•เคฐें।

  1. URL parameters block เค•เคฐें

  • Example: example.com/page?utm=123 เค•ो GSC parameters settings เคธे block เค•เคฐें।

  1. HTML Sitemap เคฌเคจाเคं

  • Example: example.com/sitemap → เคธเคญी important pages เค•ी list।

  1. Consistent URL versions เคฐเค–ें

  • Example: เคธिเคฐ्เคซ https://www.example.com run เค•เคฐें, เคฌाเค•ी versions redirect เคนों।

  1. Image/Video crawling optimize เค•เคฐें

  • Example: Image sitemap เคฌเคจाเคं:

    <image:image>
      <image:loc>https://example.com/img1.jpg</image:loc>
    </image:image>
    
  1. Crawl traps avoid เค•เคฐें

  • Example: Infinite calendar links → robots.txt เคธे block เค•เคฐें।

  1. Crawl stats monitor เค•เคฐें

  • Example: GSC → Settings → Crawl stats → เคฆेเค– เคธเค•เคคे เคนैं เค•िเคคเคจे pages crawl เคนुเค।

  1. Regular audit tools use เค•เคฐें

  • Example: Screaming Frog เคธे site crawl เค•เคฐเค•े broken links, redirect chains detect เค•เคฐें।


๐Ÿ”น D. Expert Crawling Guidelines (31–40)

  1. Soft 404 fix เค•เคฐें

  • Example: “No products found” page เค•ो 200 status เค•ी เคฌเคœाเคฏ 404 return เค•เคฐें।

  1. Duplicate subdomains avoid เค•เคฐें

  • Example: blog.example.com เค”เคฐ www.example.com/blog → เคเค• เคนी เคฐเค–ें।

  1. Consistent menus

  • Example: เคนเคฐ page เคชเคฐ header menu same เคฐเค–ें เคคाเค•ि crawl path consistent เคนो।

  1. CSS/JS block เคจा เค•เคฐें

  • Example:
    ❌ Robots.txt → Disallow: /css/
    ✅ CSS allow เค•เคฐें।

  1. Server codes เคธเคนी เคฐเค–ें

  • Example: Old product 410 code เคฆे, เคคाเค•ि crawler เคธเคฎเคे permanent เคนเคŸ เค—เคฏा।

  1. Duplicate PDFs/docs minimize เค•เคฐें

  • Example: 100 PDFs same content → เคธिเคฐ्เคซ 1 index เค•เคฐเคตाเคँ।

  1. CDN เคธเคนी handle เค•เคฐें

  • Example: CDN เคธे serve เคนोเคจे เคชเคฐ เคญी example.com canonical set เค•เคฐें।

  1. Crawl frequency check เค•เคฐें

  • Example: เค…เค—เคฐ blog daily update เคนै เคฒेเค•िเคจ Googlebot monthly crawl เค•เคฐ เคฐเคนा → issue เคนै।

  1. Pagination canonical

  • Example: Page 2 เค•ा canonical เค–ुเคฆ เคชเคฐ เคนी เคนोเคจा เคšाเคนिเค, Page 1 เคชเคฐ เคจเคนीं।

  1. Topical authority build เค•เคฐें

  • Example: เค…เค—เคฐ เค†เคชเค•ी site “SEO” เคชเคฐ เคนै → SEO tools, SEO guides, SEO updates เคธเคฌ content เคฌเคจाเคं।


๐Ÿ”น E. Master Crawling Guidelines (41–50)

  1. Headless browser crawl test

  • Example: Chrome DevTools → mobile view เคฎें เคฆेเค–ें content เคธเคนी load เคนो เคฐเคนा เคฏा เคจเคนीं।

  1. Canonical vs Noindex conflict avoid เค•เคฐें

  • Example: เคเค• page เคชเคฐ canonical main page เคชเคฐ เค”เคฐ เคธाเคฅ เคนी noindex → wrong setup।

  1. AMP handling เคธเคนी เค•เคฐें

  • Example: AMP page canonical main version เคชเคฐ point เค•เคฐे।

  1. Log file analysis เค•เคฐें

  • Example: เคชเคคा เคšเคฒा Googlebot เคธिเคฐ्เคซ homepage crawl เค•เคฐ เคฐเคนा, เคฌाเค•ी ignore → links fix เค•เคฐें।

  1. Sitemap priority set เค•เคฐें

  • Example: Homepage priority = 1.0, Blog post = 0.8, Privacy policy = 0.2.

  1. Content depth limit เค•เคฐें

  • Example: Product page homepage เคธे max 3 clicks เคฎें accessible เคนो।

  1. Dynamic rendering for JS-heavy sites

  • Example: Angular site → prerender.io เคธे HTML version serve เค•เคฐें।

  1. Clean internal links

  • Example: Internal link → example.com/page (clean), เคจा เค•ि example.com/page?ref=abc

  1. International targeting

  • Example: India users → example.in, US users → example.com/us.

  1. AI-based crawl optimization tools

  • Example: Botify, Deepcrawl crawl budget waste detect เค•เคฐเคคे เคนैं।


๐Ÿ”น F. Enterprise Crawling Guidelines (51–60)

  1. Multiple sitemaps + index

  • Example: 200k pages เคตाเคฒी site → 4 sitemaps + 1 sitemap index।

  1. Priority content HTML top เคชเคฐ เคฐเค–ें

  • Example: H1, intro, product info HTML เคฎें เคชเคนเคฒे load เคนो, footer เคฌाเคฆ เคฎें।

  1. JS bundling optimize เค•เคฐें

  • Example: 5 เค…เคฒเค— JS files เค•ी เคฌเคœाเคฏ เคเค• เคนी minified file load เค•เคฐें।

  1. Infinite filters block เค•เคฐें

  • Example: Robots.txt →

    Disallow: /*?color=
    
  1. Breadcrumbs navigation เคฆें

  • Example: Home > Electronics > Mobile > iPhone.

  1. Crawl trap alerts

  • Example: Tool เคธे alert เค•ि ?sessionid=123 type URLs crawl เคนो เคฐเคนे।

  1. Freshness signals เคฆें

  • Example: Sitemap lastmod date update เค•เคฐें เคœเคฌ เคญी content เคฌเคฆเคฒे।

  1. Content pruning เค•เคฐें

  • Example: 10k low-traffic pages เคนเคŸाเคँ → crawl budget improve เคนोเค—ा।

  1. Internal link equity optimize เค•เคฐें

  • Example: Homepage เคธे top products เค•ो deep link เค•เคฐें।

  1. Pre-rendering for bots & social

  • Example: React site → pre-rendered HTML version เคฆें เคคाเค•ि bots เค†เคธाเคจी เคธे crawl เค•เคฐें।



Comments

Popular posts from this blog

What is digital Marketing

On-Page SEO Kya Hai? – เคชूเคฐी เคœाเคจเค•ाเคฐी ๐Ÿš€

What is SEO (Search Engine Optimization)?