Image

ज्ञानधार → वेबसाइट लिंक विश्लेषण स्क्रिप्ट

[स्क्रिप्ट]
प्रकाशन तिथि: 20.10.2023

1. आंतरिक लिंक

किसी वेबसाइट पर लिंक का विश्लेषण करने की स्क्रिप्ट आपको सर्वर प्रतिक्रिया कोड पर एक रिपोर्ट प्राप्त करने और टूटे हुए लिंक की पहचान करने की अनुमति देती है जो 404 त्रुटि उत्पन्न करती है (पृष्ठ नहीं मिला)।

समय के साथ, किसी भी साइट में बदलाव आते हैं क्योंकि पेज और कनेक्टिंग लिंक जोड़े जाते हैं, और जो बहुत पहले जोड़े गए थे वे पुराने हो चुके होते हैं, जो विज़िटरों को अस्तित्वहीन पेजों पर ले जाता है। यह विशेष रूप से तब महत्वपूर्ण है जब आपके पास बिजनेस कार्ड वेबसाइट नहीं है, लेकिन बड़ी संख्या में पृष्ठों वाली वेबसाइट है।

सभी लिंक का विश्लेषण करने के बाद आप रिपोर्ट में देखेंगे कि किन पेजों पर टूटे हुए लिंक हैं और आप उन्हें ठीक कर पाएंगे।

2. बाहरी कड़ियाँ

सभी साइटें किसी न किसी रूप में लिंक द्वारा एक-दूसरे से जुड़ी हुई हैं। अन्य साइटों को दिए गए लिंक कुछ समय बाद पुराने हो जाते हैं। कारण अलग-अलग हो सकते हैं, उदाहरण के लिए, संरचना में बदलाव, एक नई साइट का निर्माण, या उसका पूरी तरह से बंद होना। चूँकि आप किसी तृतीय-पक्ष साइट पर सामग्री, स्क्रिप्ट या सेवा से लिंक कर रहे हैं, यह आप पर निर्भर नहीं है, इसे किसी अन्य स्वामी द्वारा नियंत्रित किया जाता है।

यह स्क्रिप्ट आपकी साइट से आने वाले बाहरी लिंक की उपलब्धता का भी विश्लेषण करती है। रिपोर्ट उन पृष्ठों को भी इंगित करेगी जिनमें पुराने लिंक हैं जो अब मौजूद नहीं हैं, जो आपको इसे देखने और सही करने का अवसर देगा।

3. स्क्रिप्ट स्थापित करना

हमारे उदाहरण में, हम डेबियन 12 पर आवश्यक पैकेज स्थापित करते हैं: php8.2 और सत्यापन स्क्रिप्ट स्वयं फ़ार प्रारूप में, जिसे हम लिनक्स कंसोल से चलाएंगे।

apt install php php-xml
apt install wget
wget https://github.com/dantleech/fink/releases/download/0.10.3/fink.phar

4. उपयोग उदाहरण

Domain.tld के बजाय अपना डोमेन निर्दिष्ट करें और यदि आवश्यक हो, तो रिपोर्ट फ़ाइल का पथ समायोजित करें।

php /root/fink.phar https://domain.tld -x0 -o /root/report.json

काम पूरा होने पर, स्क्रिप्ट एक रिपोर्ट तैयार करेगी। आप अपनी साइट के पृष्ठों पर दर्शाए गए लिंक को क्रॉल करने की पूरी प्रक्रिया का वास्तविक समय में भी निरीक्षण कर सकते हैं।

हमारे उदाहरण में, 5,000 पृष्ठों वाली एक साइट को 14 मिनट में संसाधित किया गया था, जो प्रस्तावित ऑनलाइन सेवाओं का उपयोग करने की तुलना में काफी तेज़ है।

4.1 आइए रिपोर्ट फ़ाइल का विश्लेषण करें

apt install jq
cat /root/report.json | jq -c '. | select(.status==404) | {url: .url, referrer: .referrer}' | jq

उदाहरण के अनुसार, फ़ाइल उन पृष्ठों को इंगित करेगी जिन पर टूटे हुए लिंक स्थित हैं:

404 - https://domain.tld/some/olddate-page/removed
      (found at https://domain.tld/about/agreement)

4.1.1 अच्छे लोगों को छोड़कर सब कुछ आउटपुट करें

cat /root/report.json | jq -c '. | select(.status!=200) | {url: .url, referrer: .referrer}' | jq

इस उदाहरण में, कोड 200 वाले पृष्ठों को छोड़कर, पाए गए सभी पृष्ठ प्रदर्शित किए जाएंगे।

सामग्री जोड़ने की आवृत्ति के आधार पर, लिंक की नियमित जांच और विश्लेषण आपकी साइट को आगंतुकों के लिए और भी अधिक आरामदायक बना देगा।





No Comments Yet