सेमल्ट आपकी साइट से नकली ट्रैफ़िक को हटाने के लिए एक गाइड का खुलासा करता है

रेफरल स्पैम स्पैम्बोट्स का उत्पाद है जो सीधे Google Analytics को नकली ट्रैफ़िक भेजता है, इस प्रकार उत्पन्न ट्रैफ़िक रिपोर्ट में प्रदर्शित होता है। यदि आप जीए रिपोर्ट में उन्हें साइट के लिए सटीक आंकड़े प्राप्त करने के लिए रेफरल स्पैम को हटाने के लिए कार्रवाई करते हैं।
सेमेटल डिजिटल सर्विसेज के सीनियर कस्टमर सक्सेस मैनेजर आर्टेम एबियोग्राफर ने इस संबंध में कुछ व्यावहारिक मुद्दे साझा किए।
बॉट क्या है?
बॉट्स ऐसे प्रोग्राम हैं जिन्हें टास्क को जल्दी और सटीकता के साथ दोहराने के लिए विकसित किया जाता है। शुरू में बॉट्स को खोज इंजन द्वारा इंटरनेट पर पृष्ठों को अनुक्रमित करने के लिए रखा गया था। दुर्भावनापूर्ण इरादे वाले लोगों ने वर्षों में बॉट्स के उपयोग को क्लिकों द्वारा धोखाधड़ी करने, साइट की सामग्री को स्थानांतरित करने, मैलवेयर वितरित करने, ईमेल पते संचित करने और साइट ट्रैफ़िक को ओवरस्टैट करने में मदद करने के लिए अपनाया।
सुरक्षित और दुर्भावनापूर्ण बॉट
एक अच्छा बॉट का एक उदाहरण Googlebot है जो उपयोगकर्ताओं के लिए पृष्ठों को क्रॉल और अनुक्रमित करता है। खोज बॉट जावास्क्रिप्ट (उनमें से ज्यादातर) नहीं चलाते हैं। फिर भी, जो लोग इसका उपयोग करते हैं, वे जीए रिपोर्टों पर खुद को प्रकट करते हैं जो मीट्रिक प्रतिनिधित्व को चोट पहुंचा सकते हैं। यदि वे जावास्क्रिप्ट नहीं चलाते हैं, तो रिपोर्ट पर कोई प्रभाव नहीं पड़ता है, लेकिन सर्वर लॉग पर दिखाई देता है। हालाँकि, वे लोडिंग गति को प्रभावित कर सकते हैं क्योंकि वे सर्वर संसाधनों का उपयोग करते हैं। सुरक्षित बोट्स robots.txt में निहित निर्देशों का पालन करते हैं। दूसरी ओर दुर्भावनापूर्ण बॉट, इन दिशानिर्देशों को ओवरराइड करने के लिए विभिन्न रणनीतियों को लागू करते हैं।
स्पैम बॉट

उनका प्राथमिक उद्देश्य अधिक से अधिक वेबसाइटों का दौरा करना है, और पता लगाने से बचने के लिए फेस रेफर हेडर के साथ स्पैम भेजना है। नकली रेफ़र हेडर उस साइट पर एक पुनर्निर्देशित लिंक एम्बेड करता है जिसे वे बढ़ावा देना चाहते हैं। ऐसे बॉट से HTTP अनुरोध Google द्वारा सर्वर लॉग्स और इंडेक्स में दिखाई देते हैं। यह सर्वर लॉग में प्रकट होने पर साइट पर एक बैकलिंक के रूप में कार्य करता है। Google ने सर्वर एल्गोरिदम से डेटा को इंडेक्स नहीं करने के लिए अपने एल्गोरिदम में बदलाव किया है, इस प्रकार स्पैम्बोट डेवलपर्स द्वारा प्रयासों को विफल किया है। जावास्क्रिप्ट-रन स्पैम बॉट जीए फिल्टर के माध्यम से अपना रास्ता बना सकते हैं, यही वजह है कि वे रिपोर्टों में दर्शाते हैं।
botnet
बोटनेट में स्पैमर द्वारा नियंत्रित नेटवर्क बनाने के लिए कई संक्रमित कंप्यूटर शामिल हैं। यह किसी एक वेबसाइट पर हमला करने के लिए अलग-अलग आईपी का उपयोग करता है। बॉटनेट जितना बड़ा होगा, घुसपैठ की सफलता दर उतनी ही अधिक होगी। एक बोटनेट से ट्रैफ़िक प्रत्यक्ष ट्रैफ़िक के रूप में प्रकट होता है क्योंकि यह दूसरे कंप्यूटर से आता है, जिससे यह पता लगाना कठिन हो जाता है। एक को अवरुद्ध करने से ज्यादा प्रभाव नहीं पड़ेगा क्योंकि दूसरा उसकी जगह लेता है।
अत्यधिक दुर्भावनापूर्ण स्पैम बॉट
उनका प्राथमिक उद्देश्य किसी कंप्यूटर को किसी बोटनेट का हिस्सा बनाकर उसे मैलवेयर से संक्रमित करना है। कंप्यूटर का उपयोग तब उसी मैलवेयर को अन्य कंप्यूटरों में वितरित करने के लिए किया जाता है। एक बोटनेट को अवरुद्ध करना वास्तविक आगंतुकों से आने वाले यातायात को रोक सकता है। रेफरल ट्रैफ़िक रिपोर्ट से संदेहास्पद रीडायरेक्ट ज्यादातर इन मैलवेयर-संक्रमित वेबसाइटों पर ले जाते हैं। जब तक कोई प्रभावी एंटी-मैलवेयर सॉफ़्टवेयर स्थापित या अलग कंप्यूटर न हो, ऐसे लिंक पर क्लिक करने से बचें।
स्मार्ट स्पैम बॉट
ये वेबसाइटें Google Analytics को ट्रैफ़िक कोड का उपयोग करके साइट आईडी के साथ भेजती हैं। उनमें ट्रैफ़िक रिपोर्ट में कुछ फर्जी रेफ़रर्स भी शामिल हैं, जो बिना सोचे-समझे चल सकते हैं। उनकी गतिविधियाँ सर्वर लॉग में कभी नहीं दिखाई देती हैं, और जब वे डेटा को सीधे एनालिटिक्स टूल में भेजते हैं, तो उन्हें ब्लॉक करने का कोई तरीका नहीं है। जो लोग Google टैग प्रबंधकों का उपयोग नहीं करते हैं, उनकी साइट पर GA ट्रैकिंग कोड होता है, जो वेब-प्रॉपर्टी आइडेंटिफ़ायर के रूप में कार्य करता है। Google टैग प्रबंधक इस मामले में रेफरल स्पैम को हटाने के लिए एक कुशल उपकरण है। स्पैम्बोट्स ज्यादातर स्रोत कोड में कमजोरियों या सीमित सुरक्षा उपायों के साथ उन साइटों पर हमला करते हैं।

स्पैम स्रोतों का पता लगाना
Google ट्रैफ़िक रिपोर्ट पर नेविगेट करें और अवरोही क्रम में बाउंस दरों को सॉर्टिंग तत्व के रूप में उपयोग करें। 100% या 0% उछाल दर वाले लोगों को स्पैमिंग के बारे में संदेह होना चाहिए। वैकल्पिक रूप से, पहले से ही स्थापित स्पैमर की एक विस्तृत सूची है, जिसकी तुलना आप बिना किसी मैनुअल विश्लेषण के कर सकते हैं। अगला कदम उन्हें ब्लॉक करना है।
उस समय ट्रैफ़िक के फटने की व्याख्या करते हुए रिपोर्ट के ग्राफ़ पर एक नोटेशन बनाना सुनिश्चित करें।
1. .htaccess फ़ाइल के लिए रीराइट इंजन का उपयोग करें और इसमें परिवर्तन करके रेफरल स्पैम को हटाने के लिए स्पैम्बोट क्षमताओं का उपयोग करें। यदि आईपी पते के बारे में निश्चित है कि स्पैम्बोट उपयोग करता है, तो इसे कोड में शामिल करें और इसे एक्सेस से इनकार करें। क्षमता का उपयोग आईपी पते की श्रेणियों को अवरुद्ध करने के लिए किया जा सकता है। ऐसा केवल तभी करें जब आप सुनिश्चित हों कि स्पैम्बोट एक कार्रवाई करने के लिए कई आईपी पते का उपयोग करता है। इसके अलावा, स्पैमबॉट्स का उपयोग करने के लिए जाने वाले उपयोगकर्ताओं को रोकें।
2. बॉट फ़िल्टरिंग फ़ीचर: उस बॉक्स को चेक करें जो ज्ञात बॉट्स और स्पाइडर को बाहर करने का संकेत देता है।
3. मॉनिटर सर्वर लॉग: नियमित रूप से साइट पर जाकर बॉट्स को डराता है। स्पैम्बोट्स से वेब स्रोतों को फ़िल्टर करके कंप्यूटर को वर्चुअल स्पेस से बचाने के लिए फ़ायरवॉल का उपयोग करें।
4. पेशेवर सहायता प्रदान करने के लिए सिस्टम का व्यवस्थापक स्थिति में होना चाहिए।
5. ItSAlive कोड Google और यैंडेक्स के स्पैम्बोट्स के हस्तक्षेप से मैट्रिक्स को बनाए रखने में मदद करता है।
6. Google Chrome मैलवेयर का पता लगाने में सक्षम है और अगर जगह में कोई फ़ायरवॉल नहीं है तो ब्राउजिंग के लिए उपयुक्त है।
7. उपयोगकर्ता अलर्ट Google से वैयक्तिकृत सूचनाएं हैं जो अनपेक्षित ट्रैफ़िक बढ़ने पर सूचित करती हैं।
8. Google Analytics फ़िल्टर। GA में व्यवस्थापक टैब के दृश्य अनुभाग में नए फ़िल्टर बनाएं।