Duplicate Content Issues and How to Fix Them
खोज परिणामों से पृष्ठ गायब
हो रहे हैं। क्रॉल बजट बर्बाद। गिरती रैंकिंग और घटिया उपयोगकर्ता अनुभव। डुप्लिकेट
सामग्री के कारण होने वाली समस्याएँ SEO विपणक के लिए एक बड़ी बात हैं।
जबकि सलाह सरल है—वेबपृष्ठों
पर टेक्स्ट का पुन: उपयोग न करें—डुप्लिकेट सामग्री से बचने की वास्तविकता थोड़ी अधिक
जटिल है।
डुप्लिकेट सामग्री क्या होती है?
Google के अनुसार, डुप्लिकेट सामग्री उस कंटेंट को कहा जाता है जो एक ही वेबसाइट या अलग-अलग वेबसाइटों पर एक जैसा या बहुत मिलता-जुलता होता है। इसका मतलब है कि अगर किसी पेज की सामग्री किसी दूसरे पेज की सामग्री से पूरी तरह या काफी हद तक समान है, तो वह डुप्लिकेट मानी जाती है।
डुप्लिकेट कंटेंट अक्सर जानबूझकर नहीं बनाई जाती। उदाहरण के तौर पर, प्रोडक्ट डिस्क्रिप्शन,
ब्रांड मैसेज, या वेबसाइट्स पर एक जैसा लिखा गया टेक्स्ट बार-बार उपयोग किया जा सकता
है।
डुप्लिकेट कंटेंट कहाँ पाई जाती है?
- किसी वेबसाइट के एक से ज़्यादा पेजों पर एक जैसा कंटेंट होना
- एक जैसे टाइटल और मेटा डिस्क्रिप्शन होना
- अन्य वेबसाइटों से बिना बदलाव के सामग्री को उपयोग करना
- यह सब डुप्लिकेट सामग्री की श्रेणी में आता है।
क्या Google डुप्लिकेट कंटेंट पर पेनल्टी लगाता है?
नहीं। Google डुप्लिकेट कंटेंट
पर सीधा कोई पेनल्टी नहीं लगाता, क्योंकि Google समझता है कि कई बार यह बिना किसी गलत
इरादे के हो जाता है।
कॉपी की गई सामग्री (Scraped Content) क्या है?
कॉपी की गई सामग्री वह होती
है जब कोई व्यक्ति या वेबसाइट किसी और के कंटेंट को कॉपी करके अपनी साइट पर डाल देती
है, बिना अनुमति या बदलाव के।
यह Google की नज़र में एक गंभीर मामला है। अगर कोई साइट बार-बार ऐसा करती है, तो उस पर Google पेनल्टी लगा सकता है।
बचाव कैसे करें?
- हमेशा ओरिजिनल कंटेंट लिखें
- एक जैसे टाइटल और मेटा डिस्क्रिप्शन से बचें
- किसी और की सामग्री को बिना बदलाव और अनुमति के उपयोग न करें
क्या SEO के लिए डुप्लीकेट कंटेंट मायने
रखता है?
यदि डुप्लीकेट सामग्री के कारण Google
को दंड नहीं मिलता है , तो क्या आप इसे खुशी-खुशी अपनी साइट पर जंगली चलाने
के लिए छोड़ सकते हैं? नहीं . आपकी साइट पर किसी वास्तविक दंड के बिना, डुप्लीकेट
सामग्री अभी भी आपकी पृष्ठ रैंकिंग और ऑर्गेनिक ट्रैफ़िक पर नकारात्मक प्रभाव
डाल सकती है .
सबसे पहले, खोज इंजन अपने परिणाम
पृष्ठों पर डुप्लिकेट प्रविष्टियाँ वापस करने से बचते हैं। यह खोजकर्ताओं के लिए
समझ में आता है; आखिरकार, विभिन्न पृष्ठों पर होस्ट किए गए 10 समान परिणामों वाला
परिणाम पृष्ठ 10 विविध, मूल परिणामों वाले पृष्ठ की तुलना में कम सहायक होता है।
खोज इंजनों को यह तय करना होता
है कि डुप्लिकेट सामग्री का कौन सा संस्करण सबसे अधिक प्रासंगिक है। ऐसा करने
के लिए, वे डोमेन प्राधिकरण पर विचार करते हैं और कौन सा पृष्ठ सामग्री का मूल, सबसे
आधिकारिक स्रोत प्रतीत होता है। क्रॉलर फिर परिणाम पृष्ठों से डुप्लिकेट को फ़िल्टर
करते हैं:
- यदि आप ऐसी सामग्री दिखा
रहे हैं जो अधिक आधिकारिक साइट पर भी दिखाई देती है, तो आपका URL उच्च अधिकार
वाली उच्च साइट के पक्ष में परिणाम पृष्ठों से फ़िल्टर कर दिया जाएगा।
- यदि आपकी वेबसाइट के कई पृष्ठों
में डुप्लिकेट सामग्री है, तो इनमें से अधिकांश पृष्ठों को खोज इंजन परिणाम पृष्ठों
(SERPs) से फ़िल्टर कर दिया जाएगा। कुल मिलाकर साइट की दृश्यता प्रभावित
होगी।
दूसरा, डुप्लिकेट सामग्री पृष्ठ
लिंक इक्विटी और पृष्ठ प्राधिकरण को कम कर सकते हैं। यदि आपकी साइट समान सामग्री
वाले दो अलग-अलग URL होस्ट करती है, तो आपकी सामग्री से लिंक करने वाली साइटों को दो
संस्करणों के बीच चयन करना होगा। यह इनबाउंड लिंक को आवश्यकता से अधिक पतला फैलाता
है, जिससे संबंधित पृष्ठों के रैंकिंग संकेतों पर नकारात्मक प्रभाव पड़ता है।
डुप्लिकेट सामग्री समस्याओं का पता कैसे
लगाएं
डुप्लिकेट सामग्री अक्सर नग्न
आंखों को दिखाई देती है, लेकिन कभी-कभी यह किसी वेबसाइट के कोड में छिपी होती है। इसलिए डुप्लिकेट
सामग्री की जांच के लिए सॉफ़्टवेयर का उपयोग करना सबसे अच्छा है ।
साइट पर डुप्लिकेट सामग्री
एलेक्सा के एसईओ ऑडिट टूल में
एक डुप्लिकेट कंटेंट चेकर होता है जो एक ही कंटेंट के साथ अलग-अलग यूआरएल ढूंढता है
और सलाह देता है कि उन्हें कैसे ठीक किया जाए। टूल आपको सामान्य डुप्लिकेट सामग्री
SEO युक्तियों के लिए भी सचेत करता है, जैसे कि आप इस टिप बॉक्स में देख सकते हैं:
साइट ऑडिट टूल मेटा विवरण और
शीर्षकों में डुप्लिकेट सामग्री की पहचान करता है, समस्या को खोजने और ठीक करने के
लिए URL की निर्यात योग्य सूची तैयार करता है:
इन तकनीकी त्रुटियों को ठीक
करने से आपको मेटा-टैग SEO में सुधार करने में मदद मिलेगी , जिसके परिणामस्वरूप
खोज इंजन परिणाम पृष्ठों (SERPs) से उच्च क्लिक-थ्रू दरें प्राप्त होती हैं।
Off Page SEO Duplicate
ऑफ-साइट डुप्लिकेट सामग्री—विभिन्न
वेबसाइटों पर मौजूद समान सामग्री—का पता लगाना कठिन हो सकता है।
यह सुनिश्चित करने के लिए कि
आप किसी अन्य साइट पर पहले से मौजूद सामग्री पोस्ट नहीं कर रहे हैं, यह सुनिश्चित करने
के लिए कि आपकी कोई भी ब्लॉग सामग्री साहित्यिक चोरी नहीं है, प्रकाशित करने से पहले
एक साहित्यिक चोरी उपकरण का उपयोग करने का प्रयास करें। यह विशेष रूप से महत्वपूर्ण
है यदि आप आउटसोर्स लेखकों या टीम के नए सदस्यों के साथ काम कर रहे हैं जो मूल सामग्री
के महत्व से अनजान हो सकते हैं।
आप यह देखने के लिए साहित्यिक
चोरी उपकरण का भी उपयोग कर सकते हैं कि क्या अन्य साइटें आपकी सामग्री की प्रतिलिपि
नहीं बना रही हैं। आपकी साइट से कॉपी की गई सामग्री के उदाहरण खोजने के लिए कोपीस्केप
जैसे भुगतान किए गए टूल वेब को स्कैन करते हैं। इस प्रकार की ऑफ-साइट डुप्लिकेट
सामग्री को ठीक करना कठिन है, हालांकि आप साइट के प्रबंधक से संपर्क करने का प्रयास
कर सकते हैं और उन्हें इसे ठीक करने के लिए कह सकते हैं। यदि वह काम नहीं करता
है, तो कॉपी की गई सामग्री से निपटने के दूसरे तरीके के लिए पढ़ें।
सामान्य डुप्लिकेट सामग्री के मुद्दे
और उन्हें कैसे ठीक करें
डुप्लिकेट सामग्री के लिए एक
आकार-फिट-सभी समाधान नहीं है। लेकिन कुछ सामान्य सुधार हैं जो सबसे आम समस्याओं
और उनके परिणामों से निपटने में मदद करते हैं:
1: पृष्ठों के प्रिंटर के अनुकूल संस्करण
असीमित मोबाइल डेटा और वॉयस
असिस्टेंट के युग में भी, उपयोगकर्ता अनुभव के मामले में प्रिंटर के अनुकूल वेब पेज
बहुत अच्छे हैं। लेकिन जबकि वे उन लोगों के लिए महान हैं, जिन्हें कागजी दस्तावेज़ीकरण
तक पहुँचने की आवश्यकता है, वे डुप्लिकेट सामग्री समस्याएँ उत्पन्न कर सकते हैं। प्रिंटर
के अनुकूल URL एक ही पृष्ठ के दो भिन्न संस्करण बनाते हैं; यदि दोनों संस्करण
अनुक्रमित हैं, तो क्रॉलर आपके क्रॉल बजट को दोनों को क्रॉल करने
में खर्च करेंगे और उन्हें यह चुनना होगा कि SERPs में कौन सा दिखाना है।
समाधान: कैननिकल
टैग का उपयोग करने से प्रिंटर के अनुकूल और मोबाइल पेज संस्करणों को डुप्लिकेट सामग्री
समस्या बनने से रोका जा सकेगा। विहित टैग पृष्ठ का मुख्य संस्करण सेट, और
कहा कि मुख्य संस्करण के लिए सभी रैंकिंग संकेत भेजता है।
एक rel=canonical URL सेट करने
के लिए, उस पृष्ठ के <head> अनुभाग में कोड का एक हिस्सा रखें, जिसे आप प्रामाणिक
के रूप में रखना चाहते हैं, URL को अपनी साइट पर URL से बदल दें जो सामग्री का मूल
भाग है।
<लिंक रिले = "कैनोनिकल"
href = "ओरिजिनलकंटेंटयूआरएल.कॉम">
2: http/https या सबडोमेन मुद्दे
HTTP से HTTPS में बदलने
से आपकी साइट की रैंकिंग पर सकारात्मक प्रभाव पड़ना चाहिए क्योंकि
Google HTTPS को एक सकारात्मक रैंकिंग कारक के रूप में देखता है। लेकिन बदलाव
कभी-कभी डुप्लिकेट सामग्री की समस्या का कारण बन सकता है क्योंकि क्रॉलर आपकी साइट
के दो समान संस्करण देखते हैं।
www के साथ और उसके बिना एक
ही साइट के संस्करणों के साथ भी यही बात उत्पन्न होती है। उपसर्ग। क्रॉल
बजट और अनावश्यक रूप से विभाजित लिंक इक्विटी का उपयोग करके बॉट्स को साइट के संस्करणों
के बीच चयन करना होगा।
समाधान: अपनी
साइट के सर्च कंसोल में पसंदीदा डोमेन सेट करने से क्रॉलर को पता चलता है कि उन्हें
आपके डोमेन के किस संस्करण पर ध्यान देना चाहिए। पसंदीदा डोमेन सेट करने के लिए,
सर्च कंसोल में साइट सेटिंग्स पर जाएं, और पसंदीदा डोमेन सेक्शन में अपने इच्छित विकल्प
का चयन करें।
नोट: अभी यह विकल्प Search
Console के पुराने संस्करण में ही उपलब्ध है।
3: UTM पैरामीटर और सत्र आईडी
सटीक वेब मार्केटिंग मेट्रिक्स
के लिए जानकारी और सत्र आईडी ट्रैक करने के लिए पैरामीटर का उपयोग करना एक अच्छा
विचार है । लेकिन खोज इंजन प्रत्येक संस्करण को डुप्लिकेट सामग्री वाले भिन्न
URL के रूप में व्याख्यायित करते हैं। एक बार फिर, कई संस्करण क्रॉलर को भ्रमित
करेंगे और रैंकिंग कारकों को कम करेंगे।
समाधान: rel=canonical
टैग आपको URL का अपना पसंदीदा संस्करण सेट करने की अनुमति देता है। यह गारंटी
देता है कि सही यूआरएल बॉट्स द्वारा क्रॉल किया जाता है, और बैकलिंक्स और साइट विज़िट
द्वारा लाए गए सभी एसईओ लाभ प्राप्त करता है।
नोट: rel=canonical टैग का उपयोग
केवल तभी किया जाना चाहिए जब सामग्री प्रत्येक पृष्ठ पर समान हो।
4: पेजिनेशन
खोज इंजन पृष्ठांकित पृष्ठों
को पहचानने और उन्हें डुप्लिकेट सामग्री के रूप में व्याख्या करने में विफल हो सकते
हैं। पृष्ठ पर अंक लगाना विभिन्न प्रकार की समस्याएं हैं जो डुप्लिकेट सामग्री
की ओर ले जाती हैं- उदाहरण के लिए, गैलरी पृष्ठांकन, जब गैलरी में प्रत्येक आइटम का
अपना पृष्ठ होता है; और श्रेणी पृष्ठांकन, जब उत्पाद प्रविष्टियां कई पृष्ठों
तक फैली होती हैं। समस्या की तकनीकी जो भी हो, वे सभी डुप्लिकेट सामग्री के मुद्दों
में परिणाम कर सकते हैं।
समाधान: rel=“prev” और rel=“next” टैग का
उपयोग करके अक्सर पेजिनेशन की समस्याओं को हल किया जाता है । ये क्रॉलर को
पेजिनेशन श्रृंखला के घटक URL के बीच सटीक संबंध बताते हैं।
मार्च 2019 में Google
ने घोषणा की कि उन्होंने इन टैगों को हटाने का फैसला किया है, यह सुझाव देते हुए
कि उपयोगकर्ता एकल-पृष्ठ सामग्री को पसंद करते हैं, लेकिन पृष्ठांकित सामग्री में अभी
भी rel = "पिछला" और rel = "अगला" टैग शामिल हो सकते हैं।
5: एक ही पृष्ठ के देश/भाषा संस्करण
साइटों में अक्सर प्रत्येक पर
समान सामग्री वाले देश-विशिष्ट डोमेन होते हैं—उदाहरण के लिए, www.yousite.com और www.yoursite.com.au ,
जो क्रमशः यूएस और ऑस्ट्रेलिया में सेवा प्रदान करते हैं। यह संभव है कि इन साइटों
पर लगभग सभी सामग्री की नकल की जाएगी, लेकिन वेबमास्टरों को अभी भी यह सुनिश्चित करने
की आवश्यकता है कि दोनों SERPs में दिखाई दें।
समाधान: प्रत्येक
डोमेन की दृश्यता की गारंटी देने में सहायता के लिए दो विकल्प हैं: शीर्ष-स्तरीय
डोमेन और hreflang टैग।
- शीर्ष-स्तरीय डोमेन डोमेन
नाम के अंत में दिखाई देते हैं और इसमें .com, .org, .edu, .net, .gov, साथ
ही देश-स्तरीय डोमेन जैसे परिचित रूप शामिल होते हैं। Google इन
शीर्ष-स्तरीय संरचनाओं का उपयोग करके स्पष्ट संकेत भेजने की अनुशंसा करता है कि
सामग्री विभिन्न भौगोलिक क्षेत्रों में प्रदर्शित हो रही है। इसका अर्थ है
कि http://www.example.de एक खोज इंजन के दृष्टिकोण से http://de.example.com
की तुलना में समझना आसान है , जो एक शीर्ष-स्तरीय प्रारूप नहीं
है।
- hreflang टैग बॉट्स को उपयोगकर्ताओं
को उनके स्थान के लिए साइट का सही संस्करण दिखाने में मदद करता है। अपनी
साइट के <head> अनुभाग में निम्नलिखित कोड जोड़ने से स्पेन के उपयोगकर्ता
आपके डोमेन का स्पेनिश संस्करण दिखाएंगे, उदाहरण के लिए:
<लिंक rel= “ वैकल्पिक”
href= “ http://example.com” hreflang= “ en-es”
/>
क्रॉलर किसी साइट के अनुवादित
संस्करणों को डुप्लिकेट सामग्री के रूप में नहीं पहचानेंगे, hreflang के लिए धन्यवाद।
6: कॉपी की गई सामग्री
आपकी सामग्री चुराने वाली स्पैमी
साइटें जीवन की एक वास्तविकता है। दुर्भाग्य से, इस प्रकार की गतिविधि मूल साइट
को नकारात्मक रूप से प्रभावित कर सकती है। इसलिए आपको कॉपी की गई सामग्री के खिलाफ
कार्रवाई करने और अपनी साइट के अधिकार की रक्षा करने की आवश्यकता है।
समाधान: सबसे
पहले, आपत्तिजनक साइट से संपर्क करने का प्रयास करें और उनसे सामग्री निकालने के लिए
कहें। यदि वे नहीं करते हैं, तो आप यहां Google से कॉपीराइट उल्लंघन
की रिपोर्ट करने के तरीके के बारे में अधिक जान सकते हैं ।
7: सिंडिकेटेड सामग्री
अपनी सामग्री को उच्च-रैंकिंग
भागीदार साइटों के साथ साझा करना रेफ़रल ट्रैफ़िक चलाने और मूल्यवान बैकलिंक प्राप्त
करने का एक शानदार तरीका हो सकता है। लेकिन अगर आप यह रास्ता अपनाते हैं, तो आपको
यह सुनिश्चित करना होगा कि क्रॉलर यह समझें कि यह डुप्लिकेट सामग्री नहीं है। ऐसा
करने में विफलता के कारण आपके द्वारा साझा की गई साइट SERPs में दिखाई दे सकती है और
आपकी अपनी साइट को फ़िल्टर किया जा सकता है, भले ही आपने सामग्री बनाई हो।
समाधान: इससे
पहले कि आप किसी ब्लॉग को अपनी सामग्री को सिंडिकेट करने देने के लिए सहमत हों, उनसे आपकी
सामग्री की विशेषता वाले प्रत्येक URL पर <head> तत्व में एक rel=canonical
टैग शामिल करने के लिए कहें । यह प्रभावी SEO कंटेंट प्लानिंग का
हिस्सा है ।
8: बॉयलरप्लेट सामग्री
बॉयलरप्लेट सामग्री पूरे डोमेन
में दोहराया गया पाठ है, लेकिन गैर-दुर्भावनापूर्ण रूप से। उदाहरण के लिए, आप
अक्सर ईकॉमर्स डोमेन पर बॉयलरप्लेट सामग्री देखेंगे जब आपूर्तिकर्ता अपने उत्पादों
को बेचते समय उपयोग किए जाने के लिए मानक टेक्स्ट प्रदान करते हैं। फिर खुदरा
विक्रेता समय बचाने के लिए इस पाठ का पुन: उपयोग करते हैं; नकारात्मक पक्ष यह
है कि क्रॉलर समझते हैं कि यह एक डुप्लिकेट सामग्री समस्या है।
ईकॉमर्स खुदरा विक्रेताओं को
जब संभव हो तो उत्पाद विवरण फिर से लिखना चाहिए। इसके लिए बहुत अधिक स्वेट इक्विटी
की आवश्यकता होती है, लेकिन यह डुप्लिकेट सामग्री से बचता है और ईकॉमर्स एसईओ
में सुधार करता है । यदि आपके ब्लॉग या अन्य एसईओ सामग्री पर बॉयलरप्लेट
सामग्री है, तो यह सुनिश्चित करने का प्रयास करें कि बॉयलरप्लेट सामग्री वाले पृष्ठों
में उपयोगकर्ताओं और खोज इंजन दोनों के लिए उन्हें अलग करने के लिए पर्याप्त अतिरिक्त
सामग्री है।
डुप्लिकेट सामग्री को
रोकने के सर्वोत्तम अभ्यास
इन निवारक उपायों का पालन करके
साइटों को आपकी सामग्री चोरी करने से हतोत्साहित करें और साइट रैंकिंग पर डुप्लिकेट
सामग्री के प्रभाव को कम करें:
- अपनी साइट के पृष्ठों पर एक सेल्फ़-रेफ़रेंशियल
rel=canonical लिंक का उपयोग करके स्पैमयुक्त स्क्रैपर साइटों को आपकी
सामग्री का श्रेय लेने से रोकें । मूल पृष्ठ के <head> अनुभाग
में कोड का यह हिस्सा स्वयं को किसी पृष्ठ के लिए प्रामाणिक संदर्भ के रूप में
इंगित करता है। यदि कोई साइट URL की सामग्री की प्रतिलिपि बनाती है, तो खोज
इंजन आपके पृष्ठ को सत्य के अंतिम स्रोत के रूप में पहचान सकते हैं।
- अपनी साइट के URL के विहित
संस्करणों से हर समय लिंक करें । उदाहरण के लिए, यदि
आपके पास मोबाइल और डेस्कटॉप दोनों संस्करण वाला एक पृष्ठ है, तो चुनें कि कौन
सा कैननिकल है, और फिर सभी आंतरिक लिंक को केवल उस पृष्ठ पर इंगित करें। अगर
आप उस यूआरएल के लिए बाहरी लिंक बनाते हैं, तो सुनिश्चित करें कि सभी कैननिकल
लिंक पर भी जाएं। यह क्रॉलर्स को स्पष्ट संकेत भेजेगा कि आप SERPs में किस
लिंक को दिखाना चाहते हैं।
- समान पृष्ठों को एक शक्तिशाली
पृष्ठ में समेकित करके डुप्लिकेट सामग्री को कम करने के लिए जहां उपयुक्त हो, 301
रीडायरेक्ट का उपयोग करें । हो सकता है कि आपने समय के साथ
कई समान लैंडिंग पृष्ठ बनाए हों, जिनमें सभी समान जानकारी रखते हैं और एक ही कीवर्ड
के लिए रैंक करने का प्रयास कर रहे हैं। एक 301 रीडायरेक्ट इन पेजों को प्रतिस्पर्धा
करने से रोकेगा, और पसंदीदा पेज पर मजबूत रैंकिंग सिग्नल भेजेगा।
अपनी साइट को डुप्लिकेट सामग्री से सुरक्षित रखना सर्वोत्तम अभ्यास है। हालाँकि, डुप्लिकेट सामग्री समस्याएँ अभी भी उत्पन्न हो सकती हैं।