بیشتر ما تجربه تقلبکردن در دوران مدرسه را داریم. آنوقتها سعی میکردیم اصطلاحاً از روی دست رفیقمان که درسخوانتر بود بنویسیم و در نهایت نمره بهتری کسب کنیم. با این حال، بعضی وقتها معلم متوجه این کارمان میشد و جریمههای سنگینی برایمان وضع میکرد.
در آخر، تقلبکردن (کپی کردن) نهتنها برایمان نون و آب نمیشد و نمره بهتری کسب نمیکردیم، اعتبارمان را هم پیش معلم خراب میکرد.
چه بخواهیم چه نخواهیم، گوگل هم با محتوای سایتمان مثل همان معلم برخورد میکند. شاید در ابتدا فکر کنیم با یک کپی و پِیست ساده توانستیم 2000 کلمه محتوا بنویسیم؛ اما این کار خیلی برایمان گران تمام میشود. همه چیز به همین راحتیها هم نیست…
اگر شما هم دغدغه این را دارید که چگونه محتوای کپی را تشخیص دهیم یا اینکه چه ابزارهایی برای تشخیص محتوای کپی شده وجود دارد، با من در این مقاله همراه باشید.
منظور از محتوای کپی چیست؟
تعریف بسیار ساده محتوای کپی که در دسته انواع سرقت ادبی یا Plagrism قرار میگیرد به این صورت است:
«اگر یک محتوا عیناً در دو سایت موجود باشد، محتوای یکی از سایتها به عنوان محتوای کپی یا تکراری در نظر گرفته میشود»
طبق تعریف گوگل، محتوای تکراری از چند بلوک محتوایی تشکیل میشود که دقیقاً یا تا حدی با محتوای یافتشده در سایتهای دیگر مطابقت دارد. بنابراین گوگل موقع بررسی محتوا، آن را به صورت بلوکهایی جداگانه در نظر میگیرد و در هر بلوک بررسیهای لازم را انجام میدهد.
حالا اگر گوگل یا هر موتور جستجوی دیگری با محتوای کپی مواجه شود، سایتی که از لحاظ زمانی زودتر محتوا را منتشر کرده به عنوان محتوای اصلی یا اورجینال در نظر میگیرد.
متأسفانه خیلی از تولیدکنندگان محتوا فکر میکنند با کپیکردن محتوا و قرار دادن محتوای تکراری در سایت یا وبلاگ خود میتوانند تأثیر مثبتی بر سئو بگذارند. یا مثلاً بعضی تولیدکنندگان باهوشی هستند که از هر سایتی دو یا چهار خط کپی میکنند تا در نهایت یک مقاله کامل داشته باشند. این تولیدکنندگان محتوا نیز باید عذاب وجدان داشته باشند، چون کارشان هیچ فرقی با گروه اول ندارد و هر دو فعالیت را میتوان سرقت ادبی یا پلاگریسم دانست.
اگر می خواهید در خصوص محتوای داپلیکیت یا محتوای کپی شده بیشتر بدانید می توانید مقاله Duplicate Content یا محتوای تکراری | بالاخره در سئو سایت تاثیر دارد یا نه؟ را بخوانید.
اصلاً چرا محتوای کپی مینویسیم؟
این سؤال میتواند پاسخهای متعددی داشته باشد. شاید وقتِ لازم برای تولید محتوای اورجینال را نداریم. شاید با توجه به شرایط اقتصادی و اجتماعی کشورمان، دیگر حالوحوصله تولید محتوای یونیک و اورجینال را نداشته باشیم. یا شاید نمیتوانیم هزینه لازم برای محتوای باکیفیت را جور کنیم.
البته خیلی از وبمسترها و مدیرانی که با فریلنسرها کار میکنند هم گرفتار تولید محتوای کپی میشوند. یعنی متأسفانه وضعیت طوری شده که حتی نویسندگانی که برای این کار پول دریافت میکنند هم به جای «تولید» محتوا ترجیح میدهند محتوای سایتهای دیگر را «سرقت» یا کپی کنند.
نمیخواهم این مشکل را ریشهیابی کنم؛ چون ممکن است علل مختلفی داشته باشد. فقط قصد دارم بگویم اگر به عنوان یک صاحب سایت یا یک تولیدکننده محتوا گرفتار این کار شدهایم، شاید توانستیم با شناسایی دلیل و ریشه این کار از خر شیطان پیاده شویم و با چند بار تولید محتوای اورجینال، لذت خلاقیت و آفرینش محتوا را بچشیم.
چند نوع محتوای کپی وجود دارد؟
طبق تجربهای که در این چند سال به عنوان متخصص سئو داشتهام، با انواع مختلفی از محتوای کپی مواجه شدهام که در ادامه به آنها اشاره میکنم.
1) صفحات محصول و دستهبندی
بعضی وبسایتهای فروشگاهی یا به طور کلی سایتهایی که در حوزه تجارت الکترونیک فعالیت میکنند، به نظر میرسد علاقهای به تولید محتوا برای صفحات محصولشان ندارند!
این سایتها برای محصولات و صفحات دستهبندی خود از قالبهای مشابه و محتوای کپی استفاده میکنند. یعنی به جای اینکه نویسنده و تولیدکننده محتوا استخدام کنند، سراغ توضیح محصولهای دیجیکالا یا سایتهای بزرگ میروند و محتوایشان را کپی میکنند. چنین متنهایی یا کاملاً کپی هستند، یا ممکن است حاوی تکههایی از اطلاعات مشابه باشند.
2) مقالات بلاگ
خوشبختانه بیشتر سایتها با آگاهی از خطراتی که محتوای کپی دارد، حداقل در مقالات بلاگشان بیخیال کپیکردن شدهاند. با این حال هنوز هم بعضی سایتها هستند که مقالات دیگر سایتها را عیناً کپی میکنند. یا از ترکیب چند مقاله، یک ترکیبی از محتواهای مختلف درست میکنند و به عنوان مقاله بلاگ منتشر میکنند.
3) اخبار
یکی از انواع محتوای کپی در اینترنت، اخبار روز ایران و جهان است. خیلی از نویسندهها فکر میکنند متنی که خبرگزاریهای بزرگ منتشر میکنند مقدس هستند و گوگل از گناهِ کپی کردنشان میگذرد.
در حالی که اینطور نیست.
حتی اگر قرار است خبر سایتهای خبری بزرگ را در سایت خودمان منتشر کنیم، برای رتبه گرفتن در گوگل باید تغییرات مثبتی در آنها ایجاد کنیم. یعنی همان خبر را با همان جزئیات ضروری، با یک ادبیات دیگر و با کلماتی جدید منتشر کنیم.
4) قالب وبسایتهای عمومی
محتوای کپی فقط به تکراری بودن متنها محدود نمیشود. تا حالا وبسایتهای جدید زیادی را دیدهام که برای سفارشیسازی سیستم مدیریت محتوای خود هزینه نمیکنند و تصمیم میگیرند از الگوی سایتهای دیگر که پر از متنهای ازپیشتولیدشده است استفاده کنند.
مثلاً وبسایتهای وردپرسی که برای صفحات اصلی از تمهایی با محتوای پیشفرض استفاده میکنند را میتوان در این دسته گنجاند. صفحاتی مثل تماس با ما، درباره ما و …
انتشار محتوای کپی چه خطراتی دارد؟
محتوای کپی یا اصطلاحاً Duplicate میتواند خطرات زیادی از لحاظ سئو برای سایتمان داشته باشد. بعضی وقتها ممکن است آن صفحه توسط گوگل یا سایر موتورهای جستجو جریمه شود.
تقریباً همه متخصصان سئو و بازاریابی دیجیتال، استفاده از محتوای کپی شده یا تکراری را یک تکنیک منفی سئو قلمداد میکنند. تولید محتوای کپی میتواند معایب زیادی داشته باشد که در ادامه به چند مورد از مهمترینها اشاره کردهام:
- محتوای کپی مستقیماً تمام الگوریتمهای گوگل را نقض میکند.
- محتوای کپی تجربه کاربری جستجوگران گوگل را به خطر میاندازد، بنابراین گوگل به شکلی حیثیتی با آن برخورد میکند!
- وجود محتوای کپی حتی در یک صفحه، رتبه کلی وبسایت را در گوگل کاهش میدهد.
- محتوای کپی باعث میشود گوگل سایت موردنظر را کمتر در صفحه نتایج (SERP) نمایش دهد.
- گوگل در ایندکس کردن صفحات سایت تأخیر ایجاد میکند. یعنی حتی اگر یک سایت پر از صفحات قوی با محتوای خوب و بکلینک باکیفیت داشته باشیم، یک صفحه کپی میتواند رتبه گرفتن سایت را به تعویق بیندازد.
- از همه مهمتر، مخاطب سایت اگر تشخیص دهد محتوا کپی است، دیگر اعتماد و اطمینانی به سایت (یا برند) نخواهد داشت.
ابزارهای تشخیص محتوای کپی
با وجود معایب و خطراتی که برای محتوای تکراری ذکر شد، استفاده از این نوع محتوا در فضای دیجیتال به طرز شگفتآوری رایج است. آمارها نشان میدهند حدود 25 تا 30 درصد از فضای وب را محتوای تکراری تشکیل میدهد. برای مخاطبینی که به هر دلیلی در جستجوی ابزارهای تشخیص محتوای کپی هستند، یک لیست دهتایی از بهترین ابزارها آماده کردهام که در ادامه به آنها اشاره خواهم کرد.
1) مهم ترین ابزار تشخیص محتوا کپی : گوگل
خیلی از افراد (از جمله خود من) از موتور جستجوی گوگل برای تشخیص محتوای کپی استفاده می کنند. به این صورت که متن موردنظر را در گوگل سرچ میکنند تا ببینند آیا قبلاً در سایتی استفاده شده یا خیر.
این روش در عین سادگی محدودیتی هم دارد. تعداد کلماتی که میتوانیم در باکس گوگل بنویسیم محدود است. بنابراین برای پلاگریسم یک محتوای 2000 کلمهای، مجبوریم آن را به بخشهای کوچکتری تقسیم کنیم و هر بخش را به طور جداگانه در گوگل سرچ کنیم.
2) گرامرلی (Grammarly)
وقتی بحث کپی کردن محتوا به میان میآید، یکی از اولین ابزارهایی که به ذهن میرسد گرامرلی است. گرامرلی نوعی دستیار نوشتار مبتنی بر هوش مصنوعی است که رسالتش را بهبود ارتباطات متنی بین مردم و در فضای کسبوکارها میداند.
گرامرلی یک ابزار تصحیح خودکار و بررسی سرقت ادبی دارد که مورداعتماد دانشگاههای بزرگی مثل میشیگان و استنفورد است. این ابزار 16 میلیارد صفحه وب را در دیتابیس خود دارد. بنابراین قادر است تشخیص دقیق و سریعی ارائه دهد.
3) کپی اسکیپ (Copyscape)
کپی اسکیپ یک ابزار تشخیص محتوای کپی است که حتی میتواند نسبت به شباهتهای جزئی در محتوا هشدار دهد. این ابزار آنلاین بعد از دریافت محتوا یا URL از کاربران، تمام جزئیات مربوط به سرقت ادبی را به آنها ارائه میدهد. کپی اسکیپ یک نسخه پریمیوم هم دارد که به کاربران اجازه میدهد بهدلخواه خود فایل آپلود کنند یا محتوا را در کادر جستجو کپی کرده و به دنبال متن کپی باشند.
4) داپلیچکر (Duplichecker) : ابزاری که من برای تشخیص محتوای کپی استفاده می کنم
داپلیچکر یکی از ابزارهای رایگان تشخیص محتوای کپی است که به کاربرانش کمک میکند در کمتر از چند ثانیه وجود انواع پلاگریسم را در فایلهایی با فرمت Text، Doc و همچنین آدرس URL تشخیص دهند. با ثبتنام در این سایت این قابلیت را خواهید داشت که به شکل نامحدود از امکاناتش استفاده کنید.
5) سایت لاینر (Siteliner)
خیلی از کاربران به دنبال ابزاری هستند که جستجوی متن کپی را در تمام بستر وب، یعنی همۀ وبسایتها انجام دهد. یکی از ابزارهای رایگانی که میتوان به این افراد پیشنهاد داد، سایتلاینر است.
برای بهرهگیری از امکانات سایتلاینر، باید آدرس URL سایت موردنظر را کپی و پیست کنیم. بعد از این مرحله، این ابزار متنهای کپی، مدتزمان بارگذاری صفحه، تعداد کلمات موجود در صفحه و همچنین لینکهای داخلی و خارجی آن را نمایش میدهد.
6) پلگاسپاتر (PlagSpotter)
PlagSpotter یکی از نرمافزارهای تشخیص محتوای کپی رایگان است که به سرعت بالا و جامع بودنش مشهور شده است. این ابزار فقط ۴۹ ثانیه زمان میخواهد تا محتوای کپی را نسبت به منابع موجود در بستر نت تشخیص دهد.
7) یونیچک (Unicheck)
یونیچک یکی از آن ابزارهایی است که با طراحی بصری و برتریِ تکنولوژیکش، توانسته یک نرمافزار فوقالعاده تولید کند. این ابزار، ساختاربندی و رابط کاربری واضحی دارد و مجموعهای از کاربردها را در یک ابزار واحد ارائه داده است.
یونیچک هم مثل گرامرلی یکی از ابزارهای معتبر تشخیص محتوای کپی است که از 99 درصد فرمتهای فایل و تعداد کلمات نامحدود پشتیبانی میکند. در عین حال، گزارش بسیار دقیقی از سرقت علمی ارائه میدهد. این ابزار یک افزونه گوگل هم دارد که برای بررسی شباهتها در محتوا استفاده میشود.
8) آیتنکیتیت (iThenticate)
iThenticate یکی از ابزارهایی است که در بین محققان، ناشران و دانشگاهیها به عنوان یکی از بهترینهای بررسیکننده سرقت ادبی مشهور است. این نرمافزار قادر است نتایج جامعی ارائه دهد و بخشهای متنی که کپی هستند یا نیاز به تغییر دارند مشخص کند. جالب است بدانید آیتنکیتیت یک دیتابیس بینظیر دارد که به کاربرانش کمک میکند نهایت اعتماد ممکن را به نتایج داشته باشند.
9) جستجوگر سرقت ادبی X (Plagiarism Checker X)
برای افرادی که روی وبلاگ، مقاله تحقیقاتی و وبسایت کار میکنند، احتمالاً Plagiarism Checker X نام آشنایی است. این ابزار انواع و اقسام شباهتها را بین اسناد مختلف بررسی میکند تا در نهایت از اصالت محتوا مطمئن شود.
سازندگان این ابزار ادعا میکنند که بازاریابان دیجیتال، نویسندگان، معلمان، دانشآموزان و روزنامهنگاران از 80 کشور دنیا از جمله کانادا، ایالات متحده آمریکا، بریتانیا، آلمان و هند از Plagiarism Checker X استفاده میکنند. این جستجوگرِ تشابه محتوا از چندین نوع فایل مانند RTF، Microsoft Words، متن ساده و Pdf پشتیبانی میکند.
10) پیپر ریتر (Paper Rater)
همانطور که از اسم این ابزار پیداست، مقالات علمی را از منظر هرگونه سرقت ادبی بررسی میکند. این ابزار به صورت آنلاین و رایگان عرضه شده و استفاده از آن خیلی آسان است. کاربران فقط لازم است محتوا را کپی-پیست کنند یا فایل مقاله را برای بررسی آپلود کنند.
علاوه بر تشخیص محتوای کپی، این ابزار پیشنهادات دقیقی درباره املا، دستور زبان و سبک نوشتار را برای افزایش کیفیت محتوا ارائه میدهد. جالب است بدانید این ابزار 10 میلیارد سند چاپی و اینترنتی را با محتوای ما مقایسه میکند تا محتوای تکراریاش را مشخص کند.
و اما کلام آخر …
لذتی که در نوشتن محتوای اورجینال هست، در کپیکردن زحمات دیگران نیست. موقع نوشتن توضیحات محصول، سعی کنیم صرفاً از سایتهای دیگر ایده و الهام بگیریم؛ نه اینکه عیناً کپی کنیم. همین موضوع درباره مقالات بلاگ و پستهای خبری هم صدق میکند.
اگر در سایت خود محتوای کپی داریم، بدانیم شاید دلیل رتبه نگرفتن صفحات سایتمان همین باشد. گوگل بدون دلیل ما را جریمه نمیکند. اگر تاکنون بدون اطلاع و بدون قصد و غرض این کار را انجام دادیم، سریع برگردیم عقب و دستی به سر و روی صفحات سایتمان بکشیم.
سوالات متداول
گوگل محتوای تکراری را بهعنوان بلوکهایی از محتوا تعریف میکند که حاوی اطلاعاتی مشابه (یا بهطور قابلملاحظهای مشابه) باشد. با پیشرفت هوش مصنوعی گوگل، تغییر چند کلمه با مترادف یا حتی بازنویسی کل پاراگرافها هم برای گوگل کافی نیست. دیگر باید به فکر تولید محتوای کاملاً اورجینال باشیم.
توضیحات محصول تکراری بر سئوی صفحه تأثیر منفی دارد. چرا؟ چون گوگل به صفحهای که محتوای اورجینال دارد رتبۀ بهتری میدهد. بنابراین اگر سایت فروشگاهی داریم و به دنبال رتبه گرفتن صفحات محصول خود در گوگل هستیم، باید به فکر تولید محتوای اورجینال برای آن صفحه باشیم.
مهندس جان
گرامرلی و داپلی چکر هر دو درست تشخیص ندادند
از این صفحه به عنوان مثال
https://telescopicwatch.com/us/telescopes-rankings/
متن اول صفحه رو کپی کردم
تو هر دو ابزار، یونیک تشخیصش داد
21
سلام محمدرضا جان
من صفحه ای که فرستادی رو بررسی کردم، نکته ای که داره اینه که صفحه ارسالی شما نوایندکسه
یعنی صفحه اصلا ایندکس نشده، بنابراین ابزارهای تشخیص دهنده محتوای کپی هم نمیتونن بهش دسترسی داشته باشم و بنابراین اون محتوا براشون یونیک میشه
33