همه چیز درباره TF-IDF و کاربرد آن در سئو


هرکسی که کوچکترین سررشته‌ای از سئو داشته باشد میداند که تولید محتوای باکیفیت یکی از مهمترین ار کان سئو است. اما دانستن این که گوگل چگونه کیفیت یک محتوا را تشخیص میدهد امری ضروری برای برنده شدن در رقابت با سایتهای دیگر در نتایج جستجو است. ارتباط دادن کلمات مترادف و مشابه اوایل کار الگوریتم های هوشمند گوگل بود. اما حالا گوگل میتواند ارتباط موضوعات مختلف و مفاهیم را درک کند و تشخیص دهد یک محتوا چقدر به موضوع مورد نظر مرتبط است و کدام یک عمق بیشتری از مطلب را نمایان میکند. به این آنالیز و تحلیل عمقی محتوا  TF-IDF یا فراوانی عبارت-معکوس فراوانی متن گفته می‌شود.

TF-IDF چیست؟

این روش در واقع کاربردهای بسیاری در بازیابی اطلاعات و متن کاوی دارد. که معروفترین این ابزارها موتورهای جستجو هستند. حال ببینیم این روش در موتور جستجویی مانند گوگل چطور عمل میکند. TFIDF در واقع راهی است که گوگل به کمک آن میتواند کیفیت یک محتوا را طبق محتواهای دیگری که وجود دارد بسنجد.
بطور کلی وظیفه TF-IDF این است که اهمیت یک عبارت را در مجموعه ای از متن ها بسنجد.
بگذارید این عبارت را تجزیه کنیم تا بهتر با آن  آشنا شویم
TF یا Term Frequency به معنی فراوانی کلمه دقیقا به معنی همان چیزی است که بنظر میرسد یعنی چند بار یک کلمه در متن پدیدار شده است. دقیقا همین را اندازه گیری میکند: فراوانی
اما فرق آن با چگالی کلمه چیست؟ بگذارید اول ببینیم TF در یک ابزار این معیار چگونه محاسبه میشود. فرمولی که معمولا برای محاسبه  TF به کار میرود عبارت است از:


برای مثال اگر در یک متن با 1000 لغت، کلمه کلیدی موردنظر 10 بار آمده باشد چگالی کلمه کلیدی میشود 1%.  و از طرفی معیار TF نیز میشود 0.43 (با احتساب لگاریتم در مبنای 2)
حال اگر تعداد تکرار کلمات در صفحه را دو برابر کنیم (یعنی 20 بار) چگالی کلمه کلیدی نیز 2 برابر میشود: 2%. اما TF تغییر چندانی نمیکند و مقدار آن میشود: 0.53

IDF چیست؟

حال بگذارید ببینیم IDF چیست: معکوس فراوانی متن
بنظر سخت و پیچیده می آید؟ نگران نباشید. این مفهوم به ما کمک میکند که اهمیت هر کلمه در متن را بسنجیم. این معیار اصولا دو وظیفه دارد:

  • اول این که فراوانی کلمات پرتکرار را بسنجد؛ کلماتی مانند «است، می‌شود، برای» و بسیاری کلمات دیگر که در هر متنی بسیار تکرار میشوند.
  • و دوم این که کلمات خاص تر و کم کاربردی تر را تشخیص میدهد.

 

پس اگر بخواهیم یک مرور ساده بر مفهوم TF-IDF داشته باشیم میتونیم بگوییم در این روش یک موتور جستجو فراوانی کلمه کلیدی را تشخیص میدهد و سپس آن را با دیگر متن های دیگر مقایسه میکند. چون یک سری کلمات هستند که در همه متون تکرار میشوند و یک سری با وجود تکرار در یک متن در متون دیگر وجود ندارند. حال اجازه دهید این مسأله را با یک مثال دقیقتر شرح دهیم:
فرض کنید شما یک کسب و کار کوچک هستید که میخواهید درباره SEO و بالا بردن ترافیک سایتتان بخوانید، چند موضوع کلیدی هستند که در هر راهنمای SEO آن را پیدا خواهید کرد:

  • تحقیق کلمات کلیدی
  • متا دیتا
  • بررسی و آنالیز سایت
  • ربات گوگل

موضوعاتی دیگر که ممکن است کمتر به چشم بخورد و فراوانی کمتری در سایت داشته باشند عبارتند از:

  • تگ h1
  • الگوریتم پاندا
  • تکنیک لینکسازی
  • ابزار ahref

هنگام بررسی یک محتوا، گوگل ارزیابی میکند که هر یک از عبارت های بالا در یک محتوایی که موضوعش «راهنمای سئو»است چقدر در مقایسه با دیگر کلمات  تکرار میشود. این اطلاعات به عنوان یک معیار و امتیاز برای مقایسه با هر محتوای دیگری که بخواهد با این محتوا سنجیده شود در نظر گرفته میشود.

 

چه زمانی باید تحلیل TF-IDF را انجام دهیم؟

کارشناسان سئو و تولیدکنندگان محتوا میتوانند از TF-IDF برای پیدا کردن گپ و حفره در سایت خود بر اساس 10 نتیجه موجود صفحه اول گوگل استفاده کنند. همچنین میتواند برای شناخت فرصت های جدید تولید محتوایی جدید که رتبه بالاتری بگیرد استفاده شود. برای مارکترهاست که معمولا وقت کمی دارند این مسأله  به آنها کمک میکند متوجه شوند باید اول سراغ چه محتوایی بروند و روی آن تمرکز کنند.
1. محتوایی با پتانسیل بالا در صفحه دوم نتایج گیر کرده
شروع به پیدا کردن صفحاتی کنید که روی سایت شما هستند ولی راه خود را به صفحه اول پیدا نمیکنند. اگر از نظر تکنیکی صفحه شما کاملا بهینه شما و اعتبار خوبی هم دارد، بهینه سازی محتوا نقطه خوبی برای شروع است.

2. محتوا به تدریج ترافیک (و رتبه) خود را در طول سال گذشته از دست داده است
هروقت سایتی از نتایج بالای صفحه اول به پایین نزول می کند معمولا بخاطر بالارفتن رقابت در آن کلمه یا تغییرات در الگوریتم گوگل است که معمولا بیشتر اوقات به محتوا مربوط میشود. با مقایسه محتوای سایت خود با دیگر صفحات که در نتایج رتبه دارند مطمئن شوید که محتوای وبسایت شما مرتبط و بروز باشد تا بتوانید جایگاه بالاتری را از آن خود کنید.

3. صفحه محصولی که در تلاش برای گرفتن رتبه بالاتر است
اگرچه آنالیز TF-IDF مختص رتبه گرفتن برای صفحات محتوایی است، اگر صفحه محصول یا سفارش در سایت شما رتبه پایینی دارد حتما محتوای ضروری و مرتبط را در آن قرار دهید.

 

چگونه تحلیل کاملی از TF-IDF داشته باشیم؟

جمع‌آوری اطلاعات موردنظر درباره TF-IDFکار نسبتا راحتی است. با بررسی ده سایت اول در نتایج جستجو کلمه هدف شروع کنید. میتوانید برای شروع تعداد کلمات هر کدام از صفحات را بدست آورید. این عدد به شما تقریب خوبی می‌دهد که چقدر احتیاج دارید محتوای صفحه خود را کامل‌تر کنید یا بخش‌های اضافه آن را حذف کنید. سپس با استفاده از یک ابزار بررسی TF-IDF تحلیل کنید. می‌توانید از ابزارهایی مانند Ryte و Link Assistant استفاده کنید. ابزار Ryte البته نتایج تنها زبان انگلیسی و اسپانیایی را پشتیبانی کرده و همچنین کشور ایران را نیز در فهرست لوکیشن‌های مربوط به بررسی جایگاه کلمات کلیدی ندارد. اما با Website Auditor میتوانید این فاکتور را در سایت خود و رقبا بسنجید. بدین صورت که لینک یک صفحه را با ۱۰ لینک نتایج اول گوگل مقایسه میکند و یک ویرایشگر متن نیز در اختیار شما قرار می دهد که با آن بتوانید بر اساس پیشنهادها محتوای خود را بهینه کنید.

چگونه با در نظر گرفتن کاربر محتوا را بهینه کنیم؟

اما نکته کار اینجاست. شما چگونه از این لیست و کلمات آن برای اضافه کردن به محتوای خود طوری استفاده میکنید که برای کاربر نیز همچنان جذاب و مفید باشد؟

۱. لیست را ویرایش کنید
اول از همه لیست را نگاهی بیندازید و آن را اصلاح کنید. مثلا در لیست بالا کلمه SquareSpace که یک سایت‌ساز است به عنوان یک کلمه کلیدی مرتبط نشان داده می‌شود. رقبای شما ممکن است برند خود را متناوبا تکرار کنند طوری که در نتایج تحلیل‌ها حاضر شوند. مگر این که گوگل به دنبال یک محصول یا فروشنده بخصوص باشد. بنابراین به کار بردن و تکرار نام برند رقیب محتوای شما را ارتقا نخواهد داد.

۲. بسیاری از افراد بلافاصله پس از مشاهده لیستی از TF-IDF برمی‌گردند به دوران چگالی کلمات کلیدی. اگرچه اضافه کردن کلمات کلیدی هنوز هم می‌تواند ارزشمند باشد ولی هدف TF-IDF تنها گنجاندن کلمات کلیدی در متن و محتوا نیست. در اصل TF-IDF به شما نشان می‌دهد که چه خلأهایی در محتوای خود دارید که باید آن‌ها را پر کنید. ممکن است به کوچکی اضافه کردن یک فیلد سایز به صفحه محصول باشد یا به بزرگی افزودن یک یا دو پاراگراف به پست وبلاگ برای کامل کردن آن. بررسی این که رقیبانتان چه چیزی را بهتر از شما بهبود داده‌اند بهترین راه برای بهینه کردن محتوا را نشان‌تان میدهد.
۱۰ نتیجه برتر کلمه کلیدی مورد نظرتان را بررسی کنید و TF-IDF را در آن بسنجید. به دنبال الگوهای محتوایی در رقیبانتان بگردید که در وبسایت خودتان نیست.

در صورت نیاز بازطراحی کنید

تغییر شکل و طراحی وبسایت صرف زمان و منابع زیادی را می‌طلبد که همیشه هم صرفا برای هر آپدیت سئو و بهینه‌سازی به صرفه نیست. اما بهر حال اگر به چندین صفحه برخوردید که متوجه شدید تغییر کلی متن‌ها مفید خواهد بود بروزرسانی طراحی به تناسب نیازتان تجربه کاربری به مراتب بهتری را برای شما به ارمغان می‌آورد و به شما کمک می کند در آینده نیز مطالب وبسایت خود را راحت‌تر بهینه کنید.

اگر به موارد زیر برخوردید به بروزرسانی محتوا احتیاج دارید:

  • ساختار صفحه به گونه‌ای است که به شما اجازه اضافه کردن محتوای جدید را نمی‌دهد.
  • صفحه مورد نظر أساسا برای هدف و مخاطب اشتباهی ساخته شده است.
  • محتوای بی‌ارزش زیادی در سکشن‌های وبسایت وجود دارد.
  • طراحی صفحه به گونه‌ای‌ست که اجازه نمی‌دهد به خوبی متنها را در قسمت‌های مختلف و با فواصل درست قرار داد.
  • صفحه زیادی بلند است و به کامپوننت‌های بیشتری برای بالا بردن تعامل نیاز دارد.

اگر صفحه‌ای را شناسایی کردید که نیاز به بروزرسانی دارد، فراموش نکنید که عوامل زیر را حتما در نظر بگیرید:

  • به جز سایت‌های فروشگاه‌های آنلاین و سایت‌های گالری و عکس، حتما توجه داشته باشید که محتوایی که در صفحه وارد می‌کنید حتما اطلاعات مورد جستجوی مخاطب را به او نشان دهد و پیدا کردن و خوانایی آن راحت باشد. برای محصولات فروشگاهی یک بخشی را در انتهای صفحه در نظر بگیرید که توضیحات را در آن قرار دهید.
  • سلسله مراتب را رعایت کنید. قسمت‌ها و پیام‌های مهم و ارزشمند را در بالای صفحه و مطالب تکمیلی را در پایین بگذارید.
  • به نسبت محتوایی که اضافه می‌کنید، Call to Action یا دکمه فراخوان نیز اضافه کنید.
  • برای محتواهای تفصیلی از منو چسبان استفاده کنید تا کاربر را بیشتر بتوانید درگیر کنید.
  • با استفاده از ساب‌هدینگ‌ها، بولد کردن متن و عکس و تصویر به خوانایی هر چه بیشتر صفحه کمک کنید.

به تازگی سایت Search Engine Land مطلبی رو منتشر کرد که Bill Slawski درباره آن گفت:

TF-IDF یک ابزار سئو نیست. یک متود آماری برای موتورهای جستجو است که به کمک آن میزان اهمیت کلمه‌ای را شناسایی کنند.

سئو

پاسخی بگذارید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *