دانشگاه صنعتی شریف

دانشکده‌ی مدیریت و اقتصاد

جلسه‌ی دفاع از پایان‌نامه‌ی کارشناسی ارشد

عنوان:

شناسایی کانال‌های تلگرام با اعضای غیرواقعی

ارایه‌دهنده:                         بهنام محمدی

استاد راهنما:                      دکتر شیرین اصلانی

استاد راهنمای همکار:           دکتر مسعود طالبیان

استاد ممتحن داخلی:            دکتر مهدی کیامهر

استاد ممتحن خارجی:           دکتر مسعود اسدپور

زمان:                                       چهارشنبه، ۲۶ تیر ۱۳۹۸، ۹:۴۵ صبح

مکان:                                      اتاق سمینار طبقه‌ی ۴

چکیده

 

امروزه استفاده از شبکه‌های اجتماعی و پیام‌رسان‌ها به جزء جدایی‌ناپذیر زندگی افراد تبدیل شده است، به‌طوری‌که کاربران ساعات نسبتاً زیادی از شبانه‌روز را در این سرویس‌های مبتنی بر وب سپری می‌کنند. بنابراین حضور در فضای مجازی دیگر امری اختیاری نبوده و شرکت‌ها و کسب‌وکارها برای بهره‌بردن از پتانسیل قوی شبکه‌های اجتماعی باید به تبلیغات در چنین شبکه‌هایی روی بیاورند. در کشور ما پیام‌رسان تلگرام به‌عنوان یک شبکه‌ی اجتماعی و ارتباطیِ بزرگ عمل کرده است. تا آنجا که آمارها از حضور ۴۰ میلیون ایرانی در تلگرام حکایت دارند. به‌این‌ترتیب کانال‌های تلگرامی می‌توانند در نشر تبلیغات محصولات و خدمات، اثرگذاری بالایی داشته باشند. هزینه‌ی این تبلیغات رابطه‌ی مستقیمی با تعداد اعضای کانال دارد. ولی یکی از مشکلات موجود در فضای تلگرام، موضوع اعضای غیرواقعی (تقلبی) کانال‌هاست. صاحبان این کانال‌ها به‌منظور افزایش اعتبار کانال خود، افزایش قیمت آن هنگام فروش، و افزایش هزینه‌ی تبلیغات در آن کانال، اقدام به ایجاد و اضافه‌کردن تعداد زیادی کاربر به‌صورت مصنوعی می‌کنند. این برای صاحبان کسب‌وکارها به‌معنی کاهش نرخ بازگشت سرمایه در تبلیغاتشان است. از آنجا که فقط صاحبان کانال به لیست اعضای آن دسترسی دارند، برای شناسایی کانال‌هایی که از اعضای غیرواقعی استفاده کرده‌اند باید به روش‌های غیرمستقیم روی بیاوریم. ما به‌این‌منظور از الگوریتم‌های خوشه‌بندی بهره می‌بریم و طی آن، در نمونه‌ای تصادفی از کانال‌ها که پیش‌تر برچسب‌گذاری کرده‌ایم، کانال‌های دارای اعضای غیرواقعی (یا اختصاراً «کانال‌های غیرواقعی») را شناسایی می‌کنیم. با انتخاب متغیرها و پارامترهای مناسب الگوریتم خوشه‌بندی سلسله‌مراتبی ترکیبی، روشی را پیشنهاد می‌دهیم که دقت بالایی در تشخیص خوشه‌های مختلف کانال‌ها داشته و مخصوصاً می‌تواند کانال‌های غیرواقعی را تمیز دهد. سپس روش خود را روی مجموعه‌ی بزرگی از کانال‌ها آزمایش کرده و به خوشه‌های مشابهی دست می‌یابیم که نشان می‌دهد نمونه‌ی تصادفی نماینده‌ی خوبی از کل داده‌ها بوده است. همچنین دقت الگوریتم خود را آزموده و متوجه شدیم ۸۴٪ کانال‌هایی که براساس روش ما غیرواقعی تشخیص داده شده‌اند، طبق نظر متخصص نیز از اعضای غیرواقعی استفاده کرده و غیرواقعی بوده‌اند.

واژگان کلیدی: اعضای غیرواقعی، تحلیل خوشه‌ها، داده‌های نامتعارف، خوشه‌بندی سلسله‌مراتبی، خوشه‌بندی ترکیبی