Loading
0 رای
  • ارائه یک الگوریتم موثر و تطبیقپذیر برای خوشهبندی متون فارسی مبتنی بر الگوریتم بهینه سازی فاخته

  • نویسندگان مقاله
    • رضا باقری گروه کامپیوتر، واحد اراک، دانشگاه آزاد اسلامی اراک، ایران
  • چکیده مقاله

    خوشهبندی متون یکی از تکنولوژیهای اصلی متنکاوی و بازیابی اطلاعات است. ایده اصلی خوشهبندی اطلاعات، جداکردن نمونهها از یکدیگر و قراردادن آنها در گروههای شبیه به هم میباشد. عملکرد الگوریتمهای خوشهبندی سنتی ممکن است به دلیل ابعاد بالا و یا حجم کم دادههای متنی رضایتبخش نباشد. همچنین یکی از بزرگترین مشکلات الگوریتمهای سنتی پرکاربرد مانندKmeans حساسیت بالا به نقاط اولیه است. این مقاله یک روش جدید برای خوشهبندی متون بر اساس آمارهای پیکره متنی و الگوریتم بهینه سازی فاخته ارائه میدهد. در این روش نقاط اولیه نه تنها از طریق یادگیریهای آماری ماتریس تشابه اسنادی که به یک مجموعه تقسیمشده است, بلکه از طریق اسنادی که هنوز تقسیمبندی نشدهاند نیز انتخاب میشوند. با این روش میتوان میزان حساسیت الگوریتم خوشهبندی نسبت به مجموعه نقاط اولیه را کاهش داد. برخی از مقادیر آستانهی مورد استفاده در الگوریتم از آمار خودکار و بصورت پویا بدست آمده است. این مقاله همچنین از الگوریتم بهینهسازی فاخته جهت یافتن بهترین مقادیر آستانه استفاده کرده است. نتایج تجربی بدست آمده بر روی چندین مجموعه داده نشان میدهد که الگوریتم پیشنهادی قادر به ارتقاء کیفیت خوشهبندی متون در مقایسه با الگوریتمهای خوشهبندی سنتی میباشد. همچنین این الگوریتم در مجموعه دادههای مختلف پایدارتر میباشد.

  • کلید واژه

    خوشهبندی/دادهکاوی/ مشابهت/الگوریتم بهینه سازی فاخته

  • راهنمای خرید و دانلود
    • اگر در مجموعه Confpaper عضو نیستید، به راحتی می توانید از طریق دکمه زیر اصل این مقاله را خریداری نمایید .
    • با عضویت در Confpaper می توانید اصل مقالات را با حداقل 20 درصد تخفیف دریافت نمایید .
    • برای عضویت به صفحه ثبت نام مراجعه نمایید .
    • در صورتی که عضو این پایگاه هستید،از قسمت بالای صفحه با نام کاربری خود وارد سایت شوید .
    • لینک دانلود فایل خریداری شده به ایمیل شما ارسال میگردد .
نظرات کاربران

برای ارسال نظر، لطفا وارد حساب کاربری خود شوید.