متن کامل پایان نامه مقطع کارشناسی ارشد رشته  کامپیوتر با عنوان :بررسي روشهاي خوشه بندي توزيعي در ادامه مطلب می توانید صفحات ابتدایی این پایان نامه را بخوانید و در صورت نیاز به متن کامل آن می توانید از لینک پرداخت و دانلود آنی برای خرید این پایان نامه اقدام نمائید.

دانشگاه آزاد اسلامي
واحد تهران جنوب
دانشكده تحصيلات تكميلي

سمينار براي دريافت درجه كارشناسي ارشد “M.Sc”
مهندسي كامپيوتر – نرم افزار

عنوان :
بررسي روشهاي خوشهبندي توزيعي

برای رعایت حریم خصوصی اسامی استاد راهنما و نگارنده درج نمی شود

تکه هایی از متن به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چكيده
چگونگي سازماندهي و ادغام نتايج پرسوجوي بازيابيشده از منابع مختلف، يكي از موضوعات كليدي در
بازيابي اطلاعات توزيعي است. برخي از پژوهشها و آزمايشات پيشين توصيه ميكنند كه مرور اسـنادي
كه بهصورت خوشه بيان ميشوند به نسبت اسنادي كه تنها در يـك ليـست مطـرح مـي شـوند كـارآيي
بيشتري دارند. ارائهي نتايج بازيابي بهصورت خوشه مبتنيبر فرضيهي خوشه است. بر طبق اين فرضـيه،
وضعيت اسناد درون يك خوشه ارتباط مشابهي با پرسوجوي مطرح شده دارند.
خوشهبندي ميتواند بهعنوان فرآيند بخشبندي يك مجموعه از الگوها به گـروههـاي معنـادار همگـن و
منفصل بهنام خوشهها تعريف شود. در خوشهبندي دادههـاي توزيـعشـده، مجموعـهي دادههـا در ميـان
چندين سايت توزيع شدهاند.
خوشـهبنـدي در حـوزههـاي كـاربردي مـدرن مثـل تعـاون در خريـد و فـروش ، بيولـوژي مولكـولي و
چندرسانهاي وظيفهاي مهم بر دوش دارد. در بسياري از اين حـوزههـا ، اساسـا اطلاعـات از سـايتهـاي
مختلفي گرفته ميشود. براي اقتباس اطلاعات از اين داده ها، آنها بهصورت يك مجموعـه درآمـدهانـد و
خوشهبندي ميشوند.
در سالهاي اخير، پيشنهاداتي براي اكتشاف دانش و كاوش دادهها، و بهويژه براي خوشهبندي گـسترش
يافته اما تنها تعداد كمي از آنها براي منابع داده اي توزيعشده اسـت. در ايـن تحقيـق، يـك مـروري بـر
الگوريتمهاي خوشهبندي توزيعي مطرح شدهاست.

مقدمه
امروزه حتي با گسترش وب، كاربران براي يافتن نيازهاي خود با مناب ع اطلاعاتي بسياري مواجه هـستند.
چگونگي يافتن سريع نيازهاي كاربر از اين اقيانوس اطلاعات، يك مسئله ي مهم است. اگـر چـه راهحـل
استفاده از موتور هاي جستجو در پايگاه دادههاي يكتا ظاهرا براي آن كارآمد است ، اما در عمل ايـن راه
حل براي جمع آوري همهي اطلاعات مورد نياز ، به خـصوص اطلاعـات مـرتبط بـا منـابع مخفـي وب ،
ممكن است مشكلاتي را به دنبال داشته باشد.
كشف دانش در پايگاه داده، كاوش داده هاناميده ميشود و ابزاري ارزشمند براي گزينش اطلاعات مفيـد
از هر پايگاه داده است. اين ابزار قابليت محاسباتي بالايي دارد و ميتواند به توزيع و موازيسازي دادههـا
بپردازد. براي مسائل مربوط به كاوش دادههـا ، لازم اسـت تـا بخـشبنـدي هوشـمندانه اي از دادههـا را
بهدست آوريم. بدين طريق ما مي توانيم داده هارا به صورت جداگانه بررسي كنيم. به منظـور كمـك بـه
قانونمند كردن مساله، معيار اصلي براي بخشبندي هوشمندانه ميتواند اين باشد كه دادههاي درون هر
بخش تا آن جاييكه احتمال دارد ، با هم مشابه باشند، در حالي كه دادههاي درون بخشهاي مختلف بـا
يكديگر هيچ شباهتي نداشته باشند. اين معيار همان چيزي است كه در الگوريتمهاي خوشهبندي مـورد
استفاده قرار ميگيرد و به ما اجازه ميدهد تا براي دستيابي به كـل پايگـاه داده، بـه مـوازيسـازي ايـن
مساله بپردازيم.
در فصل اول اين تحقيق، مفاهيم توزيعشدگي بهطور خلاصه مورد بررسي قرار ميگيرد. سپس در فـصل
دوم، به بحث در مورد خوشهبندي توزيعي پرداخته ميشود. در فصل سوم، الگـوريتمهـاي خوشـهبنـدي
مورد بررسي و مطالعه قرار گرفته و بهدنبال آن برخي از كاربردهاي خوشهبندي در فصل چهـارم مطـرح
ميشوند. در نهايت، در فصل پنجم يك نتيجهگيري كوتاهي از اين مباحث به عمل ميآيد.

مقدمه 1-1
يك سيستم توزيع شده، از يك مجموعه از كامپيوترهاي مستقل تشكيل شده است كه كـاربران، آنهـا را
به صورت يك سيستم يكپارچه مي بينند.[1]
چند مطلب از تعريف فوق مشخص مي شود. اول اينكه در يك سيستم توزيـع شـده، تعـدادي كـامپيوتر
وجود دارد. مطلب ديگر اينكه كاربران سيستم توزيع شده، تصور مي كنند كه با يك سيستم واحـد كـار
مي كنند. از مجموع اين دو نكته مي توان فهميد كه اجزاي داخل يك سيستم توزيع شده بايد به شكلي
با همديگر تعامل داشته باشند كه بتوانند براي كاربر خود اين تصور را ايجاد كنند كه با يك سيستم كار
مي كند. اينكه چگونه چنين تعاملي ايجاد شود يك مسأله ي م هم در مبحث سيستم هاي توزيـع شـده
است.
در واقع هيچ اجباري در مورد نوع كامپيوترهاي داخل سيـستم توزيـع شـده، همچنـين در مـورد روش
اتصال بين آنها وجود ندارد. يعني اينكه نبايد اين محدوديت ها را كه اجزاي اين سيـستم هـا يـا اتـصال
بين آنها از نوع خاصي باشند، براي سيستم هاي توزيع شده در نظر گرفت. از طرفي كاربر اين سيستمها
نبايد هيچ اطلاع و نگراني در مورد تفاوت هاي بين كامپيوترهاي مختلف موجود در يك سيـستم توزيـع
شده و روشي كه با هم ارتباط برقرار مي كنند، همچنين سازمان داخلي سيستم، داشته باشد . ايـن يـك
ويژگي حياتي براي سيستم هاي توزيع شده است كه به آن شـفافيت مـي گوينـد . سيـستمي كـه ايـن
ويژگي را نداشته باشد، طبق قسمت دوم تعريف فوق يك سيستم توزيع شده خوانده نمي شود.
ويژگي ديگر سيستم هاي توزيع شده اين است كه اين سيستم ها طبق قوانين اسـتانداردي كـه فرمـت،
محتوا و معني پيام هاي فرستاده شده و دريافت شده را مشخص مي كنند، ارتباط برقرار مي كننـد . بـه
اين ويژگي باز بودن مي گويند. اين قوانين به طور رسمي در قالب پروتكل ها تدوين مي شوند . پيروي از
اين پروتكل ها باعث مي شود اجزاي متنوع و متفاوت موجود در سيستم هاي توزيع شـده كـه احتمـالاً
مربوط به عرضه كنندگان متفاوت هستند، بتوانند با هم كار كنند.

 تعداد صفحه :82

قیمت : پنج هزار تومان

—-

پشتیبانی سایت :       

*         serderehi@gmail.com

رابی

جستجو در سایت : کلمه کلیدی خود را وارد نمایید :