پاورپوینت داده کاوي الگوهاي تکرارشونده در جريان دادهها
■بسياری از برنامه های کاربردی نوع داده جديدی به نام جريان داده را توليد و تحليل می کنند که در آن داده ها به صورت پويا به يک بستر ( يا پنجره ) وارد و يا از آن خارج می شوند .
■خواص جريان داده :
■حجم زياد و گاه نامحدود
■تغييرپويا
■جريان به درون و خارج با يک ترتيب مشخص
■پيمايش يکبار يا تعدا د محدود
■نيازمند زمان پاسخ سريع ( اغلب بلادرنگ )
■ممکن است دارای چندين منبع باشند .
■در جريان داده تعدادی يا همه داده های ورودی که بايد روی آنها عمليات انجام شود روی ديسک يا حافظه اصلی قرار ندارند و بيشتر به صورت جريان داده پيوسته می رسند .
■جريان داده ها از داده های ذخيره شده در موارد زير متفاوت اند :
■عناصر داده ها به صورت بر خط می رسند .
■سيستم هيچ گونه کنترلی روی ترتيب عناصر دادهای ( روی عناصر جريان يا جريانهای دادهای ) ، که جهت پردازش میرسند ، ندارد .
■جريانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند .
■يک عنصر از جريان داده پس از پردازش يا ناديده در نظر گرفته می شود يا آرشيو می شود .
■دادهکاوی استخراج اطلاعات مفيد و دانش از حجم زياد داده ها است .
■تکنيک هايی دادهکاوی :
■تحليل قواعد وابستگی : کشف قواعد وابستگی است که هر قاعده وابستگی به صورت جفت صفت- مقدار هايی است که اغلب با هم در يک مجموعه داده اتفاق می افتند .
■کلاسهبندی : فرايند يافتن مجموعه مدلهايی است که کلاس های داده را توصيف و مشخص میکنند تا بدين وسيله بتوان کلاس اشيايی را که نامشخص است مشخص کرد .
■تحليل خوشه ها : اشيا بر اساس قاعده ” زياد کردن شباهت بين عناصر کلاس و کم کردن شباهت بين کلاس ها ” ، اشيا را به خوشه هايی تقسيم می کند . اشيا داده ای موجود در يک خوشه بيشترين شباهت را با هم دارند و با اشيا ساير خوشه ها بسيار متفاوت هستند .
پاورپوینت داده کاوي الگوهاي تکرارشونده در جريان دادهها