نوع فایل :power point
قابل ویرایش: 40 اسلاید
قسمتی از اسلایدها:
■در جریان داده تعدادی یا همه داده های ورودی که باید روی آنها عملیات انجام شود روی دیسک یا حافظه اصلی قرار ندارند و بیشتر به صورت جریان داده پیوسته می رسند .
■جریان داده ها از داده های ذخیره شده در موارد زیر متفاوت اند :
■عناصر داده ها به صورت بر خط می رسند .
■سیستم هیچ گونه کنترلی روی ترتیب عناصر دادهای ( روی عناصر جریان یا جریانهای دادهای ) ، که جهت پردازش میرسند ، ندارد .
■جریانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند .
■یک عنصر از جریان داده پس از پردازش یا نادیده در نظر گرفته می شود یا آرشیو می شود .
فهرست مطالب واسلایدها:
جریان داده
دادهکاوی
دادهکاوی روی جریان داده ها
الگوهای تکرارشونده در پایگاهدادهها
الگوهای تکرارشونده
الگوریتم Apriori
شبه کد الگوریتم Apriori
نحوه تولید کاندید
جزییات الگوریتم Apriori
الگوریتم Lossy Counting
ضمانت های Lossy Counting
Lossy Counting - نکات
Lossy Counting در عمل
ساختن درخت الگوهای تکرارشونده از یک پایگاه داده تراکنشی
پنجره زمانی
الگوهای تکرارشونده و پنجره های زمانی
تعریف مساله
استفاده از تقریب
هرس کردن دم
الگوریتم FP-Stream
منابع و ماخذ:
■B. Babcock, S. Babu, M. Datar, R. Motwani and J. Widom, “Models and Issues in Data Stream Systems”, Proc. 2002 ACM-SIGACT/SIGART/SIGMOD Int. Conf. on Principles of Data base (PODS'02), Madison, WI, June 2002. (Conference tutorial)
■Gurmeet Singh Manku, Rajeev Motwani.. Approximate Frequency Counts over Data Streams, VLDB’02
■ C. Giannella, J. Han, J. Pei, X. Yan and P.S. Yu, “Mining Frequent Patterns in Data Streams at Multiple Time Granularities”, H. Kargupta, A. Joshi, K. Sivakumar, and Y. Yesha (eds.), Next Generation Data Mining, 2003.
■
■Geoff Hulten, Laurie Spencer, Pedro Domingos: Mining time-changing data streams. KDD 2001: 97-106
■J. Han, J. Pei, and Y. Yin. Mining frequent patterns without candidate generation. In Proc. Of 2000 ACM SIGMOD,pages 1-12,2000.
■
■S. Muthukrishnan, Data streams: algorithms and applications, Proceedings of the fourteenth annual ACM-SIAM symposium on Discrete algorithms, 2003.
■Mohamed Medhat Gaber , Shonali Krishnaswamy , Arkady Zaslavsky . Ubiquitous Data Stream Mining , 2003
■Andrew Wu . Mining Data Streams : A Review . 2003