Loading...

پاورپوینت داده کاوی

پاورپوینت داده کاوی (pptx) 16 اسلاید


دسته بندی : پاورپوینت

نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )

تعداد اسلاید: 16 اسلاید

قسمتی از متن PowerPoint (.pptx) :

داده کاوی فهرست + مقدمه --------------------------------------------- 4 حوزه فعالیتهای داده کاوی ---------------------------- 5 روش آنالیز آماری ----------------------------------- 7 روش داده کاوی ------------------------------------- 7 مراحل کاری در داده کاوی -------------------------- 12 مثال تفهیمی در مورد داده کاوی --------------------- 12 مراجع --------------------------------------------- 14 نتیجه گیری ---------------------------------------- 15 مقدمه پيشينه طرح موضوع داده‏كاوي به دهه 1980 و به صورت جدي، به دهه 1990 برمي‏گردد. پيش از آن٬ از سيستم‏هاي جمع‏آوري و مديريت داده‏ها و اصطلاحاً لايروبي داده‏ها استفاده مي‏شد٬ اما به مرور زمان٬ استخراج و كشف سريع و دقيق اطلاعات با ارزش و پنهان از پايگاه داده‏ها به‏عنوان داده‏كاوي مورد توجه قرار گرفت. به اين شكل بود كه فرايند داده‏كاوي به عنوان فرايند آماري و تجزيه و تحليل درفرايند كشف دانش در پايگاه داده‏ها ( KDD ) پررنگ شد ،به حدي كه گاه٬ داده‏كاوي ( DM ) به‏عنوان مترادف كشف دانش در پايگاه داده‏ها( KDD ) مورد استفاده قرار مي‏گرفت [2] . امروزه فرايند استخراج اطلاعات معتبر٬ از پيش ناشناخته٬ قابل فهم و قابل اعتماد از پايگاه داده‏هاي بزرگ و استفاده از آن در تصميم‏گيري و در فعاليت‏هاي تجاري داده‏كاوي ناميده مي‏شود [1] . در تعاريف متعدد و متنوع براي داده‏كاوي برموضوعاتي نظير: استخراج دانش كلان٬ كاوش در داده‏ها٬ تجزيه و تحليل داده‏ها و يافتن روابط و الگوهاي مطمئن بين داده‏ها تاكيد مي‏شود. هدف نهايي داده‏كاوي٬ ايجاد سيستم‏هاي پشتيباني تصميم‏گيري سازماني است. داده‏كاوي به استخراج اطلاعات مفيد و دانش از حجم زياد داده‏ها مي‏پردازد. داده‏كاوي٬ الگوهاي حاوي اطلاعات را در داده‏هاي موجود جست‌وجو مي‌كند. اين الگوها و الگوريتم‏ها، مي‏توانند توصيفي باشند يعني داده‏ها را توصيف كنند و يا جنبه پيش‏بيني داشته باشند، يعني از متغيرها براي پيش‏بيني ارزش‏هاي ناشناخته ساير متغيرها به‏كار روند. داده‏كاوي توصيفي، به‏دنبال يافتن اگرها در فعاليت‏ها يا اقدامات گذشته است و داده‏كاوي پيش‏بينانه با نگاه به سابقه٬ رفتار آینده را پيش‏بيني مي‏كند [1] . حوزه فعالیتهای داده کاوی هدف داده‏كاوي٬ تجزيه و تحليلاكتشافي داده‏ها٬ كشف الگوها و قواعد و الگوريتم‏ها٬ مدل‏سازي پيش‏بينانه وجست‌وجوي انحرافات است. براي انجام اين هدف٬ فرايند داده‏كاوي درجهت كشف دانش درمراحل مختلف انجام مي‌شودكه عبارت است از: 1.        شناسايي هدف و فهم حوزه كاربرد آن است و مشخص مي‏كند كه چه‏كاري٬ در چه حوزه‏ايانجام خواهد شد. 2.        انتخاب داده‏ها يعني تعيين اهداف براي تجزيه و تحليل و كشفآن 3.          آماده‏سازي داده‏ها شامل تميزسازي داده‏ها 4.        اتخاذ بهترين روشداده‏كاوي براي دست‏يابي به اهداف 5.          اجراي داده‏كاوي يعني به‏كارگيريالگوريتم 6.          ارزيابي و اعتبارسنجي يافته‏ها 7.        استفاده از نتايج و تثبيت وتحكيم دانش كشف شده 8.        تصميم گيري براساس دانش كشف شده اکتشاف در این مرحله معمولا با آماده سازی داده ها که ممکن است شامل تمیز کردن داده ها ، تبدیل داده ها ، زیر مجموعه های انتخاب آثار ضبط شده و انجام برخی از عملیات اولیه انتخابشروع می شود . سپس بسته به ماهیتتحلیلی ، این مرحله از فرایند استخراج داده ها ممکن است شامل هر انتخاب ساده و سرراست برای یک مدل رگرسیون استادانه درست شده را به تجزیه و تحلیل اکتشافی با استفاده از طیف گسترده ای از روش های گرافیکی و آماری به منظور شناسایی متغیرهای مربوطه و تعیین پیچیدگی از طبیعت مدل ها باشد. البته ناگفته نماند که داده کاوی معمولا با نوشتنمقدار زیادی گزارش و تحقیق و استعلام در آنها اشتباه گرفته می شود. اما در واقعداده کاوی هیچ کدام از اینها را شامل نمی شود. داده کاوی توسط تجهیزات خاصی صورتمی پذیرد، که عملیات کاوش را بر اساس تجزیه و تحلیل مکرر داده ها انجام می دهد داده کاوي با آنالیز های متداول آماری نیز متفاوت است؛در زیرمی توان برخی ازاصلی ترین تفاوت های داده کاوي و آنالیز آماری را مشاهده نمود: آنالیز آماری: •          آمار شناسان همیشه با یک فرضیه شروع بهکار می کنند •          آنها از داده های عددی استفاده می کنند •          آمارشناسان بایدرابطه هایی را ایجاد کنند که به فرضیه آنها مربوط است •          آنها می توانند دادههای نابجا و نادرست را در طول آنالیز مشخص کنند •          آنها می توانند نتایج کار خودرا تفسیر و برای مدیران بیان کنند داده کاوی : •          به فرضیه احتیاجیندارد •          ابزارهای داده کاوی از انواع مختلف داده ، نه تنها عددی می تواننداستفاده کنند •          الگوریتمهای داده کاوی به طور اتوماتیک روابط را ایجاد میکنند •          داده کاوی به داده های صحیح و درست نیاز دارد •          نتایج داده کاوینسبتا پیچیده می باشد و نیاز به متخصصانی جهت بیان آنها به مدیران دارد جهتدرک بهتر تفاوت داده کاوی و آنالیزهای آماری به مثال زیر که در مورد شناختکلاهبرداری های شرکت بیمه می باشد، توجه کنید. روش آنالیز آماری : یک مفسر ممکن است متوجه الگوی رفتاری شود که سبب کلاهبرداری بیمه گردد. براساس این فرضیه، مفسر به طرح یک سری سوال می پردازد تا این موضوع را بررسی کند. اگرنتایج حاصله مناسب نبود، مفسر فرضیه را اصلاح می کند و یا با انتخاب فرضیه دیگریمجددا شروع می کند. این روش نه تنها وقت گیر است بلکه به قدرت تجزیه و تحلیل مفسرنیز بستگی دارد.مهمتر از همه اینکه این روش هیچ وقت الگوهای کلاهبرداری دیگریرا که مفسر به آنها مظنون نشده و در فرضیه جا نداده ، پیدا نمی کند. روش داده کاوی : یک مفسر سیستم های داده کاوی را ساخته و پس از طی مراحلی ازجمله جمع آوری داده ها، یکپارچه سازی و اخلاص داده ها به انجام عملیات دادهکاوی می پردازد. داده کاوی تمام الگوهای غیرعادی را که از حالت عادی و نرمالانحراف دارند و ممکن است منجر به کلاهبرداری شوند را پیدا می کند. نتایج دادهکاوی حالت های مختلفی را که مفسر باید در مراحل بعدی تحقیق کند، نشان می دهند. درنهایت مدل های به دست آمده می توانند مشتریانی را که امکان کلاهبرداری دارند، پیشبینی نمایند. تحلیلهاي داده‏کاوي به دو روش با ناظر و بدون ناظر و از طریق الگوریتمهایی چون شبکه هاي عصبی ( (NN ، طبقه بندي و درخت تصمیم ( (C&RT ، ژنتیک، تحلیل سبد خرید، شبکه کوهونن قابل اجراست. علاوه بر این الگوریتمهاي رایج، همچنان الگوریتمهاي جدیدي براي اهداف تحقیقات علمی یا تجاري از طریق طرحهاي پژوهشی دانشگاهی، تولید می‏شود . ویژگیهاي منحصر بفرد داده کاوي را می توان به صورت زیر برشمرد [3] : ·         نه تنها بر فاز تحلیل، بلکه بر طراحی مطالعه و جمع آوري داده نیز تاثیر می گذارند ·         امکان جستجوي پاسخ سؤالات دقیق و با پیچیدگی بالا را در دادههاي جمع‏آوري شده فراهم می کنند. ·         قادرند که به سؤالات بطور واضح و مشخص پاسخ دهند. مزیت اصلی و تفاوت آنها با سایر تکنیکها نیز در همین است که بجاي ارائه صرف استراتژي کلان، پاسخهاي دقیق در اختیار محقق قرار می دهند. ·         امکان سنجش اثر متغیرهاي مختلف بر روي متغیرهاي وابسته را فراهم می کنند. ·         به مدیران کمک می‏کنند که تأثیر سناریوهاي آتی را مورد ارزیابی قرار دهند و با مدلسازي گزینه هاي متعدد و کمک به تصمیم گیري در شرایط عدم قطعیت به انتخاب مسیر حرکت بپردازند. محققینی که تنها روابط دو به دو را در نظر میگیرند و از داده کاوی استفاده نمی کنند، ابزار قدرتمندی را از دست می دهند که می تواند اطلاعات سودمندی را در اختیار آنان قرار دهد. در مسائل واقعی چندین متغیر به طور همزمان بر روي پاسخ تاثیر می گذارند، از این رو آنالیزهاي چندمتغیره جواب هاي دقیقتر و نزدیک به واقع تري را فراهم می کند. در شکل (1) فرایند کسب دانش از پایگاه دادهها به صورت شماتیک بیان شده است [4] همانطور که ملاحظه می شود یکی از گام هاي این فرایند، داده کاوي می باشد. موفقیت در این مرحله کاملا متاثر از سه گام قبل است بگونه اي که اگر هر کدام از مراحل قبلی به درستی انجام نپذیرد، نتایج حاصل از داده کاوي نه تنها مفید نبوده ممکن است گمراه کننده نیز باشد. تکنیکهاي داده کاوي از جمله تکنیکهاي نوین علمی هستند که در توصیف، تشریح، پیش بینی و کنترل پدیدهها به کار می روند [3] . این تکنیکها به اندازه‏گیري، تشریح و پیش‏بینی درجه وابستگی میان متغیرها میپردازند. روشهاي داده‏کاوي نه تنها بر جنبه هاي تحلیلی مطالعات، بلکه در طراحی و ابزارهاي جمع آوري داده براي تصمیم‏گیري و حل مسائل نیز تأثیر می‏گذارند. موفق‏ترین پروژههاي داده‏کاوي، در چارچوب فرآیند استانداردي اجرا می شودکه توسط یک تیم کاري در شرکت SPSS  در قالب پروژهاي به نام CRISP-DM  ارائه شده است[5]. برطبق CRISP-DM یک پروژه داده‏کاوی معین شامل چرخه حیاط شش مرحله‏ای است که توالی مراحل را نشان می دهد شکل (2). هر مرحله از ترتیب مراحل اغلب نتیجه وابستگی مراحل قبلی را نیز دربر دارد. مهمترین وابستگی بین مراحل نمایش پیکانها می باشد. خاصیت تکراری CRISP حاکی از چرخه بیرونی است که اغلب منجر به راه حلی برای مسئله تحقیقی یا تجاری با سوالات اضافی جالب توجه می شود.

نظرات کاربران

نظرتان را ارسال کنید

captcha

فایل های دیگر این دسته