پاورپوینت پاورپوينت ارزیابی روش رگرسیون در پیشبینی حجم ترافیک و مقایسه آن با روش شبکه عصبی (pptx) 16 اسلاید
دسته بندی : پاورپوینت
نوع فایل : PowerPoint (.pptx) ( قابل ویرایش و آماده پرینت )
تعداد اسلاید: 16 اسلاید
قسمتی از متن PowerPoint (.pptx) :
گردآورنده
:
استاد
مربوطه
:
ارزیابی
روش رگرسیون
در
پیشبینی حجم
ترافیک
و
مقایسه آن با
روش شبکه
عصبی
دادهکاوي فرآیند تجزیه و تحلیل داده ها و تبدیل آن به اطلاعات مفید است. در این فرآیند از
ابزارهاي متفاوتی
استفاده می شود، یکی از این ابزارها استفاده از رگرسیون در این فرآیند است. رگرسیون روشی براي مدلسازي و تحلیل
داده هاي
عددي است. این روش براي
پیشبینی مقادير آينده
ي متغیر وابسته، آزمودن
نظریه ها
، و تحلیل
پدیده شناختی پدیده ها
به کار میرود. این روش به کاربر اجازه می دهد تا از ابعاد مختلف
به تجزیه
و تحلیل داده ها، دسته بندي آنها و خلاصه آنها به روابط شناخته شده بپردازد. در حوزه حمل و نقل
که همواره
با حجم انبوهی از داده ها مواجه می باشد، پردازش داده ها و داده کاوي اهمیت شایانی دارد. در
این تحقیق
ضمن بررسی پیشبینی حجم ترافیک به بررسی روش رگراسیون در فرآیند مدلسازي پرداخته می شود. سپس از این روش براي پیشبینی حجم برونشهري محور ساري- قائمشهر و محور بابل –
قائمشهر استفاده
میشود. و صحت مدل استفاده شده در مقایسه با روش شبکه عصبی اعتبارسنجی شده است.
نتایج حاصل
از تحقیق، قدرت بالاي رگرسیون در را در پیشبینی هاي ترافیکی نشان می دهد.
کلمات کلیدي: حمل و نقل، پیشبینی حجم ترافیک، رگرسیون، شبکه عصبی
چكيده :
حجم ترافیک یکی از اجزاي اصلی ترافیک می باشد که در تمامی مسایل حمل ونقل بعنوان ورودي
هاي مساله
بکاربرده می شود. یکی از عناصر حجم ترافیک که در آیین نامه ها از آن یاد شده است، حجم متوسط ترافیک روزانه در
سال
( AADT
)
می باشد. شاهی در کتاب خود متوسط ترافیک روزانه در سال را مجموع حجم ترافیک سالیانه بخش بر 365 تعریف میکند. این حجم بوسیله
دستگاه هاي
ثابت
و سیار
بطور روزانه شمارش می شود. در ایران معاونت راهداري وزارت راه و شهر سازي ( سازمان حمل
و نقل
و پایانه ها) شمارش روزانه حجم عبوري از
راه هاي
مختلف را انجام می دهد. علاوه بر آن بسیاري
از شهرداري
ها نیز براي بررسی وضع ترافیک شهر خود از آمارگیري روزانه استفاده می کنند
.
از آنجاییکه استفاده از متوسط حجم ترافیک براي طراحی هاي آینده مورد نیاز است، براي
پیش بینی
حجم متوسط ترافیک روزانه در سال مدلسازي صورت می گیرد و از اطلاعات جمع آوري شده
از متغیر
هاي موثر در سفر براي ساخت مدل استفاده می شود. این اطلاعات در فرآیند مدلسازي
مورد کاوش
قرار گرفته و روابط بین آنها مورد توجه قرار می گیرد. به مجموعه این کاوش ها دادهکاوي
اطلاق می
گردد. در واقع، دادهکاوي فرآیندي جهت شناسایی الگوها و مدل ها در حجم وسیعی از داده
هاست بطریقی
که این الگوها براي انسان قابل درك باشند.
مقدمه :
اصطلاح دادهکاوي به بهره گیري از ابزارهاي تجزیه و تحلیل
داده ها
به منظور کشف الگوها و
روابط معتبري
که تا کنون ناشناخته بودهاند اطلاق میشود. به کمک ابزارهاي داده کاوي میتوان
مقادیر متغیرهایی
را پیش بینی کرد و رفتار آن متغیرها را در آینده پیش بینی و توصیف نمود. این ابزارها
ممکن است
مدلهاي آماري الگوریتمهاي ریاضی و روشهاي یاد گیرنده باشند که کار خود را به صورت خودکار
و بر
اساس تجربهاي که از طریق
شبکه هاي
عصبی یا
درخت هاي
تصمیم گیري به دست میآورند بهبود بخشند. داده کاوي منحصر به گردآوري و مدیریت
داده ها
نبوده و تجزیه و تحلیل اطلاعات و پیش بینی
را نیز
شامل
می شود
.
تکنیک هاي داده کاوي
به طور تاریخی به گونهاي گسترش یافتهاند که به سادگی
می توان
آنها را با ابزارهاي
نرم افزاري
امروزي و موجود تطبیق داده
مانند
MINITAB
و
SPSS
و
WEKA
و از اطلاعات جمع آوري شده بهترین بهره را برد. در حالیکه محصولات دادهکاوي ابزارهاي
قدرتمندي می باشند
اما در نوع کاربردي کافی نیستند؛ چرا که براي کسب موفقیت، داده کاوي نیازمند تحلیل
گرانحرفهاي
و متخصصان ماهري میباشد که بتوانند ترکیب خروجی بوجود آمده را تحلیل و تفسیر
نمایند. بنابراین
می توان گفت محدودیتهاي داده کاوي مربوط به داده اولیه یا افراد است تا اینکه مربوط
به تکنولوژي
باشد. داده کاوي برحسب مورد استفاده می تواند از چندین رشته علمی بطور همزمان بهره
ببرد نظیر
: تکنولوژي پایگاه داده، هوش مصنوعی، شبکه هاي عصبی، آمار، سیستم هاي مبتنی بر
دانش، بازیابی
اطلاعات وغیره.
آشنایی با دادهکاوي
مفهوم رگرسیون به معناي واپسگرایی و باز گشت می باشد و توسط فرانسیس گالتون 1 در
قرن نوزدهم
ابداع و براي توصیف یک پدیده زیستی بکار برده شد. فرانسیس گالتون با انتشار مقاله
بازگشت نسبت
به حد وسط در قامت ارثی نتیجه گرفت که ویژگی هایی مشخص (به عنوان مثال، قد) در پدر
و مادر
به طور کامل به فرزندان نمی رسد. در عوض، ویژگی در نسل هاي بعدي به سمت یک نقطه
متوسط که
بر می گردد (پدیده اي که به عنوان رگرسیون به سمت متوسط شناخته می شود). براي گالتون رگرسیون تنها این معناي بیولوژیکی را دارا بود
.
اما کار گالتون بعدها توسط اٌدنی یول و کارل پیرسون به یک چهار چوب کلی تر آماري تبدیل شد. در کار یول و پیرسون توزیع مشترك پاسخ و متغیر هاي توضیحی در حالت گاوسی فرض شده است. این فرض توسط فیشر و در کارهاي او در سال 1922 و 1925 تضعیف شد . فیشر فرض کرد که توزیع شرطی متغیر پاسخ، گاوسی است، اما توزیع مشترك لازم نیست اینگونه باشد
.
رگرسیون
در
سال هاي
اخیر گرایش به شبکه هاي عصبی تحت تأثیر عوامل مختلفی افزایش یافته است که
مهمترین آنها
استفاده از خصوصیات خاص پردازش اطلاعات در مغز است که این قابلیت در
روش هاي
مرسوم
برنامه نویسی
وجود ندارد. از جمله این خصوصیات می توان به قدرت یادگیري و تعمیم مثالها، امکان ارایه
راه حل
براي مسایلی که شرایط متغیر دارند و پردازش سریع موازي اطلاعات اشاره نمود. البته شبکه
هاي عصبی
را نمی توان بعنوان جایگزینی براي
روش هاي
مرسوم محاسباتی و پردازشی بکار برد بلکه باید
به دیده
یک مکمل بر
روش هاي
فوق به آنها نگریست.
شبکه هاي عصبی در واقع پردازنده هاي موازي گستردهاي هستند که از واحدهاي پردازشگر
ساده اي
(نرون) تشکیل شده اند که توانایی ذخیره دانسته هاي تجربی و آماده سازي آن براي کاربردهاي
بعدي را
دارا می باشند. ذخیره دانسته هاي تجربی و آماده سازي شبکه جهت کاربردهاي بعدي شبکه
هاي اعصاب
تحت پروسه اي صورت می گیرد که آموزش نامیده می شود. آموزش شبکه تحت دو روش
نظارت شده
و غیرنظارت شده صورت می گیرد که در هر دو حالت شبکه قادر است تا با ورود یکسري
ورودیها، خروجیهاي
خاص و مطلوبی را صادر کند. در مقابل شبکه غیر نظارت شده که خود بخود و تحت
شرایط خاصی
یاد می گیرد و خروجی صادر می کند؛ شبکه نظارت شده باید تحت سرپرست و با استفاده از
یک دسته
آموزشی که شامل ورودیها و خروجیهاي مطلوب و مقدار خطاست آموزش
ببنید. نحوه
عمل آموزش شبکه به این صورت است که ابتدا ورودیها به شبکه اعمال می شود.
شبکه عصبی
پیش بینی میزان سفر از اولین داده هاي موردنیاز در طراحی هاي ترافیکی می باشد و با پیچیدگی
خاصی همراه
است. اینکه مشخص شود چه میزان سفر در منطقه اي مشخص و تحت شرایطی مشخص انجام
می گیرد
همواره مورد بحث بوده و روشهاي مختلفی براي پیش بینی آن بوجود آمده است. در مهمترین
این روش
ها با بررسی داده هاي موجود روابط مشخصی را بین آنها کشف می کنند که مدلسازي نامیده
می شوند
. روش هاي پیش بینی مستقیم مانند روشهاي مدل ریاضی و روش هاي غیر مستقیم مانند
مدل هاي
ملهم از طبیعت و یا ابتکاري از روشهاي گسترده پیش بینی سفر در حل مسایل ترافیکی می
باشد. حجم
ترافیک برون شهري یکی از مسایل حمل ونقلی است که پیش بینی سفر انجام گرفته در
آن نسبت
به پیش بینی سفر درون شهري از گستردگی بیشتري برخوردار است و پارامتر هاي فراوانی در
آن نقش
دارند. در این تحقیق سعی شده است با در نظر گرفتن تعدادي از این پارامتر ها با استفاده
رگرسیون به
پیشبینی ترافیک برون شهري در ایران پرداخته شود. در این راستا مساله موردي پیش بینی
ترافیک محور
ساري به قائمشهر و قائمشهر به بابل در جهت هاي رفت و برگشت در استان مازندران مطرح و
داده هاي
مورد نیاز در این شهرها جمع آوري شد. با استفاده از اطلاعات و آمار سازمان حمل ونقل جاده اي و سالنامه هاي آماري و خصوصیات اقتصادي اجتماعی شهرهاي مبدا و مقصد مساله، مقادیر
پارامترهاي پیش
بینی مورد نیاز جمع آوري و برداشت و داده ها جهت داده کاوي و بررسی رایطه خطی بین آنها توسط نرم
افزار
MINITAB
پردازش شده است.
مساله ترافیکی
در این بخش ضمن ارایه متدولوژي انجام مطالعات به ذکر مشخصات و پیش فرضها و مجموعه
پارامترهاي ورودي
مدل نیز پرداخته شده است که در ادامه به آن اشاره می شود. محور ساري به قائمشهر بعنوان
رتبه دوم
حجم ترافیک برون شهري در کشور داراي دو باند رفت و برگشت مجزا و بطول تقریبی 22
کیلومتر می
باشد که در این تحقیق حجم ترافیک مسیر رفت از قائمشهر به ساري و از ساري به قائمشهر
مد
نظر قرار گرفته است. محور بابل به قائمشهر نیز داراي دو باند رفت و برگشت مجزا و بطول تقریبی 20
کیلومتر می
باشد که حجم ترافیک مسیر رفت ازبابل به قائمشهر و از قائمشهر به بابل مدنظر قرار گرفته است.
داده هاي
این محورها توسط
دستگاه هاي
مکانیزه شمارش سازمان حمل و نقل و پایانه هاي کشور برداشت
می شود
و در سایت سازمان مذکور در دسترس است. پارامترهاي بسیاري در حجم ترافیک محورهاي
نقش دارند
که بدلیل عدم دسترسی به اطلاعات کامل نمی توان تمامی آنها را در نظر گرفت. در این
مقاله خصوصیات
اقتصادي اجتماعی مبداو مقصد مانند تعداد افراد شاغل، وضعیت جوي، میزان بارش،
تعداد دانشجویان
و مقدار مصرف بنزین براي بررسی ترافیک، تحلیل روند و پیش بینی وضع آینده آن در نظر گرفته شده است. براي مدلسازي بواسطه روش شبکه عصبی از نرم
افزار
WEKA
و براي مدلسازي بواسطه رگرسیون از نرم
افزار
MINITAB
استفاده شده است
.
متدولوژي
داده هاي مورد نیاز در شبکه عصبی بصورت داده هاي یادگیري یا آموزش، داده هاي تست یا آزمایش
و داده
هاي تست همزمان می باشند. شبکه از داده هاي یادگیري براي آموزش خود وپس از آن
تخصیص وزن
به هر گره و تعدیل خطا استفاده می کند و در انتها از این وزن ها براي پیش بینی داد هاي
تست استفاده
می کند. شبکه داراي تعداد نرون در لایه هاي ورودي، میانی و خروجی می باشد. تعداد
نرونهاي لایه
هاي ورودي و خروجی کاملا به تعداد متغیرهاي مسئله و خروجی مسئله بترتیب بستگی دارد
و تعداد
نرونها در لایه هاي میانی (پنهان) بستگی به مقدار دقت پاسخی دارد که از شبکه دریافت می
شود و
بسته به تجربه و مقدار خطا تغییر می یابد. با تغییر تعداد نرونها در لایه هاي میانی، تعداد لایه
هاي میانی
و انواع توابع آستانه اي، شبکه هاي مختلفی ساخته می شود. در واقع این مقادیر از هیچگونه
فرمول و
یا قاعده خاصی پیروي نمی کنند. معمولاًتعداد مناسبی لایه پنهان و نرون در لایه پنهان انتخاب
می شود
و سپس با تغییر تعداد لایه ها یا تعداد نرونها، کاربر سعی در رسیدن به مقدار خطاي مورد نیاز و نزدیک شدن هرچه بیشتر خروجیهاي واقعی و مطلوب به یکدیگر دارد. در این نرم افزار شبکه بوسیله
تابع انتقالی
خطی در لایه خروجی و سیگموئیدي در لایه ورودي، بهمراه 13 نرون در لایه ورودي و 7 نرون
در لایه
میانی کمترین خطا را نتیجه داده است که در ادامه با انجام اعمال آزمایش و اعتبارسنجی،
صحت مدل
شبکه اعصاب ساخته شده بررسی می شود.
مدل سازي شبکه عصبی