شبیه سازی یادگیری عمیق با پایتون

بدون ديدگاه

یادگیری عمیق (Deep Learning) یکی از روش های یادگیری ماشین است که به کامپیوتر می آموزد همانند انسان ها رفتار کند. یادگیری عمیق یک فن آوری کلیدی در ماشین های بدون راننده است و آنها را قادر می سازد تا علامت توقف را شناسایی کنند و یا عابر پیاده را از یک چراغ جلو تشخیص دهند. یادگیری عمیق اخیرا توجه زیادی را به خود جلب کرده و دلیل آن رسیدن به نتایج مطلوبی است که قبلا امکان پذیر نبوده است.

در Deep Learning کامپیوتر می آموزد برای انجام وظایف که به صورت مستقیم از عکس، نوشته و صدا حاصل می شوند، به صورت طبقه بندی شده عمل کند. پیشرفت هایی اخیرا در یادگیری عمیق صورت گرفته تا جایی که یادگیری عمیق در برخی از وظایف مانند طبقه بندی اشیاء در تصاویر پیشرفت کرده است. در حالی که یادگیری عمیق برای اولین بار در دهه 1980مطرح شد، اما دو دلیل اصلی آن به تازگی مفید بوده و مورد بررسی قرار گرفته است:

  • یادگیری عمیق، نیاز به مقدار زیادی  اطلاعات برچسب دار دارد. به عنوان مثال، توسعه خودرو بدون راننده نیاز به میلیون ها عکس و هزاران ساعت ویدئو دارد.
  • یادگیری عمیق نیاز به قدرت محاسباتی قابل توجهی دارد. پردازنده های با کارایی بالا یک معماری موازی دارند که برای یادگیری عمیق مفید است. هنگامی که با خوشه یا محاسبات ابری ترکیب می شود، این تیم ها را قادر می سازد تا زمان آموزش برای یک شبکه آموزشی عمیق را از هفته ها تا چند ساعت یا کمتر کاهش دهند.

 

نحوه عملکرد Deep Learning

یادگیری عمیق از معماری شبکه عصبی استفاده می کند، از این جهت مدل های یادگیری عمیق اغلب به عنوان شبکه های عصبی عمیق نامیده می شوند. اصطلاح “عمیق” در این واژه اشاره به تعداد لایه های پنهان در شبکه عصبی دارد که شمار آن به 150 عدد می رسد، این در حالی است که شبکه های عصبی سنتی فقط شامل دو لایه پنهان هستند.

مدلهای فراگیر یادگیری با استفاده از مجموعه های بزرگ داده های برچسب گذاری شده و معماری شبکه های عصبی آموزش داده می شوند که مستقیما از داده ها بدون نیاز به دستیابی به ویژگی های دستی یاد می شود. شبکه های عصبی، که در لایه هایی تشکیل می شوند که متشکل از مجموعه گره های متصل هستند. شبکه ها می توانند ده ها یا صدها لایه پنهان داشته باشند. یکی از محبوب ترین انواع شبکه های عصبی عمیق به عنوان شبکه های عصبی کانولوشن (CNN یا ConvNet) شناخته می شود. یک CNN برای یادگیری از داده های ورودی استفاده می کند. این معماری برای پردازش داده های دو بعدی مانند تصاویر، مناسب است. CNN ها نیاز به استخراج ویژگی های دستی را از بین می برند، بنابراین نیازی نیست ویژگی های مورد استفاده برای طبقه بندی تصاویر را شناسایی کنید.

نوشتن دیدگاه

نشانی ایمیل شما منتشر نخواهد شد.

5 × سه =