یادگیری عمیق گونهای از الگوریتمهای machine learning است که وابسته به محاسبات زیاد است. از زمان معرفی این دسته از الگوریتمهای یادگیری که با نام شبکههای عصبی نیز شناخته میشوند، سالها سپری شده است ولی رشد واقعی این دسته از روشها به سالهای اخیر و همزمان با پیشرفت رایانههای تک عملیات چند داده باز میگردد. این دسته از یادگیری به دلیل حجم بالای محاسبات در زمان آموزش و بازشناسی ، برای سالها مورد استفاده قرار نمیگرفت تا اینکه در سال 2012 و با پیشرفت سخت افزارهای پردازشی، در رقابتی در حوزهی بینایی ماشین مورد استفاده قرار گرفت و بیسابقهترین نتایج را تا آن زمان بدست آورد. در سالهای اخیر و با بهبود سخت افزارهای رایانهای، رایانههای تک عملیات چند داده پیشرفت چشمگیری داشتهاند. این پیشرفت سبب شده که واحدهای پردازشگر گرافیکی نیز افزایش سرعت و کارایی داشته باشند، به نحوی که توان امروز آنها چندین برابر سالهای نزدیک پیشین است. قدرت این رایانهها در انجام کارهای تکراری روی دادههای ماتریسی است. این عمل سبب میشود بتوانند یک عملیات مشخص را همزمان بر روی چند داده انجام دهند. با این کار، عملیاتی که با واحد پردازشگر مرکزی ممکن است ساعتها طول بکشد در کمتر از یک ثانیه قابلیت انجام خواهد داشت. کلیتِ روشهای تحتِ نظارتِ یادگیریِ ژرف به این صورت است که شبکه، ورودی و خروجیِ مربوط به دادههای آموزش را دریافت میکند و با توجه به پارامترها و محاسباتی که در داخل شبکه وجود دارد، خروجیِ شبکه روی دادههای ورودیِ آموزش محاسبه میشود. با استفاده از یک تابع هزینه ، خطایی که شبکه برای محاسبهی خروجی دارد، محاسبه میشود. در ادامه، با استفاده از روشهای بهینهسازی، تلاش میشود وزنها به گونهای تغییر کنند تا خطا بر روی دادگان آموزش کم شود.