مقدمه ای بر بهینه سازی در یادگیری عمیق: گرادیان نزول