1. Spark có gì khác với Scala Collections?

Lợi ích của việc "lười biếng" (lazy evaluation)?


2. Tại sao Spark nhanh hơn Hadoop?

🚀 So sánh Hadoop & Spark khi xử lý dữ liệu lớn có nhiều vòng lặp (iteration):

🔎 Ví dụ đơn giản:


3. Ví dụ về lỗi phổ biến khi dùng Spark (Và cách sửa lỗi!)

📌 Bài toán Logistic Regression (Học máy - Machine Learning)

🚨 Lỗi phổ biến trong Spark: Không dùng cache/persist