
Data Engineer
Chương trình đào tạo Data Engineer tại RobustX được thiết kế đặc biệt cho sinh viên năm 3, 4, mới tốt nghiệp hoặc các bạn chuyển ngành. Chương trình kéo dài 9 tháng, kết hợp lý thuyết vững chắc với thực hành sâu rộng, nhằm cung cấp cho học viên kiến thức toàn diện và kỹ năng thực tiễn trong ngành kỹ sư dữ liệu.
Chương trình đào tạo bắt đầu với các nền tảng cơ bản như hệ điều hành Linux và lập trình Python, sau đó tiến tới quản lý cơ sở dữ liệu quan hệ và phi cấu trúc như MySQL và MongoDB sau đó mở rộng ra các công nghệ lưu trữ dữ liệu lớn như Hadoop, AWS S3, và HBase, cùng với nền tảng xử lý dữ liệu mạnh mẽ như Apache Spark.
Học viên sẽ không chỉ học lý thuyết mà còn thực hành qua các dự án thực tế, giúp áp dụng kiến thức vào tình huống cụ thể. Chương trình đào tạo này được thiết kế để trang bị cho bạn một nền tảng vững chắc và kỹ năng cần thiết để thành công trong sự nghiệp kỹ sư dữ liệu.
10 THÁNG (360 GIỜ)

Đối tượng tham gia

Sinh viên năm 3, năm 4
Những sinh viên đang theo học các ngành liên quan và muốn trang bị thêm kỹ năng để chuẩn bị cho sự nghiệp sau khi tốt nghiệp.

Người chuyển ngành
Những cá nhân đang làm việc trong các lĩnh vực khác nhưng muốn chuyển sang ngành kỹ sư dữ liệu để mở rộng cơ hội nghề nghiệp.

Người làm việc trong lĩnh vực phân tích dữ liệu & Khoa học dữ liệu

Kỹ sư phần mềm
Muốn chuyển hướng qua lĩnh vực dữ liệu.
KẾT QUẢ ĐẠT ĐƯỢC

Lập trình Python và Scala
Sử dụng Python và Scala để xử lý và phân tích dữ liệu, bao gồm việc làm quen với các thư viện và công cụ phổ biến trong khoa học dữ liệu như NumPy, Pandas và Spark.

Quản lý cơ sở dữ liệu:
Thành thạo trong việc thiết kế, triển khai và quản lý cơ sở dữ liệu quan hệ và phi cấu trúc với MySQL, MongoDB và các công cụ cơ sở dữ liệu trên nền tảng đám mây.

Xử lý dữ liệu lớn
Hiểu và áp dụng các công nghệ lưu trữ và xử lý dữ liệu lớn, bao gồm Hadoop, AWS S3, HBase, Cassandra và các công cụ xử lý dữ liệu thời gian thực như Apache Spark và Kafka.

Xử lý dữ liệu thời gian thực
Thực hiện xử lý và phân tích dữ liệu thời gian thực với Apache Kafka và Spark Streaming, bao gồm cả việc tích hợp dữ liệu từ các nguồn khác nhau.

Điện toán đám mây
Sử dụng các dịch vụ đám mây từ AWS, Google Cloud và Azure để quản lý và phân tích dữ liệu, bao gồm việc xây dựng lake house và triển khai các giải pháp đám mây.

Quản lý và bảo mật dữ liệu
Áp dụng các nguyên tắc và công cụ quản lý dữ liệu, bảo mật dữ liệu, bao gồm Docker, Kubernetes, và các công cụ liên quan đến Data Governance và Data Security.

Tự động hóa quy trình dữ liệu
Sử dụng Apache Airflow và các công cụ ETL như AWS Glue, Google Cloud Dataflow và Azure Data Factory để tự động hóa quy trình xử lý dữ liệu.

Kinh nghiệm thực tiễn
Thực hành qua các dự án thực tế, áp dụng các kiến thức đã học vào các tình huống thực tế, từ xây dựng nền tảng quảng cáo trực tuyến đến phát hiện gian lận thẻ tín dụng và phân tích dữ liệu dịch vụ đi chung xe.
Sau khi hoàn thành chương trình học bạn sẽ làm những gì?

Data Engineer
Kỹ Sư Dữ Liệu

Data Analyst
Nhà Phân Tích Dữ Liệu

Data Architect
Kiến trúc sư dữ liệu

Data Governance Specialist
Chuyên Gia Quản Trị Dữ Liệu
lộ trình học Data Engineer

- Giới thiệu Linux & Ubuntu: Cài đặt, cấu hình, quản lý hệ thống.
- Lệnh & quản lý tệp: CLI, thao tác file, quyền truy cập.
- Quản lý user & dịch vụ: User/group, sudo, APT, systemctl.
- Bảo mật & tối ưu hóa: Firewall, SSH, giám sát, quản lý tiến trình.
- Giới thiệu Python: Cài đặt, cú pháp cơ bản, biến, kiểu dữ liệu.
- Vòng lặp & hàm: Vòng lặp, hàm, xử lý lỗi, lambda.
- Phân tích & trực quan hóa: Numpy, Pandas, Matplotlib, Seaborn.
- Tự động hóa với Python: Xử lý file, lập lịch, gửi email, tải dữ liệu.
- Điện toán đám mây: Mô hình dịch vụ, so sánh AWS, Azure, GCP.
- Dịch vụ lưu trữ: Amazon S3, Azure Blob, Google Cloud Storage, bảo mật dữ liệu.
- Triển khai tài nguyên: Máy ảo (EC2, Azure VM), cấu hình mạng, sao lưu.
- Quản lý & bảo mật: Cơ sở dữ liệu đám mây, IAM, tối ưu hóa, giám sát.
- MySQL và thiết kế CSDL: Cấu trúc quan hệ, chuẩn hóa, mô hình ER.
- Truy vấn & tối ưu hóa: SQL nâng cao, index, sharding, giám sát hiệu suất.
- MongoDB và NoSQL: Kiến trúc, thao tác dữ liệu, truy vấn nâng cao.
- Triển khai & bảo mật: CSDL trên đám mây, sao lưu, bảo mật quyền truy cập.
- Data Lake & Hadoop: Kiến trúc, HDFS, YARN, MapReduce, Hive.
- Lưu trữ đám mây & NoSQL: AWS S3, Azure Blob, HBase, Cassandra.
- Phân tích & tích hợp dữ liệu: Spark, Flink, truy vấn và tối ưu hóa.
- Bảo mật & triển khai: Quyền truy cập, mã hóa, giám sát, dự án thực tế.
- Apache Spark & Scala: Xử lý dữ liệu lớn, DataFrame, Spark SQL.
- Streaming & ETL: Spark Streaming, Apache Airflow, quy trình ETL.
- Đám mây & tối ưu hóa: AWS S3, Azure Blob, hiệu suất, quản lý tài nguyên.
- Bảo mật & triển khai: Quyền truy cập, mã hóa, dự án thực tế xử lý dữ liệu.
- Docker & Kubernetes: Container, images, Pods, Deployments, Services.
- Quản trị dữ liệu: Data Governance, Apache Atlas, Talend, bảo mật.
- An ninh & bảo mật: Mã hóa dữ liệu, quản lý danh tính, bảo vệ hệ thống.
- Giám sát & tối ưu: Prometheus, Grafana, ELK Stack, quản lý log.

Tiếng anh
chuyên ngành IT
Chương trình tiếng Anh chuyên ngành IT hướng đến nâng cao kỹ năng giao tiếp và đọc hiểu tài liệu chuyên môn, giúp học viên tự tin làm việc trong môi trường quốc tế và phát triển sự nghiệp.

SẢN PHẨM CỦA HỌC VIÊN
Học phí

Học trực tiếp
36.000.000 Đ
Giá gốc: 32.000.000 đ

Học trực tuyến
30.000.000 Đ
Giá gốc: 34.000.000 đ

Bài viết liên quan

Câu hỏi thường gặp
Chương trình phù hợp cho sinh viên năm 3, 4, người chuyển ngành, nhân viên làm việc trong lĩnh vực phân tích dữ liệu & khoa học dữ liệu, và các kỹ sư phần mềm muốn chuyển sang ngành kỹ sư dữ liệu.
Chương trình kéo dài 9 tháng với tổng thời lượng 360 giờ, kết hợp giữa lý thuyết và thực hành.
Học viên sẽ học lập trình Python, Scala, quản lý cơ sở dữ liệu (MySQL, MongoDB), xử lý dữ liệu lớn (Hadoop, Spark), xử lý dữ liệu thời gian thực (Kafka, Spark Streaming), điện toán đám mây (AWS, GCP, Azure), và tự động hóa quy trình dữ liệu (Airflow, ETL).
Có, học viên sẽ tham gia các dự án thực tế như xây dựng nền tảng quảng cáo trực tuyến, phát hiện gian lận thẻ tín dụng, và phân tích dữ liệu dịch vụ đi chung xe.
Chương trình cung cấp kiến thức và kỹ năng thực tiễn để học viên tự tin ứng tuyển vào các vị trí như Kỹ sư Dữ liệu, Nhà Phân tích Dữ liệu, và Chuyên gia Quản trị Dữ liệu. Có thể có hỗ trợ định hướng nghề nghiệp tùy thuộc vào chính sách của RobustX.
Không yêu cầu kiến thức nền tảng chuyên sâu, nhưng kiến thức cơ bản về lập trình hoặc cơ sở dữ liệu là một lợi thế.
Có, chương trình được thiết kế linh hoạt cho cả sinh viên và người đi làm, với lịch học phù hợp để bạn có thể cân bằng thời gian.
Học viên có thể đảm nhận các vị trí như Kỹ sư Dữ liệu, Kỹ sư Xử lý Dữ liệu Thời gian Thực, Nhà Phân tích Dữ liệu, và Chuyên gia Quản trị Dữ liệu.
Có, chương trình bao gồm các công nghệ hiện đại như Apache Spark, Kafka, Docker, Kubernetes, và các dịch vụ đám mây từ AWS, Google Cloud, và Azure, giúp học viên bắt kịp xu hướng ngành.

CẢM NGHĨ CỦA HỌC VIÊN
Từ Thiên Vũ
Thầy cực kiên nhẫn, giải thích từng bước một. Dù mình là newbie vẫn theo kịp được.
Lê Hồng Nguyên Linh
Lab ở đây phải gọi là đỉnh. Dùng tài khoản hãng chính hãng, mọi thứ y như môi trường thực tế. Highly recommend học AWS ở đây nhé.
Trương Tuấn Hoàng
Chương trình đúng kiểu ‘work-ready’, vừa học vừa áp dụng vào công việc. Có thể chọn hình thức học linh hoạt, hôm nào kẹt lịch chuyển online liền, không bị miss buổi nào.
La Thị Minh Tuyết
Anh chị giảng viên rất vui tính, luôn tạo không khí để lớp có thể hoàn thành tốt dự án, hơn hết chúng em cũng được giải đáp thắc mắc và được hỗ trợ một cách kịp thời.
Ngọc Khang Văn
Ngay khi khóa học tôi đã nhận được offer Junior với mức lương ngoài mong đợi. Những kiến thức từ khóa học rất sát với thực tiễn và giúp tôi nhanh chóng thích nghi với công việc từ doanh nghiệp.
Trần Văn Khoa
Chương trình học phù hợp, lộ trình học tập được sắp xếp khoa học. Những kiến thức được truyền tải tại đây có thể áp dụng ngay trong công việc. Giảng viên nhiệt tình, truyền đạt kiến thức tốt.
Nguyễn Minh Thiện
Chương trình học ở đây được biên soạn kỹ càng và dễ hiểu đối với những người chưa có nhiều kinh nghiệm như em. Ngoài việc được đào tạo kiến thức chuyên môn em cũng được các anh chia sẻ khá nhiều về kinh nghiệm thực tế từ trải nghiệm của anh.
