1. Vì sao nên học Data Science?
1.1 Data Science là gì?
Data Science là thu thập, khai thác và phân tích các giá trị từ khối dữ liệu data khổng lồ theo cấu trúc. Data Science = Advanced Mathematics (Statistics, Linear Algebra, Calculus), Programming (Python, Database, Data Structure and Algorithm) và Kiến thức về lĩnh vực kinh tế xã hội cụ thể.
Chương trình Data Science trang bị các kiến thức cơ bản về data modelling/analysis techniques cũng như life cycle của một dự án Data Science để sinh viên có được hiểu biết cơ bản về Data Science và ứng dụng.
Data Science giúp phân tích, đưa ra các xu hướng, mô hình phát triển và dự báo cho tương lai. Căn cứ vào đó, các ngành hàng, dịch vụ có thể đưa ra đánh giá, quyết định cho việc đầu tư, thu hồi hoặc phát triển các giá trị hữu ích.
1.2 Nhà Khoa học dữ liệu (Data Scientist) làm gì?
Data Scientist là những người tạo ra giá trị từ data, với 2 nhiệm vụ chính là:
- Thu thập, xử lý dữ liệu để tìm ra/phát hiện ra những giá trị ẩn chứa trong nó.
- Chuyển hóa những giá trị đó thành các giải pháp/hành động, từ đó tạo ra các giá trị và lợi ích thực cho tổ chức/công ty.
1.3 Đối tượng thích hợp làm việc trong lĩnh vực Data Science
Khóa học Data Science phù hợp với tất cả mọi người muốn tìm hiểu và làm việc với dữ liệu, đặc biệt đối với một số đối tượng sau:
- Các bạn sinh viên chuyên ngành CNTT/toán tin ứng dụng có kiến thức lập trình cơ bản.
- Các bạn sinh viên chuyên ngành kinh tế/sư phạm tự nhiên có kiến thức nền tảng về toán và xác suất thống kê.
- Các bạn kỹ sư CNTT muốn chuyển đổi nghề nghiệp
- Các bạn chuyên viên làm việc trong các mảng về kinh tế, ngân hàng, fintech có mong muốn làm việc sâu hơn với dữ liệu.
2. Chương trình đào tạo Data Science của xSeries FUNIX
Chương trình Data Science bao gồm đầy đủ các môn học giúp trang bị các kiến thức cơ bản về data modelling/analysis techniques cũng như life cycle của một dự án Data Science để học viên có được hiểu biết cơ bản về Data Science và ứng dụng.
2.1 Mục tiêu (Học viên học xong có năng lực gì?)
- Hiểu được các khái niệm cơ bản và phương pháp luận trong khoa học dữ liệu, các bước trong một dự án data science.
- Sử dụng thành thạo ngôn ngữ lập trình Python trong việc thống kê dữ liệu, cài đặt các thuật toán học máy và hiển thị hóa dữ liệu (data visualization).
- Hiểu được xu hướng, sự phân bố và sự tương quan giữa các đặc tính của dữ liệu và thực hành được về data visualization.
- Nắm được kiến thức cơ bản về xác suất thống kê
- Biết được các thuật toán cơ bản trong học máy: regression, classification, clustering.
- Hiểu được các khái niệm cơ bản trong Deep Learning và sử dụng thuật toán vào các bài toán thực tế.
- Sử dụng thành thạo các ứng dụng sau cho các bài toán thu thập, xử lý và phân tích dữ liệu: Excel, Power BI, Python và một số framework đặc thù khác (scikit-learn, pandas, …).
2.2 Yêu cầu đầu vào và đối tượng phù hợp
- Đã hoàn thành môn học: Xác suất thống kê.
- Có kinh nghiệm lập trình với Python.
- Có kiến thức về sử dụng ngôn ngữ SQL.
Trong trường hợp chưa có đầy đủ các kiến thức điều kiện, các bạn cần học thêm các môn học sau trong chứng chỉ điều kiện của chương trình Data Science:
- Xác suất thống kê
- Lập trình Python cơ bản
- Các hệ cơ sở dữ liệu
2.3 Đầu ra khóa học
Sau khi kết thúc khoá học, học viên có thể:
- Gia nhập các công ty sản xuất phần mềm ở lĩnh vực Data Science/AI của Việt Nam như FPT AI - FPT Software, Tinh Vân, CMC.
- Đảm nhiệm vị trí phân tích dữ liệu trong lĩnh vực tài chính, ngân hàng, marketing như Vietcombank, Techcombank, VP Bank, …
- Tham gia các vị trí trong dự án phát triển hệ thống AI/Data Science cho các doanh nghiệp có lượng data rất lớn và dồi dào như Viettel, VNPT AI, Lazada …
- Làm việc như một data scientist/data analyst tại các công ty cần thu thập, lưu trữ và xử lý dữ liệu, công ty khởi nghiệp như ELSA, Cinnamon AI, Trusting Social, …
2.4 Cấu trúc chương trình học khoá học Data Science
Môn 1: Introduction to Data science - Giới thiệu về Khoa học dữ liệu
Môn học này giới thiệu cho người học các khái niệm cơ bản trong khoa học dữ liệu (Data Science) bao gồm data science là gì, các chủ đề và thuật toán trong Data Science và ứng dụng trong thực tế. Ngoài ra môn học giới thiệu phương pháp luận sử dụng trong khoa học dữ liệu, vòng đời dự án Data Science. Học viên cũng được dạy về lập trình Python cơ bản và ôn tập lại về xác suất thống kê.
- Biết cách lập trình Python cơ bản, các cấu trúc dữ liệu trong Python, làm việc với Pandas và Numpy
- Nắm được các kiến thức kỹ năng cần thiết cho Data Science trong xác suất thông kê
- Hiểu được các khái niệm cơ bản, các chủ đề, các ứng dụng của Data Science
- Hiểu được phương pháp luận sử dụng trong data science, các bước để giải quyết các vấn đề data science từ nêu được bài toán, thu thập và phân tích dữ liệu, xây dựng thuật toán và hiểu được phản hồi sau khi thuật toán được cài đặt và sử dụng
Môn 2: Data analysis with Python - Phân tích dữ liệu với ngôn ngữ Python
Rất nhiều dữ liệu trên thế giới hiện nay được lưu trên cơ sở dữ liệu, kiến thức về cơ sở dữ liệu và ngôn ngữ SQL rất cần thiết để trở thành nhà khoa học dữ liệu. Môn học cung cấp kiến thức về các khái niệm cơ sở dữ liệu quan hệ, thực hành các câu lệnh query sử dụng ngôn ngữ SQL và Python. Học viên học làm việc sâu với Pandas, Numpy để khám phá nhiều dạng dữ liệu, làm sạch dữ liệu, xử lý dữ liệu bị thiếu. Môn học dạy cách biểu diễn dữ liệu để hiểu sâu hơn về dữ liệu, giúp đưa ra các quyết định hiệu quả.
- Viết được các câu lệnh SQL cơ bản: CREATE, DROP, SELECT, INSERT, UPDATE, DELETE
- Biết vận dụng các câu lệnh truy vấn nâng cao như filter, sort, group
- Sử dụng Python để truy cập vào cơ sở dữ liệu
- Biết import và export data
- Nắm được cách tiền xử lý dữ liệu, xử lý dữ liệu bị thiếu, chuẩn hóa dữ liệu
- Thực hiện được thống kê dữ liệu, tìm độ tương quan trong dữ liệu
- Biết cách biểu diễn dữ liệu theo dạng biểu đồ sử dụng các thư viện Matplotlib
- Học được cách biểu diễn dữ liệu dạng nâng cao qua thư viện Seaborn và Folium
Môn 3: Machine Learning - Học máy cho khoa học dữ liệu
Học viên được dạy mục đích của học máy và các ứng dụng trong thực tế. Môn học trang bị các thuật toán trong học máy: regression, classification, clustering, recommender system.
- Nắm được tổng quan về các topic trong machine learning: supervised learning, unsupervised learning
- Hiểu và thực hành các thuật toán về Regression
- Hiểu và thực hành các thuật toán về Classification
- Hiểu và thực hành các thuật toán về Clustering
- Hiểu về Recommender Systems
- Thực hành cách thuật toán vào bài toán thực tế
- Biết cách biểu diễn dữ liệu theo dạng biểu đồ sử dụng các thư viện Matplotlib
Môn 4:
-
Học viên chọn 1 trong 2 hướng
-
Học máy: Kỹ thuật Học sâu
(Các bạn click vào link để đọc thêm các thông tin chi tiết về môn học).
Mục tiêu của khóa học này là cung cấp cho người học sự hiểu biết cơ bản về các neural network hiện đại và các ứng dụng của chúng trong thị giác máy tính và nghiên cứu ngôn ngữ tự nhiên. Sau khi đã tìm hiểu các mô hình tuyến tính, gradient descent và đi sâu hơn vào các phương pháp tối ưu, điển hình cho việc huấn luyện deep neural networks, chúng ta sẽ tiếp tục với các lớp phổ biến nhất của neural network là lớp fully connected (phân loại), lớp convolution (thị giác máy tính) và các lớp recurrent (xử lý ngôn ngữ tự nhiên). Sau đó, bạn sẽ sử dụng các lớp này để xây dựng các mô hình DNN đầy đủ sử dụng các framework Tensorflow và Keras. Trong các dự án trong khóa học, bạn sẽ giải quyết vấn đề nhận diện khuôn mặt đeo khẩu trang và phân loại văn bản độc hại bằng cách sử dụng Keras.
#
Mục tiêu
1
Nắm được khái niệm cơ bản, ứng dụng và vai trò của Deep Learning hiện nay trong thị giác máy tính và xử lý ngôn ngữ tự nhiên.
2
Nắm được các ứng dụng của DL vào trong thị giác máy tính thông qua kiến trúc mạng CNN (CNN, VGG, Resnet, Inception, MobileNet, EfficientNet): Bài toán phân loại hình ảnh, nhận diện vật thể, phân vùng theo nhóm, nhận diện khuôn mặt.
3
Nắm được ứng dụng của DL vào trong xử lý ngôn ngữ tự nhiên thông qua các kiến trúc mạng về RNN (RNN, LSTM, GRU, Attention và Transformation): Nhận diện cảm xúc thông qua văn bản, dịch máy, xây dựng và sử dụng Word Embedding.
4
Sử dụng được Tensorflow để xây dựng một dự án hoàn chỉnh về Machine Learning và Deep Learning.
5
Có năng lực về chuẩn hóa dữ liệu, xây dựng và đánh giá, phân tích lỗi, cải thiện và tối ưu model trong các dự án ML/DL.
-
Phân tích dữ liệu với Power BI
Power BI đang nhanh chóng trở thành nền tảng BI (kinh doanh thông minh) mạnh mẽ nhất trên thế giới và là một trong những công cụ rất hữu ích cho cả các chuyên gia dữ liệu cũng như những người mới bắt đầu tìm hiểu về phân tích dữ liệu. Với Power BI, bạn có thể kết nối với hàng trăm nguồn dữ liệu, xây dựng các mô hình phức tạp bằng các công cụ đơn giản và trực quan, đồng thời thiết kế các bảng báo cáo và điều khiển tương tác tuyệt đẹp.
Trong khóa học này, bạn sẽ đóng vai trò là Nhà phân tích kinh doanh của Adventure Work Cycles, một công ty sản xuất toàn cầu. Nhiệm vụ của bạn sẽ là thiết kế và cung cấp một giải pháp kinh doanh thông minh đầu cuối, chất lượng và chuyên nghiệp thông qua Power BI với đầu vào là các tệp dữ liệu thô.
Chúng ta sẽ được hướng dẫn chi tiết cách sử dụng Power BI Desktop để thực thi nhiệm vụ trên. Bên cạnh đó, môn học sẽ cung cấp cho bạn các giải thích rõ ràng cũng như các kỹ thuật chuyên nghiệp hữu ích trong từng quá trình thực hiện. Chúng ta sẽ đi theo một tiến trình ổn định, có hệ thống để hoàn thành được một dự án hoàn chỉnh về Power BI.
#
Mục tiêu
1
Hiểu về lợi ích của Business Intelligence đối với doanh nghiệp.
2
Cài đặt và làm quen với giao diện của Power BI Desktop.
3
Xử lý, chuyển đổi và tích hợp được dữ liệu thô vào Power BI.
4
Xây dựng mô hình dữ liệu quan hệ với các bảng dữ liệu và quan hệ dữ liệu.
5
Sử dụng DAX để tính toán, trích xuất và phân tích dữ liệu.
6
Xây dựng được các báo cáo Power BI đẹp mắt, có thể tương tác với người dùng.
7
Thiết kế, xây dựng và triển khai được một quy trình BI hoàn chỉnh trên Power BI từ dữ liệu thô với các báo cáo và dashboard chất lượng.
8
Đăng nhập và làm quen với Power BI Service.
Môn 5: Đồ án cuối khóa
Hoàn thành môn học, học viên sẽ biết cách kết hợp các kiến thức về dữ liệu để tạo ra một đề xuất giải pháp công nghệ và xây dựng được tài liệu nghiệp vụ liên quan đến giải pháp đó.
Học viên có thể chọn 1 trong 2 option sau:
Option 1: Làm đồ án tốt nghiệp
Đối với các học viên theo học chương trình biên soạn, học viên sẽ được hướng dẫn chọn làm đề tài/khóa luận với các mentor hướng dẫn trực tiếp.
Option 2: Đi thực tập doanh nghiệp
Đối với các bạn học viên có nguyện vọng thực tập tại các doanh nghiệp, FUNiX sẽ hỗ trợ kết nối các bạn với các doanh nghiệp để chuẩn bị CV và phỏng vấn vào thực tập. Nếu được doanh
3. Đội ngũ xây dựng khoá học
Khóa học được xây dựng và thẩm định bởi các chuyên gia hàng đầu về giảng dạy và làm việc trong lĩnh vực Data Science tại Việt Nam, bao gồm:
3.1 Đội ngũ xây dựng chương trình:
3.2 Đội ngũ đánh giá và thẩm định chương trình:
>>> Đăng ký ngay khóa học tại đây: