KHÓA HỌC DATA ANALYTICS WITH PYTHON (DA)

01-11-2022 15:15
|

1. Giới thiệu khóa học
Mục tiêu
+ Cung cấp các kiến thức, kỹ năng và kinh nghiệm giúp học viên hiểu rõ về công việc, nhiệm vụ và vai trò của Data Analyst trong các doanh nghiệp cũng như cơ hội nghề nghiệp của nghề Phân tích dữ liệu.
Kết quả sau khóa học:
- Hiểu rõ tầm quan trọng, sứ mệnh và công việc, giá trị của nghề Data Analyst
- Biết các kiến thức, kỹ năng cơ bản để bắt đầu với công việc Data Analyst
- Biết sử dụng ngôn ngữ lập trình Python trong Phân tích dữ liệu lớn
Kiến thức của khóa học
- Nhận thức về nghề Data Analyts
- Quy trình phân tích dữ liệu lớn
- Xử lý, truy vấn dữ liệu với SQL
- Ngôn ngữ lập trình Python căn bản
- Thư viện Numpy, Pandas dùng Phân tích dữ liệu bằng Python
- Các công cụ sử dụng trong khai phá, phân tích dữ liệu bằng Python

2. Thông tin khóa học

- Thời gian đào tạo: từ 18h – 21h (3h/buổi), 2 buổi/tuần

- Thời lượng của khóa học: 24 buổi (72 giờ)

3. Nội dung đào tạo

- Sĩ số : 20 - 30 học viên/lớp

- Nội dung đào tạo theo buổi

Buổi

Nội dung

  1. Data analytics and SQL

1

Các khái niệm về dữ liệu và phân tích dữ liệu (2h):

  • Xác suất, xác suất có điều kiện, công thức Bayes
  • Phép thử, sự kiện, không gian mẫu
  • Biến ngẫu nhiên và phân phối xác suất
  • Hàm mật độ xác suất
  • Các giá trị đặc trưng

Các khái niệm về dữ liệu và phân tích dữ liệu (1h):

  • Hiểu các khái niệm, vai trò về dữ liệu
  • Hiểu về thể hiện, lưu trữ và truy xuất dữ liệu
  • Các khái niệm về cơ sở dữ liệu, hệ quản trị cơ sở dữ liệu, kho dữ liệu
  • Các khái niệm về dữ liệu quan hệ và không quan hệ
  • Các khái niệm, quy trình phân tích dữ liệu

2-6

Ngôn ngữ SQL và Cơ sở dữ liệu quan hệ cơ bản (15h):

  • Giới thiệu Cơ sở dữ liệu, ngôn ngữ truy vấn có cấu trúc SQL
  • Hệ quản trị cơ sở dữ liệu
  • Bảng, Records, Fields
  • Các loại câu lệnh và từ khóa trong SQL
  • Viết các truy vấn SQL cơ bản: SELECT, FROM, WHERE
  • Viết các truy vấn SQL cơ bản: SELECT, FROM, WHERE, GROUP BY, ORDER BY, EXISTS…
  • Joins

Các câu SQL dạng Logic lồng

7-9

Ngôn ngữ SQL và Cơ sở dữ liệu quan hệ nâng cao (9h):

  • Viết các truy vấn SQL nâng cao: SELECT, FROM, WHERE, GROUP BY, ORDER BY, HAVING BY…
  • Joins

Các câu SQL dạng Logic lồng

B. Python in Data Analytics

10-11

Các khái niệm cơ bản, kiểu dữ liệu tiêu chuẩn, cấu trúc điều khiển luồng dữ liệu trong Python (6h):

  • Giới thiệu về Python
  • Cài đặt môi trường và công cụ (Python + Jupyter Notebook)
  • Chương trình đầu tiên với Python
  • Biến, phép gán trong Python
  • Kiểu dữ liệu cơ bản trong Python
  • Làm việc với Number, String
  • Các phép toán: Số học, logic, quan hệ, so sánh trong Python
  • Cấu trúc rẽ nhánh
  • Cấu trúc lặp: Có hạn và vô hạn
  • Input/Output của dữ liệu trong Python

12-13

Cấu trúc dữ liệu Python (6h):

  • List
  • Tuple
  • Dictionary
  • Các phương thức xử lý với cấu trúc dữ liệu

Kỹ năng giải quyết vấn đề:

  • 5W1H

14-15

Hàm, Module, Package, object (6h):

  • Giới thiệu về naming convention trong python
  • Cách import thư viện trong Python
  • Funtion, Variable (Local, Nonlocal, Global)
  • Cơ bản về module
  • Package
  • Lớp (Class)
  • Thuộc tính (Attribute)
  • Phương thức (Method)
  • Thể hiện (instance)
  • Giới hạn truy cập: private, public
  • Kế thừa, đa kế thừa

16-19

Xử lý dữ liệu với Numpy, Pandas (12h):

  • Numpy: Mảng, các phép toán với mảng, numpy function đối với kiểu dữ liệu mảng
  • Pandas: Seria & data frame, load dữ liệu từ file, thêm/xóa cột, statistics function, group by function
  • Kết nối dữ liệu từ các Data Sources: File, Server, Database.
  • Thực hành kết nối dữ liệu từ File Excel.
  • Các bước tạo và định dạng biểu đồ để trực quan hóa dữ liệu chuyên nghiệp.
  • Ý nghĩa và ứng dụng các loại bảng biểu và đồ thị phổ biến: Line chart, Bar chart, Pie và Bubbles chart…
  • Định dạng biểu đồ: Size, Color, Label, Shapes, Font, Alignment…
  • Thực hành vẽ và phân tích các đồ thị phổ biến.

20-21

Trực quan hóa dữ liệu với Pandas, Matplotlib và các thư viện khác (6h):

  • Pandas, Matplotlib: trực quan hóa phân tích dữ liệu với use case cụ thể

22-24

Giới thiệu về Machine Learning và ML Library Python thông dụng (9h):

  • Giới thiệu về Học máy (Machine Learning)
  • Cách sử dụng thư viện để thực hiện một bài toán Học máy (Machine Learning) đơn giản
  • Bài toán Hỗ trợ ra quyết định với phân tích dữ liệu

Automation tools với Python (3h):

  • Web scaping, Auto report, Auto email...

 

Bài tập lớn tổng kết cuối khóa

 

- LỊCH HỌC -

Lịch học

Giờ học

Ghi chú

  2 buổi / tuần   

(3 giờ / buổi)

   18h - 21h   

 Ngày học linh động phù hợp cho học viên và giảng viên      

*** Mọi chi tiết về khóa học xin liên hệ theo số Hotline:  0963 97 65 65​

-> Đăng ký học online theo form: https://forms.gle/KyC3NPb99FRZwApMA

Viện CNTT ITPlus

Bài viết cùng chủ đề

1