Please enable JavaScript.
Coggle requires JavaScript to display documents.
Python, Các kiểu dữ liệu trong Python :pen: - Coggle Diagram
Python
Lesson 3+4
Hàm trả về giá trị : pen
- Có từ khóa return
- Thường được ứng dụng để thực hiện công việc tính toán và trả về một giá trị. Giá trị trả về có thể được gán cho biến hoặc có thể sử dụng trực tiếp
def add(a,b):
return a+b
result = add(2,3)
print(result)
-
-
-
Đánh giá dữ liệu :pen:
- Dữ liệu phải khớp : Ví dụ đơn vị tiền tệ cần đổi về 1 đơn vị tiền tệ duy nhất, đổi kiểu dữ liệu, …
- Dữ liệu phải được nhất quán: Ví dụ giới tính phải đồng nhất
Man /Woman hoặc Male/Female, …
- Dữ liệu không có ngoại lai (Outlier): Các giá trị ngoại lai có thể xuất hiện do nhiều nguyên nhân trong quá trình thu thập dữ liệu.
Ví dụ như lỗi đánh máy, lỗi xử lý code, … ảnh hưởng tới kết quả phân tích rất lớn. Ví dụ như nghiên cứu về giá nhà của 1 quận, nhưng lại có diện tích 1 ngôi nhà bị rất lớn, hoặc số âm, …
- Dữ liệu không chứa giá trị thiếu (Missing Value)
Làm sạch dữ liệu :pen:
- Làm sạch dữ liệu là quá trình thêm dữ liệu thiếu, sửa chữa hoặc xóa dữ liệu không chính xác hay không liên quan ra khỏi tập dữ liệu.
- Làm sạch dữ liệu sẽ sửa tất cả dữ liệu không nhất quán đã được phát hiện trong bước đầu tiên.
- Tuỳ vào loại dữ liệu đang có như dữ liệu văn bản, số, hình ảnh, … mà có các cách để làm sạch khác nhau. Đa số đều là các dữ liệu dạng văn bản, có thể xử lý như:
- Xử lý theo ngày tháng
- Loại bỏ các giá trị bị duplicates
- Split dữ liệu trong các cột nếu cột đó chứa nhiều giá trị trong 1 ô
- Xóa khoảng trống ở đầu, cuối hoặc không cần thiết giữa các từ
- Đổi kiểu dữ liệu
- Xử lý các dữ liệu bị thiếu bằng cách drop, thay thế bằng mode, mean, …
Lesson 1
Cú Pháp của Python :pen:
Line Structure :pencil2:
- Mỗi dòng code được code trên một hàng. Việc xuống hàng sẽ được tính là kết thúc câu lệnh.
- Do vậy, code Python không cần có dấu ; ở cuối câu lệnh.
Tuy nhiên, nếu thêm dấu ; ở cuối câu lệnh, câu lệnh vẫn sẽ hoạt động bình thường
Identation :pencil2:
- Các đoạn code trong Python được chia nhỏ
thành các block.
- Python sử dụng dấu : để bắt đầu đoạn block mới
- Python xác định các block bằng cách sử dụng
identify block ( các dấu tab ).
- Mỗi ident tương đương với 4 dấu space.
-
Identifier :pencil2:
- Identifier là tên của một thành phần trong chương trình và nó do người dùng tự định nghĩa
- Có một số quy tắc cần tuân theo khi chọn số nhận dạng:
Identifier chỉ có thể bắt đầu bằng A- Z, a- z hoặc dấu gạch dưới (_).
- Python phân biệt chữ hoa chữ thường. A và a là identifiers khác nhau.
- Một từ khóa đặc biệt dưới đây không được sử dụng để làm identifier
Comments :pen:
- Cú pháp của comment trong Python được bắt đầu bằng dấu #
- Sử dụng Comment giúp cho việc đánh dấu các đoạn code một cách rõ ràng.
- Có thể sử dụng Comment để giải thích chức năng cho các đoạn code phức tạp.
Objects (Biến) :pencil2:
- Biến là một vị trí bộ nhớ dùng để lưu trữ và đại diện cho một giá trị.
- Mỗi biến có một tên duy nhất để tham chiếu và sử dụng giá trị được lưu trữ trong đó.
- Giá trị của biến có thể thay đổi trong quá trình thực hiện chương trình
Các toán tử trong Python
-
-
Toán Tử Logic
And
Trả về True nếu cả hai biểu thức đều True, ngược lại trả về False.
Or
Trả về True nếu một trong hai biểu thức là True, ngược lại trả về False.
-
-
-
-