Tự Học Data Science · 02/11/2023 0

03.00 Data Manipulation with Pandas

Cài đặt và Sử dụng Pandas

Cài đặt Pandas trên hệ thống của bạn yêu cầu phải có NumPy đã được cài đặt, và nếu xây dựng thư viện từ nguồn, yêu cầu các công cụ phù hợp để biên dịch các nguồn C và Cython mà Pandas được xây dựng trên đó.Chi tiết về cài đặt này có thể được tìm thấy trong tài liệu Pandas.Nếu bạn đã tuân theo lời khuyên được trình bày trong Lời mở đầu và sử dụng bộ công cụ Anaconda, bạn đã có Pandas được cài đặt sẵn.

Một khi đã cài đặt Pandas, bạn có thể nhập nó và kiểm tra phiên bản:

import pandaspandas.__version__
'0.18.1'

Giống như chúng ta thường nhập NumPy dưới cái tên rút gọn là np, chúng ta sẽ nhập Pandas dưới cái tên rút gọn là pd:

import pandas as pd

Quy ước nhập này sẽ được sử dụng trong phần còn lại của cuốn sách này.

Nhắc nhở về Tài liệu tích hợp sẵn

Trong quá trình đọc qua chương này, đừng quên rằng IPython mang đến cho bạn khả năng khám phá nhanh nội dung của một package (bằng cách sử dụng tính năng hoàn thành bằng tab) cũng như tài liệu của các hàm khác nhau (bằng cách sử dụng ký tự ?). (Xem lại Trợ giúp và Tài liệu trong IPython nếu bạn cần ôn lại điều này.)

Ví dụ, để hiển thị tất cả nội dung của không gian tên pandas, bạn có thể gõ

In [3]: pd.<TAB>

Và để hiển thị tài liệu tích hợp sẵn trong Pandas, bạn có thể sử dụng đoạn mã sau:

In [4]: pd?

Chi tiết hơn về tài liệu, cùng với các hướng dẫn và tài liệu khác, có thể được tìm thấy tại http://pandas.pydata.org/.