Cách loại bỏ MultiIndex columns trong Pandas

Bài viết này hướng dẫn cách loại bỏ các cột MultiIndex trong DataFrame của Pandas, một tính năng hữu ích khi làm việc với dữ liệu phức tạp có nhiều chỉ mục. Bạn sẽ học cách làm phẳng MultiIndex hoặc loại bỏ chúng hoàn toàn.

Pandas cung cấp tính năng MultiIndex cho phép bạn có nhiều cấp độ chỉ mục cho hàng và cột. Trong một số trường hợp, bạn có thể muốn loại bỏ MultiIndex columns để đơn giản hóa dữ liệu. Trong bài viết này, bạn sẽ tìm hiểu cách loại bỏ hoặc làm phẳng MultiIndex cột trong Pandas.

Mã Python:

import pandas as pd

# Tạo một DataFrame với MultiIndex columns
arrays = [['A', 'A', 'B', 'B'], ['one', 'two', 'one', 'two']]
tuples = list(zip(*arrays))
index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second'])

df = pd.DataFrame([[1, 2, 3, 4], [5, 6, 7, 8]], columns=index)

# Hiển thị DataFrame gốc
print("DataFrame với MultiIndex columns:")
print(df)

# Cách loại bỏ MultiIndex columns
df.columns = ['_'.join(col) for col in df.columns]

# Hiển thị DataFrame sau khi loại bỏ MultiIndex columns
print("\nDataFrame sau khi loại bỏ MultiIndex columns:")
print(df)

Giải thích chi tiết từng dòng code:

  1. import pandas as pd: Import thư viện Pandas để làm việc với DataFrame.
  2. arrays = [['A', 'A', 'B', 'B'], ['one', 'two', 'one', 'two']]: Tạo một danh sách con cho MultiIndex.
  3. tuples = list(zip(*arrays)): Tạo các tuple từ các danh sách con bằng cách sử dụng zip.
  4. index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second']): Tạo MultiIndex columns từ danh sách các tuple.
  5. df = pd.DataFrame(...): Tạo DataFrame với các cột có MultiIndex.
  6. df.columns = ['_'.join(col) for col in df.columns]: Nối các mức của MultiIndex lại thành một chuỗi để loại bỏ MultiIndex.
  7. print(df): In ra DataFrame sau khi đã loại bỏ MultiIndex columns.

Yêu cầu hệ thống:

  • Python 3.6 trở lên
  • Pandas phiên bản 1.0.0 hoặc mới hơn

Cách cài đặt các thư viện để chạy được đoạn mã python trên:

Sử dụng pip để cài đặt Pandas:

pip install pandas

Lời khuyên:

  • Khi làm việc với dữ liệu phức tạp, MultiIndex rất hữu ích, nhưng nếu bạn không cần, hãy cân nhắc làm phẳng để dễ xử lý hơn.
  • Bạn có thể tùy chỉnh cách nối các mức của MultiIndex bằng ký tự khác thay vì _.
Tags: Python, Pandas


Các Hướng Dẫn Cùng Chủ Đề Đang Xem

Tạo video từ hình ảnh bằng OpenCV

Hướng dẫn chi tiết cách tạo video từ các hình ảnh bằng Python và thư viện OpenCV. Bài viết bao gồm mã nguồn và giải thích từng dòng mã.
Hướng dẫn làm form đăng ký tài khoản trong Python bằng PyQT6

Hướng dẫn chi tiết cách tạo form đăng ký tài khoản trong Python sử dụng PyQT6, bao gồm cách thêm các trường nhập liệu và xử lý sự kiện khi người dùng nhấn nút đăng ký.
Cách INSERT dữ liệu vào database MySQL bằng Python

Hướng dẫn cách chèn dữ liệu vào bảng trong database MySQL bằng Python sử dụng thư viện mysql-connector-python.
Hướng dẫn làm form đăng nhập tài khoản trong Python bằng PyQT6

Hướng dẫn chi tiết cách tạo form đăng nhập tài khoản trong Python sử dụng PyQT6, bao gồm cách thiết kế giao diện và xử lý sự kiện khi người dùng nhấn nút đăng nhập.
Gửi đoạn mã JavaScript vào website sử dụng Selenium trong Python

Hướng dẫn cách sử dụng Selenium trong Python để gửi đoạn mã JavaScript vào một trang web trên trình duyệt Chrome. Bài viết sẽ giúp bạn hiểu cách tương tác với các phần tử trên trang web và chạy mã JavaScript.
Xóa nền cho hình ảnh bằng thư viện Rembg trong Python

Hướng dẫn chi tiết cách xóa nền cho hình ảnh bằng Python và thư viện Rembg. Bài viết bao gồm mã nguồn và giải thích từng dòng mã.
Hướng dẫn tạo form upload nhiều hình ảnh bằng Python

Hướng dẫn chi tiết cách tạo form upload nhiều hình ảnh sử dụng Flask - một framework Python đơn giản và hiệu quả.
Chuyển chuỗi Markdown sang HTML bằng Python

Hướng dẫn cách chuyển đổi chuỗi Markdown sang HTML bằng Python với thư viện `markdown2`, giúp bạn dễ dàng tích hợp tính năng chuyển đổi này vào ứng dụng của mình.
Tạo ứng dụng chat đơn giản sử dụng Socket.IO trong Python

Hướng dẫn chi tiết cách tạo ứng dụng chat đơn giản bằng Python sử dụng Socket.IO và Flask, cho phép người dùng gửi và nhận tin nhắn theo thời gian thực.
Các chức năng thường dùng khi sử dụng Selenium Chrome trong Python

Bài viết giới thiệu các chức năng thường dùng khi sử dụng Selenium với Chrome trong Python, giúp tự động hóa các tác vụ như tìm kiếm, tương tác với các phần tử trên trang web, và điều hướng trình duyệt.

Đã thêm vào giỏ hàng