Cách Dùng REGEX trong Google Sheets: Hướng Dẫn Chi Tiết Cho Người Mới Bắt Đầu

Bạn đang đau đầu với việc xử lý dữ liệu lộn xộn trong Google Sheets? Phải mất hàng giờ để tìm kiếm, thay thế hoặc trích xuất thông tin từ những chuỗi ký tự phức tạp? Đừng lo lắng! Bài viết này sẽ giúp bạn làm chủ Regular Expressions (REGEX) – một công cụ mạnh mẽ để thao tác với văn bản trong Google Sheets, giúp bạn tiết kiệm thời gian và công sức.

Với hướng dẫn từng bước, ví dụ thực tế và mẹo hữu ích, bạn sẽ nhanh chóng nắm vững cách sử dụng REGEX để giải quyết các bài toán dữ liệu một cách hiệu quả.


1. REGEX là gì?

REGEX (Regular Expression), hay còn gọi là biểu thức chính quy, là một chuỗi ký tự đặc biệt dùng để mô tả một mẫu tìm kiếm. Nó cho phép bạn tìm kiếm, so khớp, thay thế và trích xuất các chuỗi văn bản dựa trên các quy tắc cụ thể.

REGEX rất hữu ích trong việc:

  • Tìm kiếm các mẫu văn bản cụ thể (ví dụ: tất cả các địa chỉ email trong một cột).
  • Kiểm tra tính hợp lệ của dữ liệu (ví dụ: đảm bảo số điện thoại có đúng định dạng).
  • Thay thế các chuỗi văn bản theo một quy tắc nhất định.
  • Trích xuất thông tin từ các chuỗi văn bản phức tạp.

Cách Dùng REGEX trong Google Sheets

2. Các hàm REGEX cơ bản trong Google Sheets

Google Sheets cung cấp một số hàm tích hợp để làm việc với REGEX:

  • REGEXMATCH(text, regular_expression): Kiểm tra xem một chuỗi văn bản có khớp với một biểu thức chính quy hay không. Trả về TRUE nếu khớp, FALSE nếu không.
  • REGEXEXTRACT(text, regular_expression): Trích xuất một phần của chuỗi văn bản khớp với một biểu thức chính quy.
  • REGEXREPLACE(text, regular_expression, replacement): Thay thế tất cả các phần của chuỗi văn bản khớp với một biểu thức chính quy bằng một chuỗi thay thế.

3. Hướng dẫn sử dụng REGEX từng bước

Step 1: Làm quen với các ký tự đặc biệt trong REGEX

REGEX sử dụng các ký tự đặc biệt để biểu diễn các mẫu tìm kiếm. Dưới đây là một số ký tự phổ biến:

  • . (dấu chấm): Khớp với bất kỳ ký tự nào (ngoại trừ ký tự xuống dòng).
  • * (dấu sao): Khớp với 0 hoặc nhiều lần xuất hiện của ký tự đứng trước nó.
  • + (dấu cộng): Khớp với 1 hoặc nhiều lần xuất hiện của ký tự đứng trước nó.
  • ? (dấu hỏi): Khớp với 0 hoặc 1 lần xuất hiện của ký tự đứng trước nó.
  • [] (dấu ngoặc vuông): Khớp với bất kỳ ký tự nào trong dấu ngoặc vuông. Ví dụ: [abc] khớp với ‘a’, ‘b’ hoặc ‘c’.
  • [^] (dấu ngoặc vuông với dấu mũ): Khớp với bất kỳ ký tự nào không nằm trong dấu ngoặc vuông. Ví dụ: [^abc] khớp với bất kỳ ký tự nào không phải ‘a’, ‘b’ hoặc ‘c’.
  • ^ (dấu mũ): Khớp với đầu chuỗi.
  • $ (dấu đô la): Khớp với cuối chuỗi.
  • \ (dấu gạch chéo ngược): Thoát một ký tự đặc biệt để coi nó như một ký tự thông thường.

Cách Dùng REGEX trong Google Sheets

Step 2: Sử dụng hàm REGEXMATCH

Để kiểm tra xem một chuỗi văn bản có khớp với một biểu thức chính quy hay không, hãy sử dụng hàm REGEXMATCH.

Ví dụ: Kiểm tra xem ô A1 có chứa số điện thoại Việt Nam (bắt đầu bằng 0) hay không.

Công thức: =REGEXMATCH(A1, "^0[0-9]{9,10}$")

Giải thích:

  • ^0: Bắt đầu bằng số 0.
  • [0-9]{9,10}: Theo sau là 9 hoặc 10 chữ số (0-9).
  • $: Kết thúc chuỗi.

Step 3: Sử dụng hàm REGEXEXTRACT

Để trích xuất một phần của chuỗi văn bản khớp với một biểu thức chính quy, hãy sử dụng hàm REGEXEXTRACT.

Ví dụ: Trích xuất tên miền từ một địa chỉ email trong ô A1.

Công thức: =REGEXEXTRACT(A1, "@([a-zA-Z0-9.-]+)")

Giải thích:

  • @: Tìm ký tự ‘@’.
  • ([a-zA-Z0-9.-]+): Nhóm các ký tự chữ cái, số, dấu chấm và dấu gạch ngang sau ký tự ‘@’.

Step 4: Sử dụng hàm REGEXREPLACE

Để thay thế các phần của chuỗi văn bản khớp với một biểu thức chính quy bằng một chuỗi thay thế, hãy sử dụng hàm REGEXREPLACE.

Ví dụ: Thay thế tất cả các số điện thoại Việt Nam (bắt đầu bằng 0) trong ô A1 bằng chuỗi “Đã ẩn”.

Công thức: =REGEXREPLACE(A1, "^0[0-9]{9,10}", "Đã ẩn")

🔥 Mẹo giúp bạn làm nhanh hơn:

  • Sử dụng các trang web kiểm tra REGEX trực tuyến (ví dụ: regex101.com) để thử nghiệm và gỡ lỗi biểu thức chính quy của bạn.
  • Chia nhỏ các biểu thức chính quy phức tạp thành các phần nhỏ hơn để dễ hiểu và bảo trì.
  • Luôn kiểm tra kỹ kết quả sau khi sử dụng REGEX để đảm bảo rằng nó hoạt động như mong đợi.

4. Ví dụ thực tế về ứng dụng REGEX

  • Làm sạch dữ liệu: Loại bỏ các ký tự không mong muốn, khoảng trắng thừa hoặc định dạng không nhất quán.
  • Trích xuất thông tin: Lấy các phần cụ thể của dữ liệu từ các chuỗi văn bản phức tạp, chẳng hạn như số đơn hàng, mã sản phẩm hoặc ngày tháng.
  • Kiểm tra dữ liệu: Đảm bảo rằng dữ liệu tuân thủ các quy tắc và định dạng nhất định, chẳng hạn như địa chỉ email hợp lệ, số điện thoại đúng định dạng hoặc mã bưu điện hợp lệ.
  • Phân tích dữ liệu: Tìm kiếm các mẫu và xu hướng trong dữ liệu văn bản, chẳng hạn như các từ khóa phổ biến, các chủ đề chính hoặc các cảm xúc.

Template Quản Lý Khách Hàng

✔ Tự động trích xuất thông tin liên hệ từ các nguồn khác nhau.

✔ Xác thực dữ liệu đầu vào bằng REGEX.


👉 Xem template

5. Mẹo và lưu ý khi sử dụng REGEX

  • REGEX phân biệt chữ hoa chữ thường theo mặc định. Sử dụng cờ (?i) để bỏ qua sự phân biệt này. Ví dụ: (?i)hello sẽ khớp với “hello”, “Hello”, “HELLO”, v.v.
  • Sử dụng dấu gạch chéo ngược \ để thoát các ký tự đặc biệt nếu bạn muốn coi chúng như các ký tự thông thường. Ví dụ: \. sẽ khớp với dấu chấm (.).
  • Hãy cẩn thận với việc sử dụng các biểu thức chính quy quá phức tạp, vì chúng có thể làm chậm hiệu suất của Google Sheets.

Bắt đầu ngay 🚀

Dùng template giúp bạn tiết kiệm hàng giờ mỗi tuần

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Lên đầu trang