Bạn đang đau đầu với việc xử lý dữ liệu lộn xộn trong Google Sheets? Phải mất hàng giờ để tìm kiếm, thay thế hoặc trích xuất thông tin từ những chuỗi ký tự phức tạp? Đừng lo lắng! Bài viết này sẽ giúp bạn làm chủ Regular Expressions (REGEX) – một công cụ mạnh mẽ để thao tác với văn bản trong Google Sheets, giúp bạn tiết kiệm thời gian và công sức.
Với hướng dẫn từng bước, ví dụ thực tế và mẹo hữu ích, bạn sẽ nhanh chóng nắm vững cách sử dụng REGEX để giải quyết các bài toán dữ liệu một cách hiệu quả.
Mục lục
1. REGEX là gì?
REGEX (Regular Expression), hay còn gọi là biểu thức chính quy, là một chuỗi ký tự đặc biệt dùng để mô tả một mẫu tìm kiếm. Nó cho phép bạn tìm kiếm, so khớp, thay thế và trích xuất các chuỗi văn bản dựa trên các quy tắc cụ thể.
REGEX rất hữu ích trong việc:
- Tìm kiếm các mẫu văn bản cụ thể (ví dụ: tất cả các địa chỉ email trong một cột).
- Kiểm tra tính hợp lệ của dữ liệu (ví dụ: đảm bảo số điện thoại có đúng định dạng).
- Thay thế các chuỗi văn bản theo một quy tắc nhất định.
- Trích xuất thông tin từ các chuỗi văn bản phức tạp.

2. Các hàm REGEX cơ bản trong Google Sheets
Google Sheets cung cấp một số hàm tích hợp để làm việc với REGEX:
- REGEXMATCH(text, regular_expression): Kiểm tra xem một chuỗi văn bản có khớp với một biểu thức chính quy hay không. Trả về TRUE nếu khớp, FALSE nếu không.
- REGEXEXTRACT(text, regular_expression): Trích xuất một phần của chuỗi văn bản khớp với một biểu thức chính quy.
- REGEXREPLACE(text, regular_expression, replacement): Thay thế tất cả các phần của chuỗi văn bản khớp với một biểu thức chính quy bằng một chuỗi thay thế.
3. Hướng dẫn sử dụng REGEX từng bước
Step 1: Làm quen với các ký tự đặc biệt trong REGEX
REGEX sử dụng các ký tự đặc biệt để biểu diễn các mẫu tìm kiếm. Dưới đây là một số ký tự phổ biến:
- . (dấu chấm): Khớp với bất kỳ ký tự nào (ngoại trừ ký tự xuống dòng).
- * (dấu sao): Khớp với 0 hoặc nhiều lần xuất hiện của ký tự đứng trước nó.
- + (dấu cộng): Khớp với 1 hoặc nhiều lần xuất hiện của ký tự đứng trước nó.
- ? (dấu hỏi): Khớp với 0 hoặc 1 lần xuất hiện của ký tự đứng trước nó.
- [] (dấu ngoặc vuông): Khớp với bất kỳ ký tự nào trong dấu ngoặc vuông. Ví dụ:
[abc]khớp với ‘a’, ‘b’ hoặc ‘c’. - [^] (dấu ngoặc vuông với dấu mũ): Khớp với bất kỳ ký tự nào không nằm trong dấu ngoặc vuông. Ví dụ:
[^abc]khớp với bất kỳ ký tự nào không phải ‘a’, ‘b’ hoặc ‘c’. - ^ (dấu mũ): Khớp với đầu chuỗi.
- $ (dấu đô la): Khớp với cuối chuỗi.
- \ (dấu gạch chéo ngược): Thoát một ký tự đặc biệt để coi nó như một ký tự thông thường.

Step 2: Sử dụng hàm REGEXMATCH
Để kiểm tra xem một chuỗi văn bản có khớp với một biểu thức chính quy hay không, hãy sử dụng hàm REGEXMATCH.
Ví dụ: Kiểm tra xem ô A1 có chứa số điện thoại Việt Nam (bắt đầu bằng 0) hay không.
Công thức: =REGEXMATCH(A1, "^0[0-9]{9,10}$")
Giải thích:
^0: Bắt đầu bằng số 0.[0-9]{9,10}: Theo sau là 9 hoặc 10 chữ số (0-9).$: Kết thúc chuỗi.
Step 3: Sử dụng hàm REGEXEXTRACT
Để trích xuất một phần của chuỗi văn bản khớp với một biểu thức chính quy, hãy sử dụng hàm REGEXEXTRACT.
Ví dụ: Trích xuất tên miền từ một địa chỉ email trong ô A1.
Công thức: =REGEXEXTRACT(A1, "@([a-zA-Z0-9.-]+)")
Giải thích:
@: Tìm ký tự ‘@’.([a-zA-Z0-9.-]+): Nhóm các ký tự chữ cái, số, dấu chấm và dấu gạch ngang sau ký tự ‘@’.
Step 4: Sử dụng hàm REGEXREPLACE
Để thay thế các phần của chuỗi văn bản khớp với một biểu thức chính quy bằng một chuỗi thay thế, hãy sử dụng hàm REGEXREPLACE.
Ví dụ: Thay thế tất cả các số điện thoại Việt Nam (bắt đầu bằng 0) trong ô A1 bằng chuỗi “Đã ẩn”.
Công thức: =REGEXREPLACE(A1, "^0[0-9]{9,10}", "Đã ẩn")
- Sử dụng các trang web kiểm tra REGEX trực tuyến (ví dụ: regex101.com) để thử nghiệm và gỡ lỗi biểu thức chính quy của bạn.
- Chia nhỏ các biểu thức chính quy phức tạp thành các phần nhỏ hơn để dễ hiểu và bảo trì.
- Luôn kiểm tra kỹ kết quả sau khi sử dụng REGEX để đảm bảo rằng nó hoạt động như mong đợi.
4. Ví dụ thực tế về ứng dụng REGEX
- Làm sạch dữ liệu: Loại bỏ các ký tự không mong muốn, khoảng trắng thừa hoặc định dạng không nhất quán.
- Trích xuất thông tin: Lấy các phần cụ thể của dữ liệu từ các chuỗi văn bản phức tạp, chẳng hạn như số đơn hàng, mã sản phẩm hoặc ngày tháng.
- Kiểm tra dữ liệu: Đảm bảo rằng dữ liệu tuân thủ các quy tắc và định dạng nhất định, chẳng hạn như địa chỉ email hợp lệ, số điện thoại đúng định dạng hoặc mã bưu điện hợp lệ.
- Phân tích dữ liệu: Tìm kiếm các mẫu và xu hướng trong dữ liệu văn bản, chẳng hạn như các từ khóa phổ biến, các chủ đề chính hoặc các cảm xúc.
Template Quản Lý Khách Hàng
✔ Tự động trích xuất thông tin liên hệ từ các nguồn khác nhau.
✔ Xác thực dữ liệu đầu vào bằng REGEX.
5. Mẹo và lưu ý khi sử dụng REGEX
- REGEX phân biệt chữ hoa chữ thường theo mặc định. Sử dụng cờ
(?i)để bỏ qua sự phân biệt này. Ví dụ:(?i)hellosẽ khớp với “hello”, “Hello”, “HELLO”, v.v. - Sử dụng dấu gạch chéo ngược
\để thoát các ký tự đặc biệt nếu bạn muốn coi chúng như các ký tự thông thường. Ví dụ:\.sẽ khớp với dấu chấm (.). - Hãy cẩn thận với việc sử dụng các biểu thức chính quy quá phức tạp, vì chúng có thể làm chậm hiệu suất của Google Sheets.