Bạn đang gặp khó khăn với dữ liệu trùng lặp trong Google Sheets?
Dữ liệu trùng lặp có thể gây ra nhiều vấn đề, từ sai lệch trong báo cáo, lãng phí thời gian cho đến ảnh hưởng đến quyết định kinh doanh. Việc tìm và loại bỏ chúng thủ công có thể tốn rất nhiều thời gian và công sức, đặc biệt là với các bảng tính lớn.
Bài viết này sẽ hướng dẫn bạn các phương pháp kiểm tra dữ liệu trùng lặp nâng cao trong Google Sheets, giúp bạn tiết kiệm thời gian, tăng độ chính xác và đưa ra những quyết định sáng suốt hơn.
🛠 Công cụ & tài nguyên nên dùng
Nếu bạn muốn làm nhanh hơn và áp dụng ngay vào công việc thực tế:
⚡ Đây là các tài nguyên mình đã dùng thực tế và thấy hiệu quả.
Mục lục

1. Giới thiệu về dữ liệu trùng lặp
Dữ liệu trùng lặp là các bản ghi giống hệt nhau hoặc gần giống nhau trong một bảng tính. Chúng có thể xuất hiện do nhiều nguyên nhân, chẳng hạn như nhập liệu thủ công, lỗi trong quá trình nhập dữ liệu hoặc tích hợp dữ liệu từ nhiều nguồn khác nhau.
Việc loại bỏ dữ liệu trùng lặp là rất quan trọng để đảm bảo tính chính xác và tin cậy của dữ liệu. Nó cũng giúp cải thiện hiệu suất của các phép tính và phân tích dữ liệu.
2. Các phương pháp kiểm tra dữ liệu trùng lặp cơ bản
Google Sheets cung cấp một số phương pháp cơ bản để kiểm tra dữ liệu trùng lặp:
- Sử dụng tính năng Conditional Formatting: Bạn có thể sử dụng Conditional Formatting để tô màu các ô chứa dữ liệu trùng lặp.
- Sử dụng tính năng Filter: Bạn có thể sử dụng Filter để lọc ra các bản ghi trùng lặp.
- Sử dụng hàm UNIQUE: Hàm UNIQUE trả về một danh sách các giá trị duy nhất trong một phạm vi dữ liệu.

3. Kiểm tra dữ liệu trùng lặp nâng cao với công thức
Để kiểm tra dữ liệu trùng lặp nâng cao, bạn có thể sử dụng kết hợp các hàm như COUNTIF và IF. Ví dụ, để kiểm tra xem một giá trị trong cột A có xuất hiện nhiều hơn một lần trong cột A hay không, bạn có thể sử dụng công thức sau:
=IF(COUNTIF(A:A, A1)>1, "Trùng lặp", "")
Công thức này sẽ trả về “Trùng lặp” nếu giá trị trong ô A1 xuất hiện nhiều hơn một lần trong cột A, và trả về một chuỗi trống nếu không.
Bạn có thể mở rộng công thức này để kiểm tra dữ liệu trùng lặp trên nhiều cột. Ví dụ, để kiểm tra xem một bản ghi có trùng lặp hay không dựa trên các giá trị trong cột A và cột B, bạn có thể sử dụng công thức sau:
=IF(COUNTIFS(A:A, A1, B:B, B1)>1, "Trùng lặp", "")
4. Kiểm tra dữ liệu trùng lặp với Google Apps Script
Google Apps Script cung cấp một cách mạnh mẽ để kiểm tra và xử lý dữ liệu trùng lặp trong Google Sheets. Bạn có thể viết một script để tự động tìm và loại bỏ các bản ghi trùng lặp.
Dưới đây là một ví dụ về script để tìm các hàng trùng lặp dựa trên một cột cụ thể:
function findDuplicateRows() {
var sheet = SpreadsheetApp.getActiveSpreadsheet().getActiveSheet();
var data = sheet.getDataRange().getValues();
var duplicates = [];
for (var i = 1; i < data.length; i++) {
for (var j = 0; j < i; j++) {
if (data[i][0] == data[j][0]) {
duplicates.push(i + 1);
}
}
}
if (duplicates.length > 0) {
Logger.log('Các hàng trùng lặp: ' + duplicates.join(', '));
} else {
Logger.log('Không tìm thấy hàng trùng lặp.');
}
}
Script này sẽ tìm các hàng trùng lặp dựa trên giá trị trong cột đầu tiên (cột A). Bạn có thể điều chỉnh script để kiểm tra dữ liệu trùng lặp trên các cột khác.

5. Xử lý dữ liệu trùng lặp
Sau khi đã xác định được dữ liệu trùng lặp, bạn có thể xử lý chúng theo nhiều cách khác nhau:
- Xóa các bản ghi trùng lặp: Đây là cách đơn giản nhất để loại bỏ dữ liệu trùng lặp. Tuy nhiên, bạn cần cẩn thận để không xóa nhầm các bản ghi quan trọng.
- Gộp các bản ghi trùng lặp: Nếu các bản ghi trùng lặp chứa thông tin khác nhau, bạn có thể gộp chúng thành một bản ghi duy nhất.
- Cập nhật các bản ghi trùng lặp: Nếu các bản ghi trùng lặp chứa thông tin mâu thuẫn, bạn có thể cập nhật chúng để đảm bảo tính nhất quán.
Việc lựa chọn phương pháp xử lý dữ liệu trùng lặp phù hợp phụ thuộc vào mục đích sử dụng dữ liệu và tính chất của dữ liệu trùng lặp.
Nếu bạn muốn tự động hóa quá trình tạo mã khách hàng, hãy tham khảo bài viết Cách Tạo Mã Khách Hàng Tự Động Trong Google Sheets. Ngoài ra, bạn cũng có thể tìm hiểu về Cách Tạo ID Tự Động Trong Google Sheets để quản lý dữ liệu hiệu quả hơn.
🛠 Công cụ & tài nguyên nên dùng
Nếu bạn muốn làm nhanh hơn và áp dụng ngay vào công việc thực tế:
⚡ Đây là các tài nguyên mình đã dùng thực tế và thấy hiệu quả.