Trong thế giới điện toán đám mây hiện nay, các tổ chức lưu trữ lượng dữ liệu khổng lồ trên nhiều nền tảng khác nhau Microsoft 365, Azure, SharePoint, Teams, máy chủ tập tin và các ứng dụng SaaS. Thách thức đặt ra là gì? Đó là làm thế nào để biết dữ liệu nào là nhạy cảm và chúng được lưu trữ ở đâu.
Đó là lúc các Loại Sensitive Information Types (SITs) phát huy tác dụng, chúng là cơ chế phát hiện cốt lõi đằng sau các khả năng Bảo vệ Thông tin và Ngăn ngừa Mất dữ liệu (DLP) của Microsoft Purview.
Thông tin nhạy cảm là gì?
Loại thông tin nhạy cảm (SIT) là một quy tắc dựa trên mẫu được Microsoft Purview sử dụng để tự động phát hiện và phân loại nội dung nhạy cảm trong môi trường của bạn.
Mỗi SIT được xây dựng bằng cách sử dụng:
- Biểu thức chính quy (regex) để phát hiện mẫu
- Từ điển từ khóa để đối sánh theo ngữ cảnh
- Các thuật toán kiểm tra tổng để xác thực (ví dụ: số thẻ tín dụng)
- Mức độ tự tin về độ chính xác của điểm số (Thấp, Trung bình, Cao)
Khi Microsoft Purview quét dữ liệu, nó sử dụng SIT (Student Informed Techniques) để phát hiện những thông tin như số thẻ tín dụng, giấy tờ tùy thân, hồ sơ sức khỏe hoặc dữ liệu tài chính, giúp các tổ chức bảo vệ và quản lý thông tin này một cách thông minh.

Lưu ý: SIT là công cụ phát hiện đứng sau các tính năng như DLP, Tự động gắn nhãn, Trình quét bảo vệ thông tin và Quản lý rủi ro nội bộ.
Cách thức hoạt động của SIT
Mỗi loại thông tin nhạy cảm đều có các yếu tố chính và phụ:
- Yếu tố chính – Mẫu số cụ thể (ví dụ: số có 16 chữ số).
- Yếu tố hỗ trợ – Từ khóa hoặc ngữ cảnh giúp tăng độ chính xác.
- Mức độ tin cậy – Cho biết hệ thống chắc chắn đến mức nào về sự trùng khớp.
Ví dụ, số thẻ tín dụng tích hợp sẵn SIT:
- Sử dụng biểu thức chính quy (regex) để tìm các chuỗi 16 chữ số.
- Xác thực số bằng cách sử dụng tổng kiểm tra Luhn.
- Tìm kiếm các từ khóa như Visa, Mastercard hoặc Amex ở gần đó
Nếu đáp ứng đủ các điều kiện này, Purview sẽ gắn cờ nội dung là Nhạy cảm với độ tin cậy cao.
Các loại thông tin nhạy cảm được tích hợp sẵn
Microsoft cung cấp hơn 400 SIT (Stack Test Instructor) tích hợp sẵn trên hơn 50 khu vực, bao gồm các khuôn khổ pháp lý và tuân thủ chính.
Các danh mục phổ biến
| Loại | Ví dụ |
|---|---|
| Tài chính | Thẻ tín dụng, Mã SWIFT, IBAN, Số tài khoản ngân hàng |
| Thông tin nhận dạng cá nhân | Hộ chiếu, Giấy phép lái xe, Chứng minh nhân dân, Mã số an sinh xã hội |
| Sức khỏe | Mã ICD-10, Số NHS, Mã số bảo hiểm y tế |
| Dữ liệu doanh nghiệp | Mã số nhân viên, Mã số lương, Mã số thuế |
| Quy định khu vực | ID EU, Aadhaar (Ấn Độ), SIN (Canada), INSEE (Pháp) |
Các loại thông tin nhạy cảm tùy chỉnh
Nếu tổ chức của bạn có các định dạng dữ liệu độc đáo, bạn có thể tạo các SIT tùy chỉnh để xác định chúng.
Ví dụ:
- Văn phòng luật sư: Số hồ sơ vụ án (ví dụ: CFN-1234)
- Ngân hàng: Mã số tham chiếu khoản vay
- Nhà sản xuất: Số sê-ri sản phẩm
Các bước để tạo SIT tùy chỉnh
- Vào Microsoft Purview > Data Classification > Sensitive Info Types
- Click Create > xác định bằng biểu thức chính quy hoặc mẫu từ khóa.
- Thiết lập mức độ tin cậy (Thấp / Trung bình / Cao)
- Kiểm thử phát hiện bằng cách sử dụng các tệp mẫu.
- Xuất bản để sử dụng trong các chính sách DLP, tự động gắn nhãn hoặc lưu giữ dữ liệu.
Người dùng nâng cao cũng có thể tải lên các định nghĩa SIT thông qua các mẫu XML PowerShell.
Ngoài biểu thức chính quy và từ khóa, Purview còn cung cấp các bộ phân loại có thể huấn luyện được hỗ trợ bởi máy học.
Các bộ phân loại này học hỏi từ các ví dụ thực tế về tài liệu của bạn, xác định nội dung dựa trên ngữ cảnh và ý nghĩa, chứ không chỉ dựa trên các mẫu.
Các bộ phân loại tích hợp bao gồm:
- Bản tóm tắt
- Hợp đồng
- Mã nguồn
- Tài liệu tài chính
- Hồ sơ sức khỏe
Bạn cũng có thể tạo các bộ phân loại tùy chỉnh cho các tài liệu đặc thù của doanh nghiệp bằng cách tải lên một tập dữ liệu huấn luyện đã được gắn nhãn trong cổng thông tin Purview.
SIT được sử dụng ở đâu trong phạm vi của Microsoft?
| Tính năng | Mục đích của SITs |
|---|---|
| Ngăn ngừa mất dữ liệu (DLP) | Phát hiện dữ liệu nhạy cảm đang được truyền tải và áp dụng các quy tắc để chặn hoặc cảnh báo. |
| Tự động dán nhãn | Tự động áp dụng nhãn độ nhạy dựa trên các SIT được phát hiện. |
| Máy quét bảo vệ thông tin | Quét các thư mục chia sẻ tệp và kho lưu trữ tại chỗ để tìm dữ liệu nhạy cảm. |
| Báo cáo phân loại dữ liệu | Giúp bạn nắm rõ vị trí lưu trữ thông tin nhạy cảm. |
| Quản lý rủi ro nội bộ | Liên kết các hoạt động của người dùng với việc truy cập và chia sẻ dữ liệu nhạy cảm. |
Vai trò và quyền hạn
Để xem, quản lý hoặc tạo các Loại Thông tin Nhạy cảm, bạn cần có các vai trò Purview cụ thể:
| Vai trò / Nhóm | Cấp độ truy cập |
|---|---|
| Quản trị viên tuân thủ | Toàn quyền tạo và quản lý SIT. |
| Quản trị viên bảo mật | Theo dõi các phát hiện và cảnh báo SIT |
| Người đóng góp về bảo vệ thông tin | Tạo SIT tùy chỉnh và quản lý bộ phân loại |
| Trình xem khám phá nội dung | Xem các kết quả khớp SIT trong tệp |
| Quản trị viên toàn cầu | Quyền truy cập đầy đủ cho người dùng (chỉ dành cho thiết lập ban đầu) |
Yêu cầu cấp phép
Khả năng sử dụng và quản lý các Loại Thông tin Nhạy cảm phụ thuộc vào giấy phép Microsoft 365 của bạn.
| Tính năng | Giấy phép cần thiết |
|---|---|
| Sử dụng SIT tích hợp sẵn trong DLP hoặc chức năng ghi nhãn. | Microsoft 365 E3 (partial), Microsoft 365 E5 (full) |
| Tạo SIT tùy chỉnh | Microsoft 365 E5 / A5 / G5 |
| Sử dụng bộ phân loại có thể huấn luyện | Microsoft 365 E5 / E5 Compliance |
| Tự động gắn nhãn bằng SITs | Microsoft 365 E5 Information Protection & Governance add-on |
Tổng kết
Vậy là tôi vừa giới thiệu xong cho bạn Cách hoạt động Các loại thông tin nhạy cảm (SIT) trên Microsoft Purview. Nếu gặp bất kỳ khó khăn nào trong quá trình thực hiện, bạn có thể liên hệ banquyenphanmem.com hoặc gọi số 028.22443013 để được trợ giúp. Với các hướng dẫn trên, chúng tôi hy vọng bạn đã giải quyết được nhu cầu của mình một cách nhanh chóng và hiệu quả.













