Cách hoạt động Các loại thông tin nhạy cảm (SIT) trên Microsoft Purview

Trong thế giới điện toán đám mây hiện nay, các tổ chức lưu trữ lượng dữ liệu khổng lồ trên nhiều nền tảng khác nhau  Microsoft 365, Azure, SharePoint, Teams, máy chủ tập tin và các ứng dụng SaaS. Thách thức đặt ra là gì? Đó là làm thế nào để biết dữ liệu nào là nhạy cảm và chúng được lưu trữ ở đâu.

Đó là lúc các Loại Sensitive Information Types (SITs) phát huy tác dụng, chúng là cơ chế phát hiện cốt lõi đằng sau các khả năng Bảo vệ Thông tin và Ngăn ngừa Mất dữ liệu (DLP) của Microsoft Purview.

🔐 Understanding Sensitive Information Types (SITs) in Microsoft Purview

Thông tin nhạy cảm là gì?

Loại thông tin nhạy cảm (SIT) là một quy tắc dựa trên mẫu được Microsoft Purview sử dụng để tự động phát hiện và phân loại nội dung nhạy cảm trong môi trường của bạn.

Mỗi SIT được xây dựng bằng cách sử dụng:

  • Biểu thức chính quy (regex) để phát hiện mẫu
  • Từ điển từ khóa để đối sánh theo ngữ cảnh
  • Các thuật toán kiểm tra tổng để xác thực (ví dụ: số thẻ tín dụng)
  • Mức độ tự tin về độ chính xác của điểm số (Thấp, Trung bình, Cao)

Khi Microsoft Purview quét dữ liệu, nó sử dụng SIT (Student Informed Techniques) để phát hiện những thông tin như số thẻ tín dụng, giấy tờ tùy thân, hồ sơ sức khỏe hoặc dữ liệu tài chính, giúp các tổ chức bảo vệ và quản lý thông tin này một cách thông minh.

Lưu ý: SIT là công cụ phát hiện đứng sau các tính năng như DLP, Tự động gắn nhãn, Trình quét bảo vệ thông tin và Quản lý rủi ro nội bộ.

Cách thức hoạt động của SIT

Mỗi loại thông tin nhạy cảm đều có các yếu tố chính và phụ:

  • Yếu tố chính – Mẫu số cụ thể (ví dụ: số có 16 chữ số).
  • Yếu tố hỗ trợ – Từ khóa hoặc ngữ cảnh giúp tăng độ chính xác.
  • Mức độ tin cậy – Cho biết hệ thống chắc chắn đến mức nào về sự trùng khớp.

Ví dụ, số thẻ tín dụng tích hợp sẵn SIT:

  • Sử dụng biểu thức chính quy (regex) để tìm các chuỗi 16 chữ số.
  • Xác thực số bằng cách sử dụng tổng kiểm tra Luhn.
  • Tìm kiếm các từ khóa như VisaMastercard hoặc Amex ở gần đó

Nếu đáp ứng đủ các điều kiện này, Purview sẽ gắn cờ nội dung là Nhạy cảm với độ tin cậy cao.

Các loại thông tin nhạy cảm được tích hợp sẵn

Microsoft cung cấp hơn 400 SIT (Stack Test Instructor) tích hợp sẵn trên hơn 50 khu vực, bao gồm các khuôn khổ pháp lý và tuân thủ chính.

Các danh mục phổ biến

LoạiVí dụ
Tài chínhThẻ tín dụng, Mã SWIFT, IBAN, Số tài khoản ngân hàng
Thông tin nhận dạng cá nhânHộ chiếu, Giấy phép lái xe, Chứng minh nhân dân, Mã số an sinh xã hội
Sức khỏeMã ICD-10, Số NHS, Mã số bảo hiểm y tế
Dữ liệu doanh nghiệpMã số nhân viên, Mã số lương, Mã số thuế
Quy định khu vựcID EU, Aadhaar (Ấn Độ), SIN (Canada), INSEE (Pháp)
Bạn có thể xem tất cả các SIT (Loại Thông tin Nhạy cảm) hiện có trong Cổng Tuân thủ Microsoft Purview > Phân loại Dữ liệu > Loại Thông tin Nhạy cảm.

Các loại thông tin nhạy cảm tùy chỉnh

Nếu tổ chức của bạn có các định dạng dữ liệu độc đáo, bạn có thể tạo các SIT tùy chỉnh để xác định chúng.

Ví dụ:

  • Văn phòng luật sư: Số hồ sơ vụ án (ví dụ: CFN-1234)
  • Ngân hàng: Mã số tham chiếu khoản vay
  • Nhà sản xuất: Số sê-ri sản phẩm

Microsoft Purview | Information Protection: Updates to Microsoft built-in Sensitive Information Types (SITs)

Các bước để tạo SIT tùy chỉnh

  1. Vào Microsoft Purview > Data Classification > Sensitive Info Types
  2. Click Create > xác định bằng biểu thức chính quy hoặc mẫu từ khóa.
  3. Thiết lập mức độ tin cậy (Thấp / Trung bình / Cao)
  4. Kiểm thử phát hiện bằng cách sử dụng các tệp mẫu.
  5. Xuất bản để sử dụng trong các chính sách DLP, tự động gắn nhãn hoặc lưu giữ dữ liệu.

Người dùng nâng cao cũng có thể tải lên các định nghĩa SIT thông qua các mẫu XML PowerShell.

Bộ phân loại có thể huấn luyện (SIT dựa trên AI)

Ngoài biểu thức chính quy và từ khóa, Purview còn cung cấp các bộ phân loại có thể huấn luyện được hỗ trợ bởi máy học.
Các bộ phân loại này học hỏi từ các ví dụ thực tế về tài liệu của bạn, xác định nội dung dựa trên ngữ cảnh và ý nghĩa, chứ không chỉ dựa trên các mẫu.

Các bộ phân loại tích hợp bao gồm:

  • Bản tóm tắt
  • Hợp đồng
  • Mã nguồn
  • Tài liệu tài chính
  • Hồ sơ sức khỏe

Bạn cũng có thể tạo các bộ phân loại tùy chỉnh cho các tài liệu đặc thù của doanh nghiệp bằng cách tải lên một tập dữ liệu huấn luyện đã được gắn nhãn trong cổng thông tin Purview.

SIT được sử dụng ở đâu trong phạm vi của Microsoft?

Tính năngMục đích của SITs
Ngăn ngừa mất dữ liệu (DLP)Phát hiện dữ liệu nhạy cảm đang được truyền tải và áp dụng các quy tắc để chặn hoặc cảnh báo.
Tự động dán nhãnTự động áp dụng nhãn độ nhạy dựa trên các SIT được phát hiện.
Máy quét bảo vệ thông tinQuét các thư mục chia sẻ tệp và kho lưu trữ tại chỗ để tìm dữ liệu nhạy cảm.
Báo cáo phân loại dữ liệuGiúp bạn nắm rõ vị trí lưu trữ thông tin nhạy cảm.
Quản lý rủi ro nội bộLiên kết các hoạt động của người dùng với việc truy cập và chia sẻ dữ liệu nhạy cảm.
SITs tạo nên nền tảng cho việc khám phá, gắn nhãn và bảo vệ dữ liệu trong Microsoft Purview.

Vai trò và quyền hạn

Để xem, quản lý hoặc tạo các Loại Thông tin Nhạy cảm, bạn cần có các vai trò Purview cụ thể:

Vai trò / NhómCấp độ truy cập
Quản trị viên tuân thủToàn quyền tạo và quản lý SIT.
Quản trị viên bảo mậtTheo dõi các phát hiện và cảnh báo SIT
Người đóng góp về bảo vệ thông tinTạo SIT tùy chỉnh và quản lý bộ phân loại
Trình xem khám phá nội dungXem các kết quả khớp SIT trong tệp
Quản trị viên toàn cầuQuyền truy cập đầy đủ cho người dùng (chỉ dành cho thiết lập ban đầu)

Yêu cầu cấp phép

Khả năng sử dụng và quản lý các Loại Thông tin Nhạy cảm phụ thuộc vào giấy phép Microsoft 365 của bạn.

Tính năngGiấy phép cần thiết
Sử dụng SIT tích hợp sẵn trong DLP hoặc chức năng ghi nhãn.Microsoft 365 E3 (partial), Microsoft 365 E5 (full)
Tạo SIT tùy chỉnhMicrosoft 365 E5 / A5 / G5
Sử dụng bộ phân loại có thể huấn luyệnMicrosoft 365 E5 / E5 Compliance
Tự động gắn nhãn bằng SITsMicrosoft 365 E5 Information Protection & Governance add-on

Tổng kết

Vậy là tôi vừa giới thiệu xong cho bạn Cách hoạt động Các loại thông tin nhạy cảm (SIT) trên Microsoft Purview. Nếu gặp bất kỳ khó khăn nào trong quá trình thực hiện, bạn có thể liên hệ banquyenphanmem.com hoặc gọi số 028.22443013 để được trợ giúp. Với các hướng dẫn trên, chúng tôi hy vọng bạn đã giải quyết được nhu cầu của mình một cách nhanh chóng và hiệu quả.

Bài viết liên quan

zalo-icon
phone-icon