Cách hoạt động Các loại thông tin nhạy cảm (SIT) trên Microsoft Purview

Trong thế giới điện toán đám mây hiện nay, các tổ chức lưu trữ lượng dữ liệu khổng lồ trên nhiều nền tảng khác nhau Microsoft 365, Azure, SharePoint, Teams, máy chủ tập tin và các ứng dụng SaaS. Thách thức đặt ra là gì? Đó là làm thế nào để biết dữ liệu nào là nhạy cảm và chúng được lưu trữ ở đâu.

Đó là lúc các Loại Sensitive Information Types (SITs) phát huy tác dụng, chúng là cơ chế phát hiện cốt lõi đằng sau các khả năng Bảo vệ Thông tin và Ngăn ngừa Mất dữ liệu (DLP) của Microsoft Purview.

Thông tin nhạy cảm là gì?

Loại thông tin nhạy cảm (SIT) là một quy tắc dựa trên mẫu được Microsoft Purview sử dụng để tự động phát hiện và phân loại nội dung nhạy cảm trong môi trường của bạn.

Mỗi SIT được xây dựng bằng cách sử dụng:

Biểu thức chính quy (regex) để phát hiện mẫu
Từ điển từ khóa để đối sánh theo ngữ cảnh
Các thuật toán kiểm tra tổng để xác thực (ví dụ: số thẻ tín dụng)
Mức độ tự tin về độ chính xác của điểm số (Thấp, Trung bình, Cao)

Khi Microsoft Purview quét dữ liệu, nó sử dụng SIT (Student Informed Techniques) để phát hiện những thông tin như số thẻ tín dụng, giấy tờ tùy thân, hồ sơ sức khỏe hoặc dữ liệu tài chính, giúp các tổ chức bảo vệ và quản lý thông tin này một cách thông minh.

Lưu ý: SIT là công cụ phát hiện đứng sau các tính năng như DLP, Tự động gắn nhãn, Trình quét bảo vệ thông tin và Quản lý rủi ro nội bộ.

Cách thức hoạt động của SIT

Mỗi loại thông tin nhạy cảm đều có các yếu tố chính và phụ:

Yếu tố chính – Mẫu số cụ thể (ví dụ: số có 16 chữ số).
Yếu tố hỗ trợ – Từ khóa hoặc ngữ cảnh giúp tăng độ chính xác.
Mức độ tin cậy – Cho biết hệ thống chắc chắn đến mức nào về sự trùng khớp.

Ví dụ, số thẻ tín dụng tích hợp sẵn SIT:

Sử dụng biểu thức chính quy (regex) để tìm các chuỗi 16 chữ số.
Xác thực số bằng cách sử dụng tổng kiểm tra Luhn.
Tìm kiếm các từ khóa như Visa, Mastercard hoặc Amex ở gần đó

Nếu đáp ứng đủ các điều kiện này, Purview sẽ gắn cờ nội dung là Nhạy cảm với độ tin cậy cao.

Các loại thông tin nhạy cảm được tích hợp sẵn

Microsoft cung cấp hơn 400 SIT (Stack Test Instructor) tích hợp sẵn trên hơn 50 khu vực, bao gồm các khuôn khổ pháp lý và tuân thủ chính.

Các danh mục phổ biến

Loại	Ví dụ
Tài chính	Thẻ tín dụng, Mã SWIFT, IBAN, Số tài khoản ngân hàng
Thông tin nhận dạng cá nhân	Hộ chiếu, Giấy phép lái xe, Chứng minh nhân dân, Mã số an sinh xã hội
Sức khỏe	Mã ICD-10, Số NHS, Mã số bảo hiểm y tế
Dữ liệu doanh nghiệp	Mã số nhân viên, Mã số lương, Mã số thuế
Quy định khu vực	ID EU, Aadhaar (Ấn Độ), SIN (Canada), INSEE (Pháp)

Các loại thông tin nhạy cảm tùy chỉnh

Nếu tổ chức của bạn có các định dạng dữ liệu độc đáo, bạn có thể tạo các SIT tùy chỉnh để xác định chúng.

Ví dụ:

Văn phòng luật sư: Số hồ sơ vụ án (ví dụ: CFN-1234)
Ngân hàng: Mã số tham chiếu khoản vay
Nhà sản xuất: Số sê-ri sản phẩm

Các bước để tạo SIT tùy chỉnh

Vào Microsoft Purview > Data Classification > Sensitive Info Types
Click Create > xác định bằng biểu thức chính quy hoặc mẫu từ khóa.
Thiết lập mức độ tin cậy (Thấp / Trung bình / Cao)
Kiểm thử phát hiện bằng cách sử dụng các tệp mẫu.
Xuất bản để sử dụng trong các chính sách DLP, tự động gắn nhãn hoặc lưu giữ dữ liệu.

Người dùng nâng cao cũng có thể tải lên các định nghĩa SIT thông qua các mẫu XML PowerShell.

Ngoài biểu thức chính quy và từ khóa, Purview còn cung cấp các bộ phân loại có thể huấn luyện được hỗ trợ bởi máy học.
Các bộ phân loại này học hỏi từ các ví dụ thực tế về tài liệu của bạn, xác định nội dung dựa trên ngữ cảnh và ý nghĩa, chứ không chỉ dựa trên các mẫu.

Các bộ phân loại tích hợp bao gồm:

Bản tóm tắt
Hợp đồng
Mã nguồn
Tài liệu tài chính
Hồ sơ sức khỏe

Bạn cũng có thể tạo các bộ phân loại tùy chỉnh cho các tài liệu đặc thù của doanh nghiệp bằng cách tải lên một tập dữ liệu huấn luyện đã được gắn nhãn trong cổng thông tin Purview.

SIT được sử dụng ở đâu trong phạm vi của Microsoft?

Tính năng	Mục đích của SITs
Ngăn ngừa mất dữ liệu (DLP)	Phát hiện dữ liệu nhạy cảm đang được truyền tải và áp dụng các quy tắc để chặn hoặc cảnh báo.
Tự động dán nhãn	Tự động áp dụng nhãn độ nhạy dựa trên các SIT được phát hiện.
Máy quét bảo vệ thông tin	Quét các thư mục chia sẻ tệp và kho lưu trữ tại chỗ để tìm dữ liệu nhạy cảm.
Báo cáo phân loại dữ liệu	Giúp bạn nắm rõ vị trí lưu trữ thông tin nhạy cảm.
Quản lý rủi ro nội bộ	Liên kết các hoạt động của người dùng với việc truy cập và chia sẻ dữ liệu nhạy cảm.

Vai trò và quyền hạn

Để xem, quản lý hoặc tạo các Loại Thông tin Nhạy cảm, bạn cần có các vai trò Purview cụ thể:

Vai trò / Nhóm	Cấp độ truy cập
Quản trị viên tuân thủ	Toàn quyền tạo và quản lý SIT.
Quản trị viên bảo mật	Theo dõi các phát hiện và cảnh báo SIT
Người đóng góp về bảo vệ thông tin	Tạo SIT tùy chỉnh và quản lý bộ phân loại
Trình xem khám phá nội dung	Xem các kết quả khớp SIT trong tệp
Quản trị viên toàn cầu	Quyền truy cập đầy đủ cho người dùng (chỉ dành cho thiết lập ban đầu)

Yêu cầu cấp phép

Khả năng sử dụng và quản lý các Loại Thông tin Nhạy cảm phụ thuộc vào giấy phép Microsoft 365 của bạn.

Tính năng	Giấy phép cần thiết
Sử dụng SIT tích hợp sẵn trong DLP hoặc chức năng ghi nhãn.	Microsoft 365 E3 (partial), Microsoft 365 E5 (full)
Tạo SIT tùy chỉnh	Microsoft 365 E5 / A5 / G5
Sử dụng bộ phân loại có thể huấn luyện	Microsoft 365 E5 / E5 Compliance
Tự động gắn nhãn bằng SITs	Microsoft 365 E5 Information Protection & Governance add-on

Tổng kết

Vậy là tôi vừa giới thiệu xong cho bạn Cách hoạt động Các loại thông tin nhạy cảm (SIT) trên Microsoft Purview. Nếu gặp bất kỳ khó khăn nào trong quá trình thực hiện, bạn có thể liên hệ banquyenphanmem.com hoặc gọi số 028.22443013 để được trợ giúp. Với các hướng dẫn trên, chúng tôi hy vọng bạn đã giải quyết được nhu cầu của mình một cách nhanh chóng và hiệu quả.

Cách hoạt động Các loại thông tin nhạy cảm (SIT) trên Microsoft Purview

Thông tin nhạy cảm là gì?

Cách thức hoạt động của SIT

Các loại thông tin nhạy cảm được tích hợp sẵn

Các danh mục phổ biến

Các loại thông tin nhạy cảm tùy chỉnh

Các bước để tạo SIT tùy chỉnh

Các bộ phân loại tích hợp bao gồm:

SIT được sử dụng ở đâu trong phạm vi của Microsoft?

Vai trò và quyền hạn

Yêu cầu cấp phép

Tổng kết

Thành Lập Đoàn Kiểm Tra Doanh Nghiệp Sử Dụng Phần Mềm Không Bản Quyền

FLASH SALE: GIẢM NHANH MUA NHANH – ƯU ĐÃI ĐẾN 25% CHO AUTOCAD IST

Thông báo lịch nghỉ lễ Giỗ Tổ Hùng Vương & 30/04 – 01/05/2026

Get-MgUser Là Gì? Cách Lấy Danh Sách User Entra ID trên Microsoft 365

2 Cách Xuất User Entra ID Ra CSV Trong Microsoft 365 Dễ Hiểu

Dynamic Groups là gì? Cách Tạo Dynamic Groups Trong Entra ID Chi Tiết A-Z

Cách Xem và Phân Tích Email Header Outlook Để Kiểm Tra Nguồn Gửi

3 Cách Tìm Mailbox Không Sử Dụng Trong Microsoft 365 Đơn Giản

2 Cách Export Thành Viên Distribution List Trong Microsoft 365

Cách Kiểm Tra Email Bị Cách Ly Trong Microsoft 365 Nhanh Chóng

Cách Kiểm Tra Inbox Rules Bằng PowerShell Get-InboxRule

Cách Liệt Kê Những Mailbox đã bật Forwarding Rules Trong Microsoft 365

Cách hoạt động Các loại thông tin nhạy cảm (SIT) trên Microsoft Purview

Thông tin nhạy cảm là gì?

Cách thức hoạt động của SIT

Các loại thông tin nhạy cảm được tích hợp sẵn

Các danh mục phổ biến

Các loại thông tin nhạy cảm tùy chỉnh

Các bước để tạo SIT tùy chỉnh

Bộ phân loại có thể huấn luyện (SIT dựa trên AI)

Các bộ phân loại tích hợp bao gồm:

SIT được sử dụng ở đâu trong phạm vi của Microsoft?

Vai trò và quyền hạn

Yêu cầu cấp phép

Tổng kết