Trong nền kinh tế với sự bùng nổ của dữ liệu lớn (Big data), hệ thống mạng băng thông rộng kết hợp với sự phát triển vượt bậc của khoa học công nghệ, thị trường dữ liệu trở thành điểm nóng thu hút lợi nhuận. Tuy nhiên, điều này có một tác động mạnh mẽ đối với vấn đề bảo vệ quyền riêng tư. Do đó, bài viết sẽ phân tích các vấn đề pháp lý xoay quanh thị trường dữ liệu liên quan đến quyền riêng tư trong nền kinh tế số. Đồng thời tác giả cũng đưa ra mô hình quản lý tiêu biểu cho thị trường dữ liệu và kiến nghị hoàn thiện pháp luật Việt Nam hiện hành để tạo môi trường dữ liệu an toàn, tiềm năng, bảo vệ quyền riêng tư của cá nhân trong vòng đời dữ liệu lớn.

Dữ liệu ở khắp mọi nơi là dấu hiệu mạnh mẽ về tính phổ biến của dữ liệu lớn (Big data). Điều này đã thúc đẩy nhu cầu mạnh mẽ về các kỹ năng và tài nguyên phân tích, bởi vì khi dữ liệu chồng chất, quản lý và phân tích các tài nguyên dữ liệu này một cách tối đa là yếu tố thành công quan trọng trong việc tạo ra lợi thế cạnh tranh và đòn bẩy chiến lược1. Dữ liệu lớn2 đề cập cụ thể đến các tập dữ liệu quá lớn hoặc phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không đủ. Đó là khối lượng lớn dữ liệu - cả có cấu trúc và không có cấu trúc - tràn ngập trên nền tảng Internet hàng ngày. Do sự phát triển công nghệ gần đây, lượng dữ liệu được tạo ra bởi nền tảng Internet: các ứng dụng, các trang mạng xã hội, các công ty dịch vụ, thương mại điện tử và nhiều loại hình khác đang tăng mạnh từng ngày. Do vậy, mức độ liên quan, tầm quan trọng và tác động của phân tích, khai thác dữ liệu trong vòng đời dữ liệu hiện đang lớn hơn bao giờ hết và do ngày càng nhiều dữ liệu được thu thập và có giá trị chiến lược khi biết những gì ẩn trong dữ liệu3 và điều này đã đặt ra những vấn đề trong việc bảo vệ quyền riêng tư trong vòng đời của dữ liệu.

Ảnh minh họa. Nguồn: vov.vn


1. Dữ liệu lớn (Big data)
Thế giới đang bước vào giai đoạn đầu mà diễn đàn Kinh tế Thế giới (WEF) gọi là "Cuộc cách mạng công nghiệp lần thứ tư" vào năm 2016. Cuộc cách mạng công nghiệp lần thứ tư (Công nghiệp 4.0) được đánh dấu thông qua sự xuất hiện của "hệ thống thật - ảo" (Cyber-physical systems) trong đó phần mềm giao diện liền mạch mạng với các hệ thống vật lý, chẳng hạn như cảm biến, điện thoại thông minh, xe cộ, lưới điện hoặc tòa nhà, để tạo ra một thế giới Internet vạn vật (IoT) mới. Dữ liệu và thông tin là nhiên liệu của thời đại ngày nay, nơi các thuật toán phân tích mạnh mẽ đốt cháy nhiên liệu này để đưa ra các quyết định được kỳ vọng là tạo ra một thế giới thông minh hơn và hiệu quả hơn cho tất cả mọi người. Dữ liệu trong thế giới ngày này được ví như một loại tài nguyên, nhưng nó khác các loại tài nguyên trong tự nhiên, tài nguyên này sẽ không mất đi nếu chủ sở hữu dữ liệu không xoá bỏ, và chúng có thể tạo ra rất nhiều giá trị mới cho xã hội.
Dữ liệu lớn được định nghĩa là tập hợp các tập dữ liệu có khối lượng, tốc độ hoặc sự đa dạng lớn đến mức khó lưu trữ, quản lý, xử lý và phân tích dữ liệu bằng cơ sở dữ liệu truyền thống và các công cụ xử lý dữ liệu4. Trong những năm gần đây, đã có sự tăng trưởng theo cấp số nhân về cả dữ liệu có cấu trúc và không có cấu trúc được tạo ra bởi công nghệ thông tin, công nghiệp, chăm sóc sức khỏe, bán lẻ, web và các hệ thống khác. Khoa học và phân tích dữ liệu lớn liên quan đến việc thu thập, lưu trữ, xử lý và phân tích dữ liệu quy mô lớn trên các hệ thống điện toán dựa trên đám mây.
Các thuộc tính của dữ liệu lớn được phản ánh bởi 3V’s, đó là khối lượng, vận tốc và sự đa dạng. Các nghiên cứu sau đó đã chỉ ra rằng định nghĩa về 3V là không đủ để giải thích dữ liệu lớn mà chúng ta phải đối mặt hiện nay. Do đó, tính xác thực, tính hợp lệ, giá trị, sự thay đổi, địa điểm, và những từ ngữ đã được thêm vào để làm cho một số giải thích bổ sung về dữ liệu lớn5. Chủ đề chung của dữ liệu lớn là dữ liệu rất đa dạng, tức là chúng có thể chứa văn bản, âm thanh, hình ảnh hoặc video, v.v.. Chất lượng khác nhau của dữ liệu được biểu thị theo nhiều loại. Để đảm bảo quyền riêng tư của dữ liệu lớn, nhiều cơ chế khác nhau đã được phát triển trong những năm gần đây.
Theo ước tính của IBM (International Business Machines) một tập đoàn công nghệ máy tính đa quốc gia có trụ sở tại Armonk, New York, Mỹ thống kê rằng có khoảng 2,5 nghìn tỷ byte dữ liệu được tạo ra mỗi ngày6. Một báo cáo gần đây của DOMO ước tính lượng dữ liệu được tạo ra mỗi phút trên các nền tảng trực tuyến phổ biến7:
• Người dùng Facebook chia sẻ gần 4,16 triệu phần nội dung;
• Người dùng Twitter gửi gần 300.000 tweet;
• Người dùng Instagram thích gần 1,73 triệu ảnh;
• Người dùng YouTube tải lên 300 giờ nội dung video mới;
• Người dùng Apple tải xuống gần 51.000 ứng dụng;
• Người dùng Skype thực hiện gần 110.000 cuộc gọi mới;
• Amazon nhận được 4300 khách truy cập mới;
• Hành khách Uber đi 694 chuyến;
• Người đăng ký Netflix phát gần 77.000 giờ video.
Dữ liệu lớn có tiềm năng cung cấp năng lượng cho thế hệ ứng dụng thông minh tiếp theo sẽ tận dụng sức mạnh của dữ liệu để làm cho các ứng dụng trở nên thông minh. Các ứng dụng của dữ liệu lớn trải rộng trên nhiều lĩnh vực như web, bán lẻ và tiếp thị, ngân hàng và tài chính, công nghiệp, chăm sóc sức khỏe, môi trường, Internet of Things (IoT) và hệ thống vật lý mạng.
Phân tích dữ liệu lớn liên quan đến việc thu thập, lưu trữ, xử lý và phân tích dữ liệu ở quy mô lớn này. Cần có các công cụ và khuôn khổ chuyên dụng để phân tích dữ liệu lớn khi: (1) khối lượng dữ liệu liên quan quá lớn đến mức khó lưu trữ, xử lý và phân tích dữ liệu trên một máy duy nhất, (2) tốc độ của dữ liệu rất cao và dữ liệu cần được phân tích trong thời gian xác thực, (3) có nhiều loại dữ liệu liên quan, có thể có cấu trúc, không cấu trúc hoặc bán cấu trúc và được thu thập từ nhiều nguồn dữ liệu, (4) nhiều loại phân tích khác nhau cần được thực hiện để trích xuất giá trị từ dữ liệu như phân tích mô tả, đánh giá, chẩn đoán, dự đoán. 
Như vậy, việc phân tích dữ liệu lớn và khai thác các giá trị của luồng dữ liệu diễn ra trong tất cả các giai đoạn của vòng đời dữ liệu và điều này cũng đặt ra nhiều vấn đề pháp lý liên quan đến việc bảo vệ quyền riêng tư của các chủ thể dữ liệu.
2. Vòng đời dữ liệu (The Big Data Life Cycle)
Hiện nay, có rất nhiều quan điểm khác nhau về phân loại các giai đoạn của vòng đời dữ liệu nhưng nhìn chung có hai quan điểm được sử dụng rộng rãi. Đó là, quan điểm của Priyank Jain, Manasi Gyanchandani và Nilay Khare cho rằng các giai đoạn trong vòng đời dữ liệu lớn gồm tạo, lưu trữ và xử lý dữ liệu8, và quan điểm của Judith H, Alan N, Fern H and Marcia K cho rằng vòng đời của dữ liệu lớn bao gồm năm giai đoạn. Các giai đoạn này là thu thập dữ liệu, làm sạch dữ liệu, phân loại dữ liệu, mô hình hóa dữ liệu và cung cấp dữ liệu9.


Giai đoạn thu thập dữ liệu bao gồm việc thu thập và lưu trữ dữ liệu từ các nguồn tài nguyên khác nhau. Tiếp theo là giai đoạn làm sạch dữ liệu, tại giai đoạn này xác nhận, chọn lọc xem có một số thông tin không mong muốn trong dữ liệu hoặc các giá trị bị thiếu được thực hiện hay không. Giai đoạn phân loại dữ liệu sẽ phân loại dữ liệu theo các loại có cấu trúc, bán cấu trúc hoặc không có cấu trúc. Trong giai đoạn mô hình hóa dữ liệu, phân tích dữ liệu được thực hiện và kết quả là dữ liệu được phân cụm cho các mục tiêu. Cuối cùng, giai đoạn cung cấp dữ liệu liên quan đến việc tạo ra và khai thác giá trị các báo cáo dựa trên kết quả của giai đoạn mô hình hóa.
Các giai đoạn của vòng đời dữ liệu được khai thác hàng giây hàng phút trong các hoạt động như: ngân hàng và chứng khoán, truyền thông và giải trí, nhà cung cấp dịch vụ chăm sóc sức khỏe, giáo dục, sản xuất và nguồn tài nguyên tự nhiên, quản lý của nhà nước, bảo hiểm, thương mại bán buôn và bán lẻ, giao thông vận tải, năng lượng và tiện ích... Trong từng lĩnh vực hoạt động, tất cả các giai đoạn của vòng đời dữ liệu đều đặt ra các vấn đề trong việc bảo vệ quyền riêng tư của các chủ thể dữ liệu, ngoài ra các chủ thể sở hữu dữ liệu cũng không chắc chắn về cách dữ liệu có thể được sử dụng và khi nào sử dụng dữ liệu, cũng như các công cụ pháp lý cụ thể trong việc đảm bảo các vấn đề này hiện nay.
3. Quyền riêng tư
a) Quyền riêng tư trong các quy định của pháp luật Việt Nam
Sự ra đời của công nghệ mới và vòng đời dữ liệu lớn mang lại những lo ngại mới về quyền riêng tư. Các vấn đề về quyền riêng tư có thể phát sinh theo hai cách10. Thứ nhất, dữ liệu về các chủ thể dữ liệu có thể được thu thập mà các chủ thể này không hề hay biết. Thứ hai, chủ thể dữ liệu có thể biết rằng dữ liệu được thu thập về họ, nhưng không có ý kiến về cách dữ liệu được sử dụng. Hơn nữa, điều quan trọng cần lưu ý rằng, tất cả các giai đoạn của vòng đời dữ liệu luôn mang lại nhiều mối quan tâm về quyền riêng tư, nhưng ở giai đoạn phân tích dữ liệu thì cần được đặc biệt quan tâm hơn so với việc thu thập dữ liệu đơn giản và truy xuất dữ liệu từ cơ sở dữ liệu. Bởi vì, phân tích dữ liệu đòi hỏi phải sử dụng một lượng lớn dữ liệu - có thể được kết hợp từ nhiều nguồn, bao gồm cả Internet - để khai thác các mẫu ẩn. Do đó, công nghệ này cho phép khám phá các mối quan hệ chưa từng được biết đến trước đây mà khách hàng và chủ sở hữu dữ liệu cũng có thể không lường trước được những vấn đề này. Việc phát hiện ra các mô hình ẩn này tạo thành mối đe dọa bổ sung đối với quyền riêng tư.  Đây cũng là vấn đề còn đang để ngỏ trong các quy định pháp luật dân sự Việt Nam.
Theo quy định của pháp luật Việt Nam, quyền riêng tư là quyền cơ bản của con người, của mỗi cá nhân. Xã hội ngày càng phát triển thì các quyền con người cũng ngày càng được tôn trọng, bảo vệ và bảo đảm một cách tối đa. Hiến pháp năm 2013 - đạo luật nền tảng trong hệ thống pháp luật quốc gia của nước Cộng hòa xã hội chủ nghĩa Việt Nam ghi nhận11: “1. Mọi người có quyền bất khả xâm phạm về đời sống riêng tư, bí mật cá nhân và bí mật gia đình; có quyền bảo vệ danh dự, uy tín của mình. Thông tin về đời sống riêng tư, bí mật cá nhân, bí mật gia đình được pháp luật bảo đảm an toàn. 2. Mọi người có quyền bí mật thư tín, điện thoại, điện tín và các hình thức trao đổi thông tin riêng tư khác. Không ai được bóc mở, kiểm soát, thu giữ trái luật thư tín, điện thoại, điện tín và các hình thức trao đổi thông tin riêng tư của người khác”.
Để cụ thể quy định của Hiến pháp, Bộ luật Dân sự năm 2015 quy định về quyền riêng tư đối với hình ảnh cá nhân tại Điều 32: “Cá nhân có quyền đối với hình ảnh của mình. Việc sử dụng hình ảnh của cá nhân phải được người đó đồng ý. Việc sử dụng hình ảnh của người khác vì mục đích thương mại thì phải trả thù lao cho người có hình ảnh, trừ trường hợp các bên có thỏa thuận khác”. Đồng thời, Điều 34 và 38 của Bộ luật này cũng quy định về quyền được bảo vệ danh dự, nhân phẩm, uy tín và quyền về đời sống riêng tư, bí mật cá nhân, bí mật gia đình. Theo đó, “1. Danh dự, nhân phẩm, uy tín của cá nhân là bất khả xâm phạm và được pháp luật bảo vệ. 2. Cá nhân có quyền yêu cầu Tòa án bác bỏ thông tin làm ảnh hưởng xấu đến danh dự, nhân phẩm, uy tín của mình. Việc bảo vệ danh dự, nhân phẩm, uy tín có thể được thực hiện sau khi cá nhân chết theo yêu cầu của vợ, chồng hoặc con thành niên; trường hợp không có những người này thì theo yêu cầu của cha, mẹ của người đã chết, trừ trường hợp luật liên quan có quy định khác. 3. Thông tin ảnh hưởng xấu đến danh dự, nhân phẩm, uy tín của cá nhân được đăng tải trên phương tiện thông tin đại chúng nào thì phải được gỡ bỏ, cải chính bằng chính phương tiện thông tin đại chúng đó. Nếu thông tin này được cơ quan, tổ chức, cá nhân cất giữ thì phải được hủy bỏ...” và “1. Đời sống riêng tư, bí mật cá nhân, bí mật gia đình là bất khả xâm phạm và được pháp luật bảo vệ. 2. Việc thu thập, lưu giữ, sử dụng, công khai thông tin liên quan đến đời sống riêng tư, bí mật cá nhân phải được người đó đồng ý, việc thu thập, lưu giữ, sử dụng, công khai thông tin liên quan đến bí mật gia đình phải được các thành viên gia đình đồng ý, trừ trường hợp luật có quy định khác. 3. Thư tín, điện thoại, điện tín, cơ sở dữ liệu điện tử và các hình thức trao đổi thông tin riêng tư khác của cá nhân được bảo đảm an toàn và bí mật. Việc bóc mở, kiểm soát, thu giữ thư tín, điện thoại, điện tín, cơ sở dữ liệu điện tử và các hình thức trao đổi thông tin riêng tư khác của người khác chỉ được thực hiện trong trường hợp luật quy định. 4. Các bên trong hợp đồng không được tiết lộ thông tin về đời sống riêng tư, bí mật cá nhân, bí mật gia đình của nhau mà mình đã biết được trong quá trình xác lập, thực hiện hợp đồng, trừ trường hợp có thỏa thuận khác”. 
Ngoài ra, Điều 21 Luật Trẻ em năm 2016 đã có quy định cụ thể về quyền riêng tư của trẻ em: trẻ em có quyền bất khả xâm phạm về đời sống riêng tư, bí mật cá nhân và bí mật gia đình vì lợi ích tốt nhất của trẻ em; trẻ em được pháp luật bảo vệ danh dự, nhân phẩm, uy tín, bí mật thư tín, điện thoại, điện tín và các hình thức trao đổi thông tin riêng tư khác; được bảo vệ và chống lại sự can thiệp trái pháp luật đối với thông tin riêng tư. Bên cạnh đó, Luật An ninh mạng năm 2018 quy định cụ thể vấn đề phòng, chống gián điệp mạng; bảo vệ thông tin thuộc bí mật nhà nước, bí mật công tác, bí mật kinh doanh, bí mật cá nhân, bí mật gia đình và đời sống riêng tư trên không gian mạng12. Trong Luật Giao dịch điện tử năm 2005, khoản 2 Điều 46 về Bảo mật thông tin trong giao dịch điện tử quy định: “Cơ quan, tổ chức, cá nhân không được sử dụng, cung cấp hoặc tiết lộ thông tin về bí mật đời tư hoặc thông tin của cơ quan, tổ chức, cá nhân khác mà mình tiếp cận hoặc kiểm soát được trong giao dịch điện tử nếu không được sự đồng ý của họ, trừ trường hợp pháp luật có quy định khác”. 
Cùng với các quy định trên, Điều 16 Luật An toàn thông tin mạng năm 2015 quy định nguyên tắc bảo vệ thông tin cá nhân trên mạng, theo đó: 1. Cá nhân tự bảo vệ thông tin cá nhân của mình và tuân thủ quy định của pháp luật về cung cấp thông tin cá nhân khi sử dụng dịch vụ trên mạng; 2. Cơ quan, tổ chức, cá nhân xử lý thông tin cá nhân có trách nhiệm bảo đảm an toàn thông tin mạng đối với thông tin do mình xử lý.
Ngoài ra, tại Dự thảo số 02 Luật Bảo vệ quyền lợi người tiêu dùng (sửa đổi) 2023 đã bổ sung các quy định về Chính sách bảo vệ thông tin cá nhân của người tiêu dùng, thông báo khi thu nhập thông tin cá nhân của người tiêu dùng, sử dụng thông tin cá nhân của người tiêu dùng và bảo đảm an toàn, an ninh thông tin cá nhân của người tiêu dùng. Những quy định này là nền tảng quan trọng trong việc tạo hành lang pháp lý cụ thể về trách nhiệm của các chủ thể liên quan trong việc bảo vệ dữ liệu cá nhân của người tiêu dùng trong vòng đời dữ liệu mà tác giả đã phân tích. Với những quy định mới trong Dự thảo số 02, mặc dù chưa quy định chi tiết về trình tự và trách nhiệm pháp lý của các chủ thể liên quan nếu không tuân thủ đầy đủ các quy định nêu trong dự thảo nhưng đã đặt nền tảng quan trọng trong việc hoàn thiện các quy định về bảo vệ quyền riêng tư của cá nhân trong giai đoạn hiện nay.
Qua đó, có thể thấy, pháp luật Việt Nam về bảo vệ quyền riêng tư đã có những sửa đổi, bổ sung, điều chỉnh cho phù hợp với xu hướng phát triển chung của khu vực và thế giới. Tuy nhiên, việc không có quy định cụ thể thế nào là đời sống riêng tư, bí mật cá nhân, bí mật gia đình, thông tin, dữ liệu nhạy cảm dẫn đến việc thực thi các quy định trong việc bảo vệ quyền riêng tư của cá nhân trong bối cảnh hiện nay còn nhiều vướng mắc và không đảm bảo được các quyền và lợi ích của cá nhân trong các hoạt động dân sự nói chung. 
b) Quan điểm về bảo mật gắn với đảm bảo quyền riêng tư
Quyền riêng tư và bảo mật về dữ liệu lớn là một vấn đề quan trọng. Mô hình bảo mật dữ liệu lớn không được đề xuất trong trường hợp có các ứng dụng phức tạp do nó bị vô hiệu hóa theo mặc định. Tuy nhiên, khi không có nó, dữ liệu luôn có thể bị xâm nhập một cách dễ dàng. Quyền riêng tư trong vòng đời dữ liệu là đặc quyền có một số quyền kiểm soát cách thức thu thập và sử dụng dữ liệu của chủ thể dữ liệu ở từng giai đoạn của vòng đời dữ liệu. Quyền riêng tư về thông tin là khả năng của một cá nhân hoặc một nhóm để ngăn thông tin về bản thân bị những người khác ngoài những người mà họ cung cấp thông tin biết đến. Một vấn đề nghiêm trọng về quyền riêng tư của người dùng là việc xác định thông tin cá nhân trong quá trình truyền qua Internet13.
Công cụ bảo mật là thực hành bảo vệ dữ liệu và tài sản thông tin thông qua việc sử dụng công nghệ, quy trình và đào tạo từ truy cập trái phép, tiết lộ, gián đoạn, sửa đổi, kiểm tra, ghi nhận và huỷ bỏ dữ liệu. Đó là những công cụ mang tính hỗ trợ, song hành với việc bảo vệ quyền riêng tư của chủ thể dữ liệu nhưng đó không hoàn toàn riêng biệt trong việc bảo đảm quyền riêng tư. Quyền riêng tư so với bảo mật quyền riêng tư dữ liệu tập trung vào việc sử dụng và quản lý dữ liệu cá nhân, những thứ như thiết lập các chính sách để đảm bảo rằng thông tin cá nhân của chủ thể dữ liệu đang được thu thập, chia sẻ và sử dụng theo những cách thích hợp trên cơ sở các quy định của pháp luật về trách nhiệm của các chủ thể liên quan. Bảo mật tập trung nhiều hơn vào việc bảo vệ dữ liệu khỏi các cuộc tấn công nguy hiểm và việc lạm dụng dữ liệu bị đánh cắp để thu lợi14.


Như vậy, mặc dù bảo mật là yếu tố cơ bản để bảo vệ dữ liệu, nhưng nó không đủ để giải quyết vấn đề quyền riêng tư, nếu không quy định rõ các cơ chế thực thi trong các quy định của pháp luật về trách nhiệm của các chủ thể liên quan trong vòng đời của dữ liệu.
4. Giải pháp
Trong bối cảnh nhận thức về quyền riêng tư cũng như vai trò ngày cảng tăng của vấn đề này, nhiều nghiên cứu đã được tiến hành về các thuật toán khai thác dữ liệu bảo vệ quyền riêng tư. Các bên liên quan thường là: chủ sở hữu dữ liệu, nhà xuất bản dữ liệu và người nhận dữ liệu15. Một nhà xuất bản dữ liệu có thể không đáng tin cậy, trong trường hợp đó, việc thu thập dữ liệu cần được thực hiện ẩn danh. Khi nhà xuất bản dữ liệu được tin cậy, chủ sở hữu dữ liệu sẵn sàng chia sẻ thông tin của họ với nhà xuất bản dữ liệu, nhưng không nhất thiết với bên thứ ba và cần phải ẩn danh dữ liệu. Điều này có thể phức tạp hơn khi nhà xuất bản dữ liệu không phải là một nhà xuất bản theo nghĩa là họ không biết rằng (và bằng cách nào) người nhận dữ liệu có thể khai thác dữ liệu.
Để bảo vệ quyền riêng tư trong vòng đời dữ liệu, việc phân chia có thể được thực hiện thành hai giai đoạn. Trong giai đoạn đầu, mục tiêu là bảo vệ dữ liệu khỏi bị tiết lộ ngoài ý muốn vì dữ liệu được thu thập có thể chứa thông tin nhạy cảm của chủ sở hữu dữ liệu. Trong giai đoạn thứ hai, mục đích là trích xuất dữ liệu có ý nghĩa từ dữ liệu mà không vi phạm quyền riêng tư. Nhưng để đảm bảo việc thực hiện được các giai đoạn này, cần có một khung pháp lý rõ ràng quy định trách nhiệm và nghĩa vụ của các bên liên quan. Do đó, việc hoàn thiện các quy định liên quan về quyền riêng tư trong Bộ luật Dân sự năm 2015, văn bản hướng dẫn Luật An ninh mạng năm 2018, dự thảo số 02 Luật Bảo vệ quyền lợi người tiêu dùng (sửa đổi) năm 2023 sẽ góp phần bảo vệ các vấn đề về quyền riêng tư của cá nhân trong bối cảnh hiện nay.
Ngoài ra, việc xây dựng mô hình quản lý quyền riêng tư để bảo vệ quyền riêng tư trong vòng đời dữ liệu lớn cần được nghiên cứu xây dựng bên cạnh một số phương pháp truyền thống để bảo vệ quyền riêng tư. Những phương pháp này được sử dụng theo cách truyền thống cung cấp khả năng bảo vệ quyền riêng tư ở một mức độ nhất định nhưng điểm yếu của chúng đã dẫn đến sự cần thiết để xây dựng một mô hình quản lý quyền riêng tư mới.
    Mô hình Quản lý quyền riêng tư (PMM)16 là một tập hợp các chức năng cần thiết để quản lý quá trình bảo mật. PMM tạo thành một mô hình lý thuyết để thực hiện sự lựa chọn tự điều khiển đối với quá trình dữ liệu. Quản lý quy trình bảo mật cung cấp sự lựa chọn tự điều khiển ở mức cao nhất. Điều đó có nghĩa, quản lý quyền riêng tư yêu cầu:
- Kiểm soát, với khả năng giám sát quá trình và phản ánh trạng thái của luồng dữ liệu;
- Lập kế hoạch, như khả năng xem xét những vấn đề sẽ xảy ra và đặt mục tiêu (chính sách cá nhân);
- Tổ chức, như cấu trúc các thông số chính của quá trình và truy cập dữ liệu cá nhân để thực hiện các chức năng khác.
Quản lý quyền riêng tư phải là một quá trình, vì chỉ một quá trình mới có thể kiểm soát hiệu quả một quá trình khác. Điều này là do các biện pháp kiểm soát phải được điều chỉnh để tính đến những thay đổi của hoàn cảnh và kế hoạch bên ngoài. Điều này có nghĩa rằng, phải xây dựng một công cụ quản lý chuyên nghiệp để quản lý chính quá trình vận hành của đó, tương tự như cơ chế “kiểm soát và đối trọng”, vừa độc lập trong vận hành nhưng vẫn phải có cơ chế để quản lý và giám sát.
    Như vậy, các chức năng của quản lý quyền riêng tư không chỉ liên quan đến nhau; chúng liên kết với nhau nên chúng dựa vào nhau để quản lý hiệu quả hoạt động. Đó là các chủ thể dữ liệu có thể thiết lập kế hoạch của riêng họ về cách thức thu thập và sử dụng dữ liệu của họ để thể hiện kỳ vọng chủ quan của họ về quyền riêng tư. Chủ thể dữ liệu phải được chủ động và ưu tiên so với các bên còn lại về quyền riêng tư được sử dụng làm cài đặt bảo mật mặc định, nghĩa là chính sách này sẽ ghi đè lên bất kỳ "cài đặt hệ thống" nào do nhà cung cấp dịch vụ cung cấp. Để đạt được các mục tiêu về quyền riêng tư được đưa vào chính sách bảo mật của nhà cung cấp dịch vụ, các chủ thể dữ liệu cần sự ổn định trong các chính sách cài đặt đó, điều này ngày nay phụ thuộc vào tính ổn định của các điều khoản của nhà cung cấp dịch vụ (bao gồm các định nghĩa và tuyên bố cơ bản về điều kiện và điều khoản trong việc sử dụng dữ liệu). Trong PMM, cài đặt quyền riêng tư nên được thiết lập và giám sát từ bên ngoài hệ thống Công nghệ thông tin và truyền thông của các nhà cung cấp dịch vụ. Bằng cách này, các cá nhân có khả năng lấy lại quyền đối với dữ liệu của chính họ, cả trong trường hợp những dữ liệu và hệ thống công nghệ thông tin và truyền thông đang nắm giữ chúng được tổ chức đúng cách trong tất cả các vòng đời dữ liệu lớn.
5. Kết luận
Dữ liệu lớn được phân tích để tìm ra những kiến thức giúp đưa ra các quyết định tốt hơn và các động thái chiến lược để áp đảo các chủ sở hữu dữ liệu trong việc bảo đảm quyền riêng tư của chủ thể dữ liệu. Trong bài viết này, tác giả đã nêu ra những thách thức về quyền riêng tư trong vòng đời dữ liệu lớn bằng cách xác định các yêu cầu về quyền riêng tư và mô hình hoá phương thức bảo vệ quyền riêng tư. Những thách thức về quyền riêng tư trong từng giai đoạn của vòng đời dữ liệu lớn cần được đảm bảo bằng một mô hình mới so với các phương pháp truyền thống.

Th.S Trần Ngọc Tuấn

Khoa luật, Trường Đại học Sài Gòn

Bài viết được đăng trên Tạp chí Pháp luật về quyền con người số 1/2023

*****

Tài liệu trích dẫn
(1) T. Van Gestel and B. Baesens, Credit Risk Management: Basic Concepts: Financial Risk Components, Rating Analysis, Models, Economic and Regulatory Capital (Oxford University Press, 2009); L. C. Thomas, D. Edelman, and J. N. Crook, Credit Scoring and Its Applications (Society for Industrial and Applied Mathematics, 2002).
(2) Kolomvatsos K, Anagnostopoulos C, Hadjiefthymiades, An efficient time optimized scheme for progressive analytics in big data, Big Data Research, 2015;2(4), 155–65.
(3) Analytics in a big data world, John Wiley & Sons, Inc., Hoboken, New Jersey, 20 (2014).
(4) Big data Analytics: A hands-on approach, Arshdeep Bahga & Vijay Madisetti, 11 (2019).
(5) M. Saerens, P. Latinne, and C. Decaestecker, Adjusting the Outputs of a Classifi er to New a Priori Probabilities: A Simple Procedure, Neural Computation 14, no. 1, 21–41 (2002).
(6) What is Big Data (Jun. 20, 2021, 10:25 AM), https://www-01.ibm.com/software/in/data/bigdata/, IBM.
(7) Josh James, Data Never Sleeps 3.0 (Jun. 20, 2021, 11:25 AM), https://www.domo.com/blog/2015/08/data-never-sleeps-3-0/, DOMO.
(8) Priyank Jain, Manasi Gyanchandani and Nilay Khare, Big data privacy: A technological perspective and review, Journal of Big Data, 25 (2016).
(9) Judith H, Alan N, Fern H and Marcia K, Big data for dummies, New Jersey: John Wiley & Sons, Inc, p. 120 (2013).
(10) Qin Y, et al, When things matter: a survey on data-centric internet of things, J Netw Comp Appl, 53 (2016).
(11) Điều 21 Hiến pháp Việt Nam 2013.
(12) Điều 17 Luật An ninh mạng 2018.
(13) Porambage P, et al, The quest for privacy in the internet of things, IEEE Cloud Comp, 3(2):36–45 (2016).
(14) Jing Q, et al, Security of the internet of things: perspectives and challenges, Wirel Netw, 20(8):2481–501 (2014).
(15) Han J, Ishii M, Makino H, A hadoop performance model for multi-rack clusters, In: IEEE 5th International conference on computer science and information technology (CSIT), p. 265–74 (2013).
(16) Đây là phần mở rộng và sửa đổi của mô hình được mô tả trong M. Betkier, “Individual Privacy Management” (2016) 21 Media and Arts Law Review 315, 323. Các thay đổi bao gồm ví dụ: tiêu chí đánh giá, sự thích ứng của việc lập kế hoạch với việc sử dụng bên ngoài và năng động của các chính sách quyền riêng tư, liên kết tốt hơn với nền tảng lý thuyết, các loại dữ liệu mới và sử dụng dữ liệu.