Thứ Bảy, 30 tháng 3, 2019

Nhận diện hồ sơ số của bạn có đến 3 lớp và bạn chỉ có thể bảo vệ một trong số đó mà thôi!

Tin xấu là với hồ sơ số của bạn, dữ liệu bạn chọn để chia sẻ chỉ là phần nổi của tảng băng. Chúng ta không thấy được toàn bộ phần còn lại bị giấu kín bên dưới giao diện thân thiện của các ứng dụng điện thoại hay dịch vụ trực tuyến.



Dù bạn có thích hay không, nhiều người có xu hướng tin tưởng dãy số 1 và 0 hơn là những gì bạn kể cho họ nghe. Khi điền đơn vay tiền ngân hàng hay đi xin việc, mạng xã hội, lịch sử thẻ tín dụng và địa chỉ bạn sống có thể được xem là bằng chứng đáng tin cậy hơn những lời bạn nói.

Nhưng hồ sơ trực tuyến của bạn không phải luôn được xây dựng thông qua sự thật. Nó được tạo dựng bởi các công ty công nghệ và nhà quảng cáo với các quyết định quan trọng dựa trên dữ liệu: bạn xem những bộ phim nào, bạn đăng tweet vào thời điểm nào trong ngày hoặc mất bao lâu thì bạn nhấn vào xem một video.

Nhiều quyết định ảnh hưởng đến cuộc sống của bạn giờ đây đã được quyết định bởi nội dung dữ liệu thay vì tương tác cá nhân. Tất cả các thể loại nội dung được thiết lập dựa trên dữ liệu của bạn.

Vậy dữ liệu của bạn nói gì về bạn?




Lớp đầu tiên này do bạn kiểm soát. Nó bao gồm dữ liệu bạn đưa lên mạng xã hội và ứng dụng điện thoại. Lớp này bao gồm những gì bạn tiết lộ trong hồ sơ thông tin của mình, những bài đăng công khai và tin nhắn riêng tư, lượt thích, lượt tìm kiếm, những bức ảnh được đăng tải, những bài kiểm tra và khảo sát mà bạn thực hiện, những sự kiện bạn tham gia, những trang web bạn xem và các tương tác khác.

Lớp thứ hai được tạo nên bởi sự quan sát hành vi. Chúng không hẳn là những lựa chọn bạn chủ ý đưa ra mà là những lựa chọn do siêu dữ liệu mang đến. Nó chứa đựng những thứ mà có lẽ bạn không muốn chia sẻ với mọi người, như là vị trí thời gian thực của bạn và thông tin chi tiết những mối quan hệ thân sơ của bạn. Nó cũng theo dõi khi nào bạn online hoặc offline, những nội dung bạn nhấp vào, thời gian để bạn đọc nội dung đó, các mô hình mua sắm, lực gõ phím, tốc độ gõ phím, và chuyển động ngón tay trên màn hình (một số công ty tin rằng điều này tiết lộ cảm xúc và nhiều đặc điểm tâm lý).

Lớp thứ ba bao gồm các diễn giải của lớp thứ nhất và thứ hai. Dữ liệu của bạn được phân tích bằng nhiều thuật toán khác nhau và so sánh với dữ liệu của những người dùng khác về các mối tương quan có nghĩa. Lớp này đưa ra kết luận không chỉ về những gì chúng ta làm mà còn là chúng ta là ai dựa trên hành vi của chúng ta và siêu dữ liệu. Kiểm soát lớp này khó hơn rất nhiều, vì dù bạn có thể kiểm soát đầu vào, bạn không biết được thuật toán ở đầu ra.

Đây là cách hoạt động trong thực tế:




Nhiệm vụ của những thuật toán sắp xếp hồ sơ là dự đoán những thứ bạn không sẵn lòng tiết lộ. Những điều gồm điểm yếu, hồ sơ tâm lý, chỉ số IQ, hoàn cảnh gia đình, bệnh tật, liệu sắp chia tay hay chuẩn bị bắt đầu mối quan hệ mới, nỗi ám ảnh của bạn (như là trò chơi), và những cam kết nghiêm túc (như là những dự án kinh doanh) của bạn.

Những dự đoán và diễn giải hành vi đó rất có giá trị với nhà quảng cáo. Vì quảng cáo là để tạo ra nhu cầu và hướng bạn đến quyết định mà bạn vẫn chưa đưa ra, các nhà tiếp thị sẽ cố khai thác cơ chế tiềm thức và phản ứng tự động của bạn. Vì họ không trông mong rằng bạn sẽ cho họ biết cách làm điều đó, nên họ săn lùng dữ liệu hành vi và sử dụng thuật toán để tìm những mối tương quan có nghĩa trong mớ hỗn loạn này.

Các quyết định ràng buộc được đưa ra bởi ngân hàng, công ty bảo hiểm, người sử dụng lao động, và các nhân viên được thực hiện bởi dữ liệu lớn và các thuật toán chứ không phải con người. Sau tất cả, xem dữ liệu tiết kiệm được nhiều thời gian và tiền bạc hơn so với trò chuyện trực tiếp với con người. Do đó, trong ngành quảng cáo có một niềm tin được chia sẻ rộng rãi rằng dữ liệu không nói dối - rằng thống kê nói lên "sự thật" về con người, hành vi, và động lực của họ.

Thật vậy sao?


Mô phỏng trực tuyến của bạn có thể không giống với bạn trong thực tế - nhưng internet sẽ dựa theo nó mà đối xử với bạn.

Người tham gia thị trường không hề quan tâm đến bạn, họ chỉ quan tâm đến số liệu. Các thuật toán đưa ra quyết định dựa trên thống kê. Nếu chẳng may bạn không phải một cá nhân điển hình, thể hiện đặc điểm khác thường, có khả năng thuật toán sẽ hiểu sai hành vi của bạn. Nó có thể phạm sai lầm liên quan đến công việc, nợ nần hoặc quyền xuất cảnh của bạn. Chừng nào các thống kê vẫn đúng thì không ai quan tâm đến việc sửa đổi phán quyết này. Bạn chỉ là một sự bất thường nho nhỏ.

Nếu kết quả của việc phân tích thuật toán này là sự phân biệt đối xử hoặc không công bằng. Ví dụ, đơn xin vay tiền của bạn bị từ chối vì bạn sống ở "sai" quận, hoặc đơn xin việc của bạn không được thông qua vì mạng lưới xã hội của bạn không đủ mạnh – chẳng có cách nào để sửa được. Tại sao lại vậy? Bạn là một điểm dữ liệu trong hàng tỷ dữ liệu. Tại sao phải đặt ra một ngoại lệ chỉ vì bạn?

Chúng ta có thể đã thấy điều này xảy ra ở Trung Quốc. Như là một phần của hệ thống "chấm điểm xã hội" của họ, mỗi người dân đều được xếp hạng dựa trên tương tác trong công việc và cá nhân, hoạt động trên mạng và xuất hiện công khai. Không trả phí đỗ xe? Tìm kiếm những chủ đề bị cấm trên mạng? Hành động của bạn trong thực tế có ảnh hưởng lâu dài, ví như khả năng mua vé tàu hoặc cho con cái đi học ở trường tốt.

Hệ thống tính điểm ở phương Tây cũng có niềm tin mù quáng vào dữ liệu lớn, phớt lờ đi những trường hợp cá nhân mang tính đặc thù và độc đáo. Chúng ta có thể phản đối trước sự phi lý của việc tính điểm xã hội ở Trung Quốc thế nào cũng được nhưng chúng ta thật sự xa rời chính mình sao?


Chúng ta có thể thực hiện các biện pháp để kiểm soát lớp đầu tiên của hồ sơ trực tuyến của mình. Cho dù thường bốc đồng và tự phát với dữ liệu chúng ta chia sẻ, chúng ta có công cụ để kiểm soát quá trình này. Chúng ta có thể chọn không đăng các cập nhật trạng thái hay thích các trang, không sử dụng các hệ thống nhắn tin thuộc nền tảng truyền thông xã hội. Chúng ta có thể mã hóa thông tin liên lạc của mình bằng cách chọn những ứng dụng nhắn tin nhất định và chặn các lệnh theo dõi bằng các trình đơn giản. Chúng ta thậm chí có thể tắt siêu dữ liệu được lưu trữ trong hình ảnh bằng việc thay đổi cài đặt gốc trên điện thoại và chắc chắn rằng họ không thể xâm nhập vào vị trí của bạn.

Nhưng dù cho cố gắng như vậy, ta vẫn không thể kiểm soát những gì bị quan sát và diễn giải bởi các thuật toán. Lớp thứ hai hoặc ba của hồ sơ sẽ tiếp tục được tạo ra bởi máy móc.

Cách duy nhất để lấy lại hoàn toàn quyền kiểm soát hồ sơ của chúng ta là thuyết phục những người làm lập trình thay đổi cách tiếp cận của họ. Thay vì che dấu dữ liệu này khỏi chúng ta, họ có thể minh bạch hơn. Thay vì lén lút suy đoán địa điểm của chúng ta, các mối quan hệ hoặc tham vọng thầm kín, họ có thể đặt câu hỏi và tôn trọng câu trả lời của chúng ta.

Thay vì thao túng thì hãy trò chuyện. Hãy tưởng tượng rằng thay vì có những dữ liệu trung gian suy đoán chúng ta là ai, bạn có thể nói cho họ biết. Chia sẻ những thông tin thật sẽ giúp trải nghiệm trực tuyến của bạn chính xác hơn.

Nghe có vẻ quá đơn giản hay ngây thơ? Không hẳn vậy. Pháp luật châu Âu vốn đã yêu cầu các công ty tham gia theo dõi và lập hồ sơ để cho minh bạch hơn. Quy định bảo vệ dữ liệu GDPR được đưa ra vào tháng 5 năm 2018 cho phép người dùng ở châu Âu có quyền xác minh dữ liệu của họ, bao gồm các hồ sơ tiếp thị được tạo bởi nhà trung gian dữ liệu, các nền tảng internet hoặc truyền thông trực tuyến. Trong khi các công ty vẫn có thể bảo vệ mã và thuật toán của họ như là bí mật kinh doanh, họ không thể tiếp tục giấu diếm dữ liệu cá nhân họ tạo ra về người dùng.

GDPR và lối tư duy của nó cung cấp cho người dùng một điểm khởi đầu tốt để đàm phán cân bằng quyền lực mới trong ngành công nghiệp sống dựa vào dữ liệu. Nhưng điều làm cho các giao dịch có thể tiếp tục diễn ra trong tương lai là xây dựng niềm tin. Miễn là chúng ta xem các nhà môi giới dữ liệu và tiếp thị là kẻ thù và họ coi chúng ta như một nguồn tài nguyên để khai thác, vậy thì không có chỗ cho việc trò chuyện cởi mở.

Do đó, đã đến lúc người dùng tích cực hơn chứ không còn ở thế bị động nữa. Với GDPR đã có hiệu lực và những công ty có lợi thế cạnh tranh về niềm tin và tính minh bạch, các mô hình tiếp thị và tài chính trực tuyến mới trở thành hiện thực. Các giải pháp có vẻ trái ngược và rủi ro có thể trở thành điều hiển nhiên: Thay vì nói với người dùng họ là ai, hãy cố lắng nghe điều họ nói.