Trong thời gian qua, một nhóm gồm 260 nhân viên hợp đồng tại thành phố Hyderabad, Ấn Độ đã cày xới hàng triệu bức ảnh, cập nhật trạng thái và các nội dung khác được đăng trên Facebook từ năm 2014.
Các nhân viên này phân loại các nội dung theo năm "khía cạnh."
Chúng bao gồm nội dung của bài đăng (ví dụ như ảnh tự chụp hoặc ảnh thực phẩm); dịp này (là sinh nhật hay đám cưới); và ý định của tác giả (họ đang làm một trò đùa, cố gắng truyền cảm hứng cho người khác hoặc tổ chức một bữa tiệc).
Theo Facebook, công việc này nhằm mục đích tìm hiểu cách thức các loại nội dung mà người dùng đăng trên các dịch vụ của mạng xã hội này đang thay đổi ra sao. Điều đó có thể giúp công ty phát triển các tính năng mới, có khả năng tăng mức sử dụng và doanh thu quảng cáo.
Chi tiết về nỗ lực này được nhiều nhân viên giấu tên tại công ty gia công Wipro Ltd cung cấp cho hãng tin Reuters.
Công việc của Wipro nằm trong số khoảng 200 dự án dán nhãn nội dung mà Facebook triển khai với hàng ngàn người tham gia trên toàn cầu, nhằm mục đích đào tạo năng lực cho các hệ thống trí tuệ nhân tạo (AI).
Giống như nhiều công ty công nghệ, Facebook sử dụng máy học và AI để sắp xếp nội dung trên nền tảng của mình. Nhưng để làm được điều này, phần mềm cần được đào tạo để xác định các loại nội dung khác nhau. Để huấn luyện các thuật toán này, chúng phải phân tích dữ liệu mẫu, tất cả chúng cần được phân loại và dán nhãn bởi con người - một quá trình được gọi là 'chú thích dữ liệu.'
Nhân viên tại WiPro phải sắp xếp một loạt nội dung từ Facebook và Instagram, bao gồm cập nhật trạng thái, video, ảnh, liên kết được chia sẻ và Câu chuyện (Stories). Mỗi phần nội dung được kiểm tra bởi hai nhân viên về độ xác thực và mỗi nhân viên chú thích khoảng 700 mục mỗi ngày.
Facebook xác nhận với Reuters rằng các nội dung trên mạng xã hội này đang được các nhân viên của WiPro kiểm tra bao gồm các bài đăng riêng tư được chia sẻ cho một số bạn bè được chọn và những dữ liệu đôi khi bao gồm tên người dùng và thông tin nhạy cảm khác.
Việc Facebook thừa nhận để nhân viên của công ty đối tác tiếp cận những nội dung cá nhân, nhạy cảm có thể tạo ra một làn sóng chỉ trích mới nhằm vào mạng xã hội này.
Tuy nhiên, Facebook cho biết các nhóm pháp lý và quyền riêng tư của họ chấp thuận tất cả các nỗ lực ghi nhãn dữ liệu và công ty này nói với Reuters rằng gần đây họ đã giới thiệu một hệ thống kiểm toán để đảm bảo rằng quyền riêng tư đang được tuân thủ./.