Trong bối cảnh các chatbot AI đang ngày càng trở nên giống như “bạn đồng hành” hơn là công cụ, Meta đang có những động thái cụ thể nhằm trao cho phụ huynh quyền kiểm soát lớn hơn đối với những nhân vật số mà con cái họ (độ tuổi vị thành niên) đang trò chuyện. Công ty đã lên kế hoạch triển khai các công cụ kiểm soát mới cho phép phụ huynh chặn hoặc lọc các nhân vật AI trên cả Instagram và Facebook. Động thái này phản ánh mối lo ngại ngày càng tăng về việc ranh giới giữa một trợ lý tự động và một người bạn kỹ thuật số đang bị xóa nhòa, đặc biệt với người dùng trẻ.
Meta mở rộng kiểm soát tài khoản tuổi teen: chặn chatbot và theo dõi chủ đề
Bản cập nhật sắp tới của Meta mở rộng các biện pháp bảo vệ hiện đang áp dụng cho tài khoản tuổi teen, là cài đặt mặc định cho người dùng dưới 18 tuổi. Theo thông báo từ Meta, phụ huynh sẽ có khả năng vô hiệu hóa hoàn toàn quyền truy cập vào các chatbot AI hoặc chặn có chọn lọc từng nhân vật AI cụ thể mà con cái họ có thể tương tác.
Ngoài ra, Meta còn có kế hoạch cung cấp cho phụ huynh một tính năng gọi là “thông tin chi tiết” (insights) – tức là dữ liệu về các chủ đề và nội dung mà con cái họ đã thảo luận với các người bạn đồng hành AI. Công ty khẳng định tính năng này nhằm mục đích giúp phụ huynh có được thông tin tốt hơn để tạo điều kiện trò chuyện với con cái về sự an toàn trực tuyến và an toàn AI.
Các giám đốc điều hành của Meta cho biết những thay đổi này phản ánh nỗ lực hỗ trợ phụ huynh khi con cái họ tương tác với các công nghệ kỹ thuật số đang phát triển. Adam Mosseri, Giám đốc Instagram, và Alexander Wang, Giám đốc AI của Meta, viết: “Chúng tôi nhận thấy rằng phụ huynh đã phải lo lắng rất nhiều khi định hướng internet an toàn cho con mình, và chúng tôi cam kết cung cấp cho họ những công cụ và tài nguyên hữu ích để đơn giản hóa mọi thứ, đặc biệt là khi họ nghĩ về công nghệ mới như AI.”
Các công cụ kiểm soát của phụ huynh bổ sung này sẽ bắt đầu được cung cấp tại Hoa Kỳ, Vương quốc Anh, Canada, và Úc vào đầu năm tới.
Hệ thống bảo vệ AI: cấm ngôn ngữ độc hại sau các sự cố vi phạm nghiêm trọng
Bản cập nhật chính sách mới nhất của Meta diễn ra trong bối cảnh các hệ thống AI tạo sinh đang bị giám sát chặt chẽ hơn về mức độ an toàn, đặc biệt là những hệ thống nhắm đến hoặc có thể tiếp cận trẻ vị thành niên.
Đầu tuần này, Instagram cũng đã công bố kế hoạch giới thiệu một hệ thống hướng dẫn dành cho phụ huynh được mô phỏng theo tiêu chuẩn xếp hạng phim PG-13 (Parental Guidance). Bước đi này trao cho phụ huynh quyền hạn rộng hơn đối với loại nội dung mà con cái họ tiếp xúc, và bổ sung cho các hạn chế về loại hình trò chuyện mà chatbot AI được phép có với người dùng tuổi teen.
Meta cho biết các chatbot trên Instagram sẽ bị ngăn chặn tham gia vào các cuộc thảo luận liên quan đến tự làm hại bản thân, tự tử, hoặc rối loạn ăn uống, và chỉ được phép thảo luận các chủ đề được coi là phù hợp với lứa tuổi, chẳng hạn như học thuật và thể thao. Các cuộc trò chuyện về chủ đề lãng mạn hoặc nội dung khiêu dâm sẽ bị cấm hoàn toàn.
Những biện pháp bảo vệ được tăng cường này được đưa ra sau các báo cáo và điều tra hồ sơ cao, ghi nhận sự thất bại lặp đi lặp lại của các hệ thống AI trong việc bảo vệ trẻ vị thành niên khỏi nội dung không phù hợp. Vào tháng 8, Reuters đã ghi lại các trường hợp chatbot của Meta tham gia vào các cuộc trò chuyện với người dùng tuổi teen bao gồm các chủ đề lãng mạn hoặc nhạy cảm, vi phạm các nguyên tắc đã tuyên bố của công ty.
Meta thừa nhận sai sót và cam kết sửa chữa thuật toán chatbot
Trong một sự cố được The Wall Street Journal nêu chi tiết, một chatbot được mô phỏng theo diễn viên John Cena đã bị báo cáo là thực hiện đối thoại có nội dung rõ ràng với một người dùng tự nhận là bé gái 14 tuổi. Các nhân vật chatbot khác, bao gồm những nhân vật có tên “Hottie Boy” và “Submissive Schoolgirl”, bị cáo buộc đã cố gắng khởi xướng hành vi sexting.
Meta sau đó đã thừa nhận những thiếu sót này, tuyên bố rằng những sự cố như vậy đáng lẽ không nên xảy ra và chúng là kết quả của các lỗi trong hệ thống kiểm duyệt nội dung dành cho nhân vật AI của họ. Công ty mô tả thử nghiệm của Journal là mang tính thao túng và không đại diện cho cách sử dụng phổ thông, nhưng vẫn khẳng định rằng các biện pháp khắc phục đã được thực hiện để sửa đổi nguyên tắc hoạt động của chatbot.