Châu Âu đang chuẩn bị cho một bước đột phá quan trọng trong lĩnh vực tìm kiếm web. Open Web Index, dự án chỉ mục web công khai đầy tham vọng, sẽ bắt đầu thử nghiệm vào tháng 6/2025 sau hơn 2 năm nghiên cứu và phát triển. Sáng kiến này ra đời trong bối cảnh người dùng ngày càng bất mãn với chất lượng kết quả tìm kiếm suy giảm của Google và việc tích hợp công nghệ AI tạo sinh gây nhiều tranh cãi.
Khác với Google hay Bing, Open Web Index không phải là một công cụ tìm kiếm mà là một “thư viện số” chứa các tệp và trang web mà các công cụ tìm kiếm có thể truy xuất. Dự án này được phát triển bởi liên minh OpenWebSearch.eu với 14 thành viên, bao gồm các trường đại học, trung tâm dữ liệu, công ty công nghệ và tổ chức CERN danh tiếng.
Tại sao châu Âu cần Open Web Index?
Hiện nay, các nhà cung cấp tìm kiếm lớn đều sử dụng chỉ mục độc quyền, khiến các công cụ tìm kiếm nhỏ hơn phải phụ thuộc vào họ. Theo dự án Open Web, sự tập trung hóa này đã trao cho các công ty như Google quyền kiểm soát không cân xứng đối với web toàn cầu.
Các cơ quan quản lý tại Vương quốc Anh và Liên minh châu Âu đã liên tục đẩy lùi các gã khổng lồ công nghệ Mỹ như Apple và Google, đặc biệt là trong các vấn đề liên quan đến tìm kiếm và trí tuệ nhân tạo. Trong khi đó, người dùng trên toàn thế giới báo cáo sự suy giảm đều đặn về chất lượng tìm kiếm, và các công cụ AI tạo sinh thường gặp khó khăn trong việc cung cấp thông tin chính xác.
Dự án Open Web Index nhằm mục đích thúc đẩy các ứng dụng tuân thủ quy định, giá trị và văn hóa châu Âu. Ví dụ, các công cụ tìm kiếm và mô hình ngôn ngữ lớn (LLM) có trụ sở tại EU sẽ lý thuyết tạo ra kết quả đáng tin cậy hơn trong các ngôn ngữ khác ngoài tiếng Anh. Liên minh cũng đang cân nhắc cẩn thận cách chỉ mục thu thập nội dung web và cách các lượt nhấp chuột ảnh hưởng đến thứ hạng tìm kiếm.
Lộ trình phát triển và cơ hội tham gia
Phiên thử nghiệm đầu tiên của Open Web Index sẽ được ra mắt thông qua cuộc họp Zoom vào ngày 6 tháng 6 năm 2025, từ 10 giờ sáng đến 12 giờ trưa theo giờ CEST. Người tham gia sẽ được tiếp cận với khoảng một petabyte nội dung. Khi hoàn thiện, Open Web Index dự kiến sẽ lưu trữ khoảng năm petabyte, với kế hoạch mở rộng lên 10 petabyte trong các phiên bản tương lai.
Dự án này thuộc khuôn khổ Horizon Europe, với khoản hỗ trợ 950.000 Euro cho 9 đối tác mới trong 9 tháng tới. Điều đáng chú ý là thời điểm ra mắt của Open Web Index trùng khớp với sáng kiến InvestAI của Ủy ban châu Âu, vốn đang huy động 200 tỷ Euro đầu tư vào AI.
Các doanh nghiệp vừa và nhỏ có thể sử dụng Open Web Index để xây dựng các công cụ tìm kiếm, mô hình ngôn ngữ lớn hoặc các ứng dụng khác mà không cần phải bán quảng cáo cho người dùng, hoặc ít nhất là hoạt động độc lập với các gã khổng lồ Mỹ như Google và Bing.
Về mô hình cấp phép, dự án cung cấp giấy phép nghiên cứu chung hoặc giấy phép thương mại theo yêu cầu, tạo điều kiện cho nhiều đối tượng khác nhau tham gia phát triển. Các ứng dụng tiềm năng bao gồm tìm kiếm web theo chiều dọc, tìm kiếm lập luận, ứng dụng LLM bao gồm RAG và nhiều lĩnh vực khác.
Openwebsearch.eu đang kêu gọi người dùng tiên phong tham gia phát triển các dự án sáng tạo và đóng góp phản hồi sớm để cải thiện chất lượng. Đây là cơ hội tuyệt vời cho các nhà nghiên cứu, doanh nghiệp và cá nhân quan tâm đến việc xây dựng một hệ sinh thái tìm kiếm web và AI độc lập tại châu Âu.
Tổng kết: Open Web Index đại diện cho bước đầu tiên hướng tới chủ quyền số thực sự của châu Âu và nền tảng cho hệ sinh thái AI mở châu Âu. Với việc ra mắt thử nghiệm vào tháng 6/2025, dự án này không chỉ nhằm giảm sự phụ thuộc vào các gã khổng lồ công nghệ Mỹ mà còn mở ra cơ hội cho các công cụ tìm kiếm mới, đa dạng và phản ánh tốt hơn các giá trị châu Âu. Trong bối cảnh người dùng ngày càng quan tâm đến quyền riêng tư và chất lượng kết quả tìm kiếm, Open Web Index có thể là một bước ngoặt quan trọng trong cách chúng ta truy cập và tương tác với thông tin trên internet.