Tiếp nối bước đầu công bố Foundation Models Framework tại WWDC 2025, Apple vừa chính thức mở quyền truy cập cho lập trình viên bên thứ ba sử dụng các mô hình AI chạy trực tiếp trên thiết bị. Đây là lần đầu tiên hệ sinh thái Apple Intelligence được mở rộng ra ngoài ứng dụng hệ thống, cho phép nhà phát triển tích hợp AI vào ứng dụng của mình mà không cần đến đám mây.
Hiệu năng cạnh tranh, đặc biệt ở các tác vụ hình ảnh và đa ngôn ngữ
Apple cho biết mô hình AI cục bộ (~3 tỷ tham số) của họ đạt hiệu quả rất cao trong thử nghiệm nội bộ. Ở các bài test thị giác máy tính, mô hình này đánh bại InternVL-2.5 và Qwen-2.5-VL-3B, hai đối thủ cùng phân khúc nhẹ, với tỷ lệ vượt trội 46% và 50% trên các tác vụ cụ thể.
Trong xử lý văn bản, Apple cũng đạt kết quả ngang ngửa hoặc vượt qua các mô hình lớn hơn như Gemma-3-4B, đặc biệt ở các ngôn ngữ như Pháp, Bồ Đào Nha và Nhật Bản. Điều này cho thấy khả năng xử lý ngữ cảnh đa ngôn ngữ của Apple đã tiến gần đến nhóm mô hình hàng đầu, dù vẫn tối ưu cho việc chạy cục bộ.
Miễn phí, chạy offline, tích hợp sâu vào logic ứng dụng
Điểm khác biệt then chốt nằm ở việc các mô hình này được thiết kế để hoạt động trực tiếp trên iPhone, iPad và Mac mà không cần gọi API từ server. Điều này giúp ứng dụng nhẹ hơn, không tốn chi phí duy trì API, đồng thời tăng tính riêng tư và tốc độ phản hồi.
Apple cũng tích hợp cơ chế guided generation gốc Swift, cho phép nhà phát triển kiểm soát đầu ra theo logic app. Đây là ưu điểm lớn trong các lĩnh vực như giáo dục, năng suất, chăm sóc sức khỏe, nơi yêu cầu sự nhất quán và kiểm soát chặt đầu ra.
Apple cũng có một mô hình AI server mạnh hơn, nhưng không cấp quyền truy cập cho lập trình viên. Tuy nhiên, mô hình server này vẫn thua GPT-4o ở hiệu năng tổng thể. Dù vậy, Apple không đặt mục tiêu cạnh tranh về sức mạnh tuyệt đối, mà hướng đến tính hiệu quả, độ tin cậy và khả năng triển khai thực tế.
Việc các mô hình cục bộ được phổ cập miễn phí đến lập trình viên có thể tạo ra làn sóng tính năng AI hữu ích trong ứng dụng iOS, iPadOS và macOS – không cần kết nối mạng, không tốn chi phí cloud và đảm bảo dữ liệu người dùng luôn ở lại trên thiết bị.