Apple đạt bước tiến lớn trong lĩnh vực AI, sẵn sàng cạnh tranh với Gemini, GPT-4?

Apple đạt bước tiến lớn trong lĩnh vực AI, sẵn sàng cạnh tranh với Gemini, GPT-4?

Nhóm nghiên cứu của Apple đã công bố một bước tiến quan trọng với việc phát triển mô hình ngôn ngữ mới mang tên MM1. Thành tựu này được công bố qua bài báo gần đây với tựa đề "MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training", thể hiện sức mạnh ấn tượng của mô hình trong việc nhận dạng hình ảnh và lập luận ngôn ngữ tự nhiên.
MM1 có ba kích thước khác nhau với số lượng tham số lần lượt là 3 tỷ, 7 tỷ và 30 tỷ. Nhóm nghiên cứu đã tiến hành các thử nghiệm và phân tích để xác định các yếu tố quan trọng ảnh hưởng đến hiệu suất của mô hình.


Kết quả cho thấy, độ phân giải hình ảnh và số lượng nhãn hình ảnh có ảnh hưởng lớn hơn so với các kết nối ngôn ngữ hình ảnh, và việc sử dụng các tập dữ liệu tiền xử lý khác nhau cũng có thể ảnh hưởng đáng kể đến hiệu suất.

Để xây dựng MM1, nhóm nghiên cứu đã áp dụng kiến trúc " Mixture of Experts" và phương pháp "Top-2 Gating". Kết quả là MM1 không chỉ đạt hiệu suất tốt trong các thử nghiệm tiền xử lý mà còn cho thấy hiệu suất mạnh mẽ trên các tiêu chuẩn hiện có, ngay cả sau khi được điều chỉnh cho các nhiệm vụ cụ thể.


MM1-3B-Chat và MM1-7B-Chat đã được thử nghiệm và cho thấy hiệu suất vượt trội so với các đối thủ cùng kích thước. Tuy nhiên, dù MM1 đã đạt được sự công nhận, nhưng hiệu suất tổng thể của mô hình này vẫn chưa vượt qua được các mô hình Gemini của Google hoặc GPT-4V của OpenAI. Dù sao đây vẫn là một bước tiến lớn đối với Apple trong lĩnh vực trí tuệ nhân tạo.

← Bài trước Bài sau →