Giới thiệu
Đầu tháng 5, cộng đồng AI xôn xao trước thông tin ra mắt MiniCPM-V 2.0, một mô hình ngôn ngữ lớn (LLM) đa phương thức nhỏ gọn. Được phát triển bởi các nhà nghiên cứu từ Đại học Thanh Hoa và công ty ModelBest, MiniCPM-V 2.0 gây ấn tượng mạnh khi có thể chạy trực tiếp trên các thiết bị di động và máy tính cá nhân mà không yêu cầu cấu hình quá cao, đồng thời hiểu được cả văn bản và hình ảnh.
Có gì mới?
MiniCPM-V 2.0 là phiên bản nâng cấp của MiniCPM-1B, được giới thiệu vào ngày 07/05/2024. Điểm đặc biệt của mô hình này là kích thước cực kỳ nhỏ gọn (chỉ 4GB), cho phép nó hoạt động hiệu quả ngay cả trên những thiết bị có tài nguyên hạn chế như điện thoại thông minh hoặc laptop phổ thông. Đây là một bước tiến lớn, phá vỡ rào cản về phần cứng để AI đa phương thức tiếp cận người dùng rộng rãi hơn.
Tính năng nổi bật
- Kích thước siêu nhỏ: Dung lượng chỉ 4GB, dễ dàng cài đặt và chạy trên thiết bị cá nhân.
- Đa phương thức: Xử lý và hiểu thông tin từ cả văn bản và hình ảnh.
- Hiệu suất cao: Đạt kết quả ấn tượng trên nhiều bài kiểm tra chuẩn (benchmark) về khả năng hiểu hình ảnh và ngôn ngữ, vượt trội so với các mô hình nhỏ cùng loại.
- Tiêu thụ ít tài nguyên: Hoạt động mượt mà trên các thiết bị di động và máy tính có cấu hình khiêm tốn.
- Mã nguồn mở: Cho phép các nhà phát triển và người dùng tùy biến, tích hợp vào các ứng dụng khác.
Ý nghĩa với người Việt
MiniCPM-V 2.0 mang lại lợi ích lớn cho dân văn phòng và chủ shop online tại Việt Nam. Thay vì phải trả phí cho các dịch vụ AI đám mây hoặc mua máy tính cấu hình cao, họ có thể dùng AI ngay trên điện thoại hoặc laptop cá nhân để tóm tắt tài liệu, viết nội dung quảng cáo, phân tích hình ảnh sản phẩm hoặc trả lời khách hàng. Điều này giúp tiết kiệm chi phí và tăng cường hiệu quả công việc hàng ngày.
Đã dùng được ở Việt Nam chưa?
Vì là mô hình mã nguồn mở, MiniCPM-V 2.0 có thể được tải về và cài đặt trực tiếp. Người dùng có kiến thức kỹ thuật cơ bản có thể tự triển khai mà không cần VPN hay thẻ thanh toán quốc tế. Hiện tại, nó hoàn toàn miễn phí để sử dụng cho mục đích cá nhân và nghiên cứu.
So với đối thủ?
So với các mô hình lớn như GPT-4V hay Gemini Pro, MiniCPM-V 2.0 không mạnh bằng về độ phức tạp và khả năng suy luận sâu. Tuy nhiên, nó vượt trội ở khả năng chạy cục bộ trên thiết bị, điều mà các mô hình lớn khó làm được. Khi so sánh với các mô hình nhỏ khác như LLaVA-1.5, MiniCPM-V 2.0 thể hiện hiệu suất tốt hơn đáng kể ở nhiều tác vụ đa phương thức, đặc biệt là với dung lượng nhẹ hơn.
