Llama 4 là chuỗi mô hình ngôn ngữ nguồn mở quy mô lớn thế hệ mới được Meta AI công bố, có khả năng đa phương thức ngay từ bản phát hành và kiến trúc chuyên gia hỗn hợp, nhằm mang lại giải pháp AI có hiệu suất cao với chi phí tối ưu.
Phiên bản Scout tập trung vào xử lý ngữ cảnh cực dài, hỗ trợ lên tới 10 triệu token, phù hợp phân tích văn bản dài; phiên bản Maverick có tổng tham số lớn hơn, nhiều chuyên gia hơn, khả năng về nhận diện hình ảnh và các tác vụ phức tạp tốt hơn.
Bạn có thể tải trọng số và mã từ trang web chính thức của Meta hoặc kho GitHub mã nguồn mở; cũng hỗ trợ gọi qua các nền tảng đám mây như Google Cloud Vertex AI dưới dạng API.
Có hỗ trợ triển khai tại chỗ; lợi ích gồm bảo mật dữ liệu, khả năng tinh chỉnh tùy biến sâu, tiết kiệm chi phí dịch vụ đám mây về dài hạn và có thể truy cập ngoại tuyến.
Phù hợp để xây dựng trợ lý AI đa phương thức, sinh mã, xử lý và tóm tắt văn bản dài, sáng tác nội dung, hỗ trợ nghiên cứu và các ứng dụng doanh nghiệp đòi hỏi suy luận phức tạp.
Hiện tại API Llama dành cho nhà phát triển tại Mỹ đang được cung cấp xem trước miễn phí với giới hạn; mức giá và thông tin thương mại sẽ được công bố sau trong thông báo chính thức của Meta.

Langfuse AI là một nền tảng mã nguồn mở về kỹ thuật và vận hành LLM, nhằm hỗ trợ các đội ngũ phát triển xây dựng, giám sát, gỡ lỗi và tối ưu các ứng dụng dựa trên mô hình ngôn ngữ lớn. Nền tảng cung cấp các chức năng như theo dõi ứng dụng, quản lý prompts và phiên bản, đánh giá chất lượng và phân tích chi phí để tăng hiệu quả phát triển và khả năng quan sát của ứng dụng AI.
LlamaIndex là một khung AI hàng đầu cho tự động hóa xử lý tài liệu phức tạp bằng các tác nhân và luồng công việc, giúp nhà phát triển và doanh nghiệp tận dụng tối đa dữ liệu riêng để xây dựng các ứng dụng AI thông minh.