Google vừa chính thức trình làng Nano Banana 2 (tên mã kỹ thuật: Gemini 3.1 Flash Image), một cột mốc mới trong hệ sinh thái Gemini. Đây không chỉ là một bản nâng cấp về độ phân giải, mà là sự thay đổi về cách AI "hiểu" thế giới thực để đưa vào khung hình.
1. Công nghệ Search Grounding: Hình ảnh chính xác đến từng dữ liệu
Điểm yếu lớn nhất của các AI tạo ảnh trước đây là sự "ảo tưởng" (hallucination) khi vẽ các địa danh, sự kiện hoặc vật thể cụ thể. Nano Banana 2 giải quyết triệt để vấn đề này bằng tính năng Grounding với Google Search:
-
Cập nhật thời gian thực: AI có thể tham chiếu dữ liệu và hình ảnh mới nhất trên Internet để vẽ lại một sự kiện đang diễn ra hoặc một sản phẩm vừa ra mắt.
-
Độ chính xác cao: Các biểu đồ, sơ đồ (infographics) và văn bản trong ảnh giờ đây không còn là những ký tự vô nghĩa mà mang thông tin chuẩn xác, hỗ trợ tốt cho công việc chuyên môn.
2. Sức mạnh của kiến trúc Gemini 3.1 Flash
Đúng như tên gọi "Flash", mô hình này ưu tiên tốc độ nhưng không đánh đổi chất lượng:
-
Tốc độ "chớp nhoáng": Khả năng tạo và chỉnh sửa ảnh gần như tức thì, giúp quy trình làm việc (workflow) của các nhà sáng tạo nội dung không bị ngắt quãng.
-
Độ phân giải 4K: Hỗ trợ xuất hình ảnh chất lượng cao lên đến 4K, phù hợp cho cả mục đích in ấn và quảng cáo chuyên nghiệp.
-
Nhất quán nhân vật (Consistency): Nano Banana 2 cho phép duy trì ngoại hình của tối đa 5 nhân vật qua nhiều lần tạo ảnh khác nhau, một tính năng cực kỳ đắt giá cho những người làm truyện tranh hoặc storyboard.
3. Khả năng chỉnh sửa bằng ngôn ngữ tự nhiên
Không cần các công cụ chọn vùng phức tạp, người dùng chỉ cần trò chuyện với Gemini để thay đổi chi tiết ảnh. Ví dụ: "Hãy đổi chiếc áo phông đỏ thành áo sơ mi xanh và thêm hiệu ứng nắng chiều". AI sẽ hiểu ngữ cảnh và thực hiện thay đổi một cách tự nhiên nhờ khả năng suy luận (reasoning) của dòng Gemini 3.
4. Hệ sinh thái và tính khả dụng
Nano Banana 2 hiện đã bắt đầu được triển khai rộng rãi trên:
-
Ứng dụng Gemini: Thay thế cho phiên bản cũ để mang lại trải nghiệm nhanh và thông minh hơn.
-
Google Search & Lens: Hỗ trợ tạo ảnh trực tiếp khi đang tìm kiếm thông tin.
-
Google AI Studio & Vertex AI: Dành cho các lập trình viên tích hợp vào ứng dụng riêng với chi phí tối ưu hơn 30-50% so với dòng Pro.
Nguồn tin tham khảo: Google AI Studio Release Notes (Feb 26, 2026)