Tạo ảnh “pro” hơn cùng Nano Banana 🍌

Hello cả nhà!

Với sự phát triển của AI, rất nhiều tác vụ hàng ngày của chúng ta không còn được thực hiện một cách thủ công nữa. Thay vào đó, bằng cách tận dụng tiềm lực của AI, chúng ta có thể tạo được những sản phẩm chất lượng cao mà lại tốn ít công nữa. Một trong những sản phẩm đó chính là hình ảnh. Bài viết này nhằm chia sẻ một số mẹo vặt và kiến thức mà mình đã thu thập được trong quá trình sử dụng Gemini 3 Nano Banana 🍌 để tạo và chỉnh sửa ảnh nhé!

Nano Banana là gì? Một số thông tin về Nano Banana

Nano Banana  (một cái tên rất meme) là công cụ tạo hình ảnh tiên tiến nhất của Google, được release vào 26/08/2025. Nano Banana Pro, là phiên bản upgrade, được release song song cùng model Gemini 3 vào 20/11/2025 vừa qua.

Nano Banana có thể tạo ảnh với độ phân giải 4K. Ngoài ra, người dùng có thể upload đến 14 ảnh sample để Nano Banana tham khảo và dựa vào những bức ảnh đó để đưa ra suy luận, cũng như tạo được bức ảnh kết quả gần với mong muốn nhất. Nano Banana tự động sử dụng “Thinking” khi xử lý các prompt dựng ảnh, vì vậy prompt được phân tích kỹ hơn, được tối ưu hóa nên ảnh có chất lượng cao hơn.

Mọi người có thể dễ dàng sử dụng Nano Banana bằng cách chọn Create images trong mục Tools của Google Gemini, sau đó nhập prompt để Nano Banana tạo ảnh.  

Tips khi sử dụng Nano Banana

Khi prompt Nano Banana, bạn bị giới hạn chỉ được viết trong khoảng 480 tokens (có thể tham khảo tool https://dejan.ai/tools/gemini-tokenizer/ để kiểm tra xem prompt của mình đang dùng hết bao nhiêu token) Số lượng token này ít hơn rất nhiều so với các model dùng để trả lời câu hỏi hay viết code. Điều này là do Nano Banana xử lý toàn bộ prompt cùng lúc thay vì đọc và phân tích từng câu như chatbot. Model tập trung và bám sát vào từng chi tiết trong câu để dựng ảnh, nên nếu prompt dài quá sẽ khiến Nano Banana bị quên, không biết nên tập trung vào chủ thể nào hay sắp xếp bố cục ảnh như thế nào cho phù hợp. Ngoài ra, prompt dài quá cũng khiến thời gian xử lý tăng lên, việc tạo một bức ảnh có thể lên tới hàng phút. Vì vậy, để sử dụng Nano Banana hiệu quả, chúng ta cần tập trung vào 2 quy tắc vàng: tối đa hiệu suất token và viết prompt tốt.

Tối đa hiệu suất token

Với 480 tokens, chúng ta nên sử dụng ngôn ngữ là tiếng Anh để viết prompt. Bạn có thể viết được một đoạn miêu tả khoảng 300- 350 từ với tiếng Anh, còn nếu dùng tiếng Việt hay tiếng Nhật thì bạn chỉ có thể viết được khoảng 150-200 từ thôi. Điều này là do model được huấn luyện bằng ngôn ngữ tiếng Anh là chủ yếu, nên token sử dụng cho tiếng Anh sẽ có hiệu suất cao hơn hẳn so với các ngôn ngữ khác. Ngoài ra, Nano Banana hiểu tiếng Anh tốt nhất, nên prompt bằng tiếng Anh sẽ giúp bạn miêu tả ảnh cần tạo chi tiết hơn và ảnh được tạo ra có độ chính xác cao hơn.

Viết prompt tốt

Prompt tốt sẽ giúp Nano Banana dựng được hình ảnh chất lượng cao và gần với hình ảnh mà bạn mong muốn nhất. Sau đây là một số tips nhỏ mà mọi người có thể tham khảo để viết prompt.

  • Prompt rõ ràng và mang tính miêu tả 

Một prompt cơ bản cần phải có 3 điểm sau: chủ thể của hình ảnh, bối cảnh, và thể loại hình ảnh mà bạn mong muốn. Chủ thể của hình ảnh là chủ đề chính của bức ảnh và sẽ nằm ở trung tâm, bối cảnh sẽ quyết định màu sắc và phông nền đằng sau của chủ thể đó, còn thể loại hình ảnh (ảnh chụp, tranh màu nước, tranh vẽ tay, hoạt hình vv.) sẽ giúp Nano Banana tạo hình ảnh theo đúng nhu cầu của bạn.  

Ví dụ như mình muốn hình ảnh hoạt hình của 101 Chú Chó Đốm dùng cho thiệp Giáng Sinh.

Ví dụ xấu: An image of a bunch of puppies

Prompt không ghi rõ chủ thể là gì, các chú cún thuộc giống nào, đang làm gì, trong bối cảnh nào, phong cách ảnh như thế nào vv. nên Nano Banana sẽ tự suy luận và đưa ra hình ảnh mang tính chung chung.

Ví dụ tốt: A large, joyful group of Dalmatian puppies celebrating Christmas together, piled playfully in a classic mid-20th-century hand-drawn cartoon style. Background shows a stylized Christmas living room with a glowing fireplace, decorated tree, stockings, and softly falling snow outside the window.

✨Tip: có thể sử dụng chính Gemini để tối ưu hóa và tinh chỉnh câu lệnh cho phù hợp 😀

  • Ghi rõ các từ khóa về chất lượng hình ảnh và tỉ lệ khung hình

Nếu bạn cho thêm các từ khóa về chất lượng cao trong prompt, Nano Banana sẽ điều chỉnh và tạo ra hình ảnh sắc nét hơn với độ tương phản cao, phù hợp với nhu cầu. Các từ khóa này bao gồm nhưng không giới hạn: high quality, 4K, studio lighting, HDR, professional photography etc. 

Ngoài ra, bạn cũng có thể thêm các thông tin về tỉ lệ khung hình.

  • Khung hình vuông: tỉ lệ là 1:1. Phù hợp cho ảnh post lên mạng xã hội, ảnh chụp sản phẩm, etc.
  • Màn hình cũ: 
    • Tỉ lệ 4:3. Phù hợp cho ảnh tạo cảm giác TV kiểu cũ, vintage, retro feel.
  • Màn hình rộng:
    • Tỉ lệ 16:9: Áp dụng cho hầu hết các TV và màn hình ngang hiện đại. Phù hợp thiết kế banner, màn hình LED, backdrop etc.  
    • Tỉ lệ 9:16: Áp dụng cho màn hình dọc, như smartphone hay reels.
  • Viết prompt tạo hình ảnh chân thực

Một sự thật không thể tránh khỏi là ảnh được tạo bởi AI, đặc biệt là với những bức ảnh có chủ thể là con người, thường sẽ có cảm giác “giả”. Điều này là do ảnh AI tạo thường có tính đối xứng cao, ánh sáng rất chuẩn chỉnh, chủ ý bức ảnh cũng được thể hiện quá rõ ràng, độ nét quá cao, etc. Nói cách khác, ảnh do AI tạo quá đẹp, quá hoàn hảo nên chúng trở nên phi thực. Điều này cũng có nghĩa là, để tạo tính chân thực cho bức ảnh, chúng ta cần phải thêm một số từ khóa để cố ý “làm xấu” bức ảnh đi. Dưới đây là một số từ khóa phổ biến, và ví dụ khi đưa vào áp dụng của chúng. (spoiler alert: không phải cứ thêm “realistic” là được 😂 )

  • Ánh sáng: Các bức ảnh thực tế rất ít khi được chụp trong điều kiện chiếu sáng tối ưu, vì vậy, việc khiến ánh sáng của bức ảnh có phần thiếu hoàn hảo sẽ khiến nó trở nên thật hơn. Với các từ khóa cụ thể về ánh sáng như: soft natural light, golden hours, practical lighting, slight motion blur, subtle noise, etc., bạn sẽ có những bức ảnh thật hơn. 
  • Ngoại hình: Một điều khá thú vị là người do AI tạo thường sẽ xinh đẹp hơn ảnh người thật. Điều này chủ yếu đến từ 2 nguyên nhân: hình do AI tạo có tính đối xứng cao, và da của các nhân vật trong ảnh thường sẽ rất mịn và không có khuyết điểm. Vì vậy, để ảnh tạo bởi AI nhìn giống người hơn, chúng ta phải sử dụng các từ khóa với chủ ý làm cho mẫu “xấu” đi. Các từ khóa phổ biến bao gồm: natural skin texture, with blemishes, asymmetrical pose, candid, slightly uneven smile, pores visible, etc. 

Ví dụ: Pretty instagram influencer (nhìn hoàn hảo quá, dễ gây nghi ngờ)

  Ví dụ: Pretty instagram influencer with asymmetrical smile, natural skin texture (nhìn giống người thật hơn hẳn)

  • Bối cảnh

Bối cảnh đằng sau các bức ảnh mà AI tạo thường có có tính ổn định và ngăn nắp. Bằng cách thêm các chi tiết cụ thể, hoặc làm lộn xộn chúng, bạn sẽ có những bức ảnh giống với ảnh thật hơn. Các từ khóa gợi ý bao gồm: slightly messy, natural context, lived-in environment, etc.

Ví dụ: Office lady buying coffee (nhìn giống ảnh stock)

Ví dụ Office lady buying coffee in a slightly messy environment (có thêm ngay mấy anh hippie, nhìn thật hơn 🙂)

Hy vọng những tips mình vừa chia sẻ sẽ giúp mọi người có được những bức ảnh đẹp hơn nhé! Happy prompting! ❤️‍🔥

Add a Comment

Scroll Up