So sánh giữa các AI model
Tổng quan
Báo cáo dưới đây trình bày chi tiết cách Gen AI Effect của Teeinblue cho phép các seller chuyển đổi ảnh của khách hàng thành tác phẩm nghệ thuật theo các phong cách cụ thể. Báo cáo so sánh ba mô hình GPT-image-1 của OpenAI, Flux Kontext Pro và Flux Kontext Max của Black Forest Labs. GPT-image-1 mang lại khả năng sáng tạo và thiết kế phong cách mạnh mẽ nhưng có xu hướng thay đổi nhiều chi tiết gốc hơn, trong khi hai mô hình Flux ưu tiên việc giữ nguyên bố cục và bản sắc chủ thể, chủ yếu khác nhau về giá cả và khả năng tuân thủ Prompt.
So sánh chi tiết
Bạn có thể xem phần so sánh ảnh chi tiết trong file Google Drive này.
Biển đổi phong cách
Prompt demo: Các ví dụ prompt
Transform into an 18th-century Rococo/Baroque royal portrait oil painting: Biến đổi thành bức tranh sơn dầu chân dung hoàng gia theo phong cách Rococo/Baroque thế kỷ 18.
Turn this image into the style of lego movie and also make the background looks like in the movie: Biến hình ảnh này thành phong cách của phim lego và cũng làm cho nền trông giống như trong phim
Create an image in a detailed anime aesthetic: Tạo hình ảnh theo phong cách Anime: Đôi mắt biểu cảm, màu cel-shade mượt mà và đường nét rõ ràng. Nhấn mạnh cảm xúc và sự hiện diện của nhân vật, với cảm giác chuyển động hoặc bầu không khí đặc trưng của các cảnh anime.
GPT-image-1 | Flux Kontext Pro | Flux Kontext Max |
---|---|---|
| | |
| | |
| | |
Hiểu về Prompt
Prompt demo: Các ví dụ prompt
Repaint this image in Studio Ghibli style; preserve the original composition, subject identity, pose, and proportions. No text or logos: Vẽ lại hình ảnh này theo phong cách Studio Ghibli; giữ nguyên bố cục, danh tính chủ thể, tư thế và tỷ lệ ban đầu. Không có chữ hoặc logo.
Repaint the input photo into a monochrome graphite pencil portrait on textured cold-press paper. Preserve the subject’s pose and framing. Fine cross-hatching and soft smudge shading; loose oval scribble vignette that fades to white edges; visible paper grain; crisp facial details (eyes, lips, skin pores). No color, no extra elements, no logo, no text: Tô lại ảnh đầu vào thành ảnh chân dung chì than đơn sắc **trên giấy ép lạnh có họa tiết. Giữ nguyên tư thế và khung hình của chủ thể. Đường gạch chéo tinh tế và đổ bóng mờ mềm mại; đường viền hình oval lỏng lẻo mờ dần thành các cạnh trắng; vân giấy rõ nét; các chi tiết trên khuôn mặt sắc nét (mắt, môi, lỗ chân lông). Không màu, không yếu tố phụ, không logo, không chữ**.
Repaint the provided portrait into a Grand-Theft-Auto-inspired poster: Vẽ lại chân dung được cung cấp thành một tấm áp phích lấy cảm hứng từ Grand-Theft-Auto.
Keep the person’s identity and pose: Giữ nguyên danh tính và tư thế của người
Comic/cel-shaded look, bold black outlines, flat color blocks, soft airbrushed highlights, subtle halftone, high contrast: Giao diện truyện tranh/bóng mờ, đường viền đen đậm, khối màu phẳng, điểm nhấn bằng airbrush mềm mại, tông màu bán sắc tinh tế, độ tương phản cao.
Background: Los Angeles–like skyline with palms and freeway, distant helicopter silhouette and sports car shape, teal–orange gradient sky: Bối cảnh: Đường chân trời giống Los Angeles với những cây cọ và đường cao tốc, hình bóng trực thăng ở xa và hình chiếc xe thể thao, bầu trời chuyển dần sang màu cam xanh ngọc.
Crisp vector-like edges, slight paper texture: Các cạnh sắc nét giống như vector, kết cấu giấy nhẹ.
GPT-image-1 | Flux Kontext Pro | Flux Kontext Max |
---|---|---|
| | |
| | |
| | |
Character Consistency: Tính nhất quán của nhân vật
Prompt demo: Các ví dụ prompt
Turn this image into Disney style and also make the background looks like in the movie: biến hình ảnh này thành phong cách Disney và làm cho nền trông giống như trong phim
Turn this into Simpson style and also make the background looks like in the movie: biến nó thành phong cách Simpson và làm cho nền trông giống như trong phim
Turn this image into a watercolor. Use organic textures on watercolor paper. The result feels like an elegant hand-drawn illustration with a serene, gentle vibe: Biến hình ảnh này thành màu nước. Sử dụng họa tiết hữu cơ trên giấy màu nước. Kết quả trông giống như một bức tranh minh họa vẽ tay thanh lịch với cảm giác thanh bình, nhẹ nhàng.
GPT-image-1 | Flux Kontext Pro | Flux Kontext Max |
---|---|---|
| | |
| | |
| | |
Tốc độ tạo hình ảnh
GPT-image-1 | Flux Kontext Pro | Flux Kontext Max |
---|---|---|
| | |
16 giây (không tính thời gian upload hình ảnh) | 10 giây (không tính thời gian upload hình ảnh) | 12 giây (không tính thời gian upload hình ảnh) |
Kết luận
Tiêu chí | GPT-image-1 | Flux Kontext Pro | Flux Kontext Max |
---|---|---|---|
Giá | $0.042/call (Medium) | $0.04/call | $0.08/call |
Tốc độ (Tốc độ tạo hình ảnh) | ✯✯✯ | ✯✯✯✯✯ | ✯✯✯✯ |
Hiểu câu lệnh | ✯✯✯✯✯ | ✯✯✯ | ✯✯✯✯ |
Biến đổi phong cách | ✯✯✯✯✯ | ✯✯✯✯ | ✯✯✯✯ |
Nhân vật nhất quán | ✯✯✯ | ✯✯✯✯✯ | ✯✯✯✯✯ |
Gợi ý
Lựa chọn nhanh (Medium 1024×1024)
- Tối ưu chi phí (Medium): Flux Kontext Pro
- Yêu cầu phức tạp / nhiều ràng buộc: GPT-image-1 (Medium)
- Tốc độ truyền tải nhanh nhất/tốt nhất: Flux Kontext Pro
- Sát nhất với phong cách của câu lệnh (LEGO/Disney/Ghibli…): GPT-image-1 (Medium)
- Tốt nhất trong việc giữ nguyên chủ thể/khuôn mặt và bố cục trong khi thay đổi phong cách: Flux Kontext Max
- Chỉnh sửa có kiểm soát (thay đổi trang phục/bối cảnh, giữ nguyên danh tính): Flux Kontext Max → Flux Pro
- Rủi ro thấp nhất về việc bổ sung/thay đổi không mong muốn: Flux Pro/Max
- “Sáng tạo nhất (hình ảnh bắt mắt, cách điệu): GPT-image-1 (Medium)
Hưỡng dẫn đưa ra quyết định dựa trên chất lượng hình ảnh:
- Độ chi tiết của style ảnh vs tính chính xác so với ảnh gốc
- Nếu bạn muốn ưu tiên về style ảnh → Flux Kontext Max
- Nếu bạn muốn ưu tiên về độ chính xác so với ảnh gốc → Flux Kontext Max
- Nếu bạn muốn ưu tiên tiết kiệm chi phí, tốc độ, và style ảnh ở mức ổn → Flux Kontext Pro
- Nếu bạn cần chỉnh sửa nhiều bước, lặp lại trên cùng một chủ thể? → Flux Kontext Max ( Bạn nên cân nhắc chọn Kontext Pro nếu bạn cần ưu tiên chi phí/quy mô)
- Nếu bạn cần khối lượng lớn / độ trễ thấp nhất? → Flux Kontext Pro
- Nếu bạn cần hình ảnh có chất lượng cao cho banner/thumbnail phục vụ mục đích marketing? → GPT-image-1 (chỉ chọn Max nếu bạn muốn ưu tiên vào khuôn mặt/chủ thể)
Lời khuyên dựa trên kết quả thực tiễn:
- GPT-image-1 (Medium): ưu tiên style và khả năng sáng tạo cao, nhưng dễ thay đổi chi tiết so với ảnh gốc.
- Flux Kontext Pro/Max: giữ tính chính xác và bốc cục so với ảnh gốc tốt hơn. Bản Max tuân theo prompt tốt hơn bản Pro, và là lựa chọn an toàn, chính xác hơn cho việc generate ra ảnh mới từ ảnh gốc
Cập nhật vào: 27/08/2025
Cảm ơn!