ואני אראה לך את של מידג'רני

עמי בן בסט כתב פוסט על ניסוי שערך ובו הוא הראה ל Dall-e (מעתה: דאלי) תמונות שצילם וביקש ממנו (ממנה? מהם?) לתאר את התמונה ואז לייצר תמונה תואמת. אם לא יצא לכם לקרוא אותו, ממליץ לעשות את זה עכשיו ואז לחזור לקרוא את הפוסט הזה.

קישור לפוסט – ואני אראה לך את שלי .

התמונות שנוצרו ע"י דאלי בפוסט של עמי נראו לי כמעט בכל המקרים מצוירות מדי, עגולות מדי, רוויות מדי ובאופן כללי מושלמות מדי. עמי תיאר את זה יפה בתגובה שלו לאחת התמונות – "התמונה (למעלה) נראית לי כתרגיל בשיעור ציור של תלמיד דייקן שמבקש, קודם כל, להשביע את רצון הסביבה."

מאחר וראיתי שבהרבה מקרים דאלי נוטה ליצור תמונות בסגנון הזה, תהיתי לעצמי מה AI כמו מידג'רני היה יוצר באותו מצב. מניסיון עבר ראיתי שמידג'רני, במיוחד גירסה 6 שלו (שלה? שלהם?), נוטה ליצור תמונות שמרגישות לי יותר טבעיות ויחד עם זאת יותר אומנויות דווקא בכך שלא הכל בהן מושלם.

בניגוד לשילוב בין chatgpt ו דאלי, במקרה לי מידג'רני אין לי AI של שיחה שאני יכול לבקש ממנו לתאר לי תמונות קיימות ואז ליצור תמונה תואמת, אז החלטתי לקצר קצת את התהליך. בפוסט של עמי יש לפני כל תמונה את התיאור ש chatgpt נתן לתמונה שעמי העלה אליו. אז לקחתי את התיאור, תרגמתי אותו לאנגלית עם google translate (לא בדקתי את התוצאה… אם אוטומציה אז עד הסוף) ואז התרגום הזנתי למידג'רני בתור פרומפט.

הנה התוצאות:

פרומפט #1

An impressive natural scene of a cave or cavity twisting to create a skylight that displays an image of a blue sky above. The rocks in shades of sand and earth and the appearance of the layers testify to the prolonged geological processes that created this impressive structure. The figure of a man standing inside the cave adds scale to the image and emphasizes the magnificence of the natural form. It is a reminder of the immensity of nature compared to the human presence

התוצאות

דעתי

במקרה הזה היצירה של מידג'רני לא שונה בהרבה מזו של דאלי (מזכיר, קראו את הפוסט של עמי בשביל לראות את היצירה של דאלי כמו גם את תמונת המקור). אם הייתי צריך לבחור אילו מהתמונות נותנת לי את התחושה הכי קרובה לתמונה המקורית הייתי בוחר בתמונה של מידג'רני הימנית עליונה. זו שבה האדם לא נמצא בתוך עיגול האור מה שנותן לפיסת השמיים לעמוד בפני עצמה.


פרומפט #2

A spray plane in action, flying low over a farm field. The dynamism of the plane and the fog it leaves behind highlight the movement and activity. The striking and vivid colors of the plane draw the eye and give it center stage, while the natural background serves as the stage for this scene. The image also conveys the connection between technology and agriculture, and the support that the plane provides for plant growth

התוצאות

דעתי

בניגוד לתמונות הקודמות כאן אפשר לראות הבדל משמעותי בין היצירות של שני ה AI. בתמונות של מידג'רני זוויות הצילום הרבה יותר מעניינות ופחות שבלוניות. תמונות שפחות מזכירות לי תוצאות של מאגרי תמונות למיניהם. מעבר לכך, בעוד אצל דאלי הוצאה נראית כמעט מצוירת, כאן התוצאות מרגישות לי כמו צילומים אמיתיים.


פרומפט #3

A moment of carefree joy, with a person (girl) leaping gracefully on the beach. The movement is frozen in time, the individual's hair and white clothing flow with the movement. The gentle waves of the sea and the soft foam at her feet add a sense of peace and playfulness to the scene. It is a celebration of freedom and the simple pleasures of life, facing the vastness of the ocean. The lighting suggests early morning or late afternoon, a time when the sun casts warm light on the scene, intensifying the feeling of warmth and happiness

התוצאות

דעתי

גם כאן, הבדל משמעותי בין היצירות של מידג'רני לאלו של דאלי. בעוד היצירה של דאלי נראית כמו סצנה שבוימה בצורה מושלמת, החל מהקצף של הגלים, השיער והפוזה של המצולמת ועד לאופן שבו השמלה מתנופפת מאחוריה. במקרה של מידג'רני אני יכול (כמעט) להאמין שהתמונות האלה, לפחות חלקן, צולמו בהחלטה של רגע, בלי יד מכוונת.


פרומפט #4

An urban scene with an old rusty truck stopped near an abandoned building or warehouse. The vehicle and structure look worn and full of character, with signs of time that add to them a unique beauty. The graffiti on the walls adds color and life to the scene, giving a sense of a vibrant and active past. There is also a hint of humor in the graffiti of the character who appears to be driving the truck, creating an interesting contrast between reality and art

התוצאות

דעתי

אני חושב שבמקרה הזה שני (שתי?) ה AI עשו עבודה טובה. עם זאת התמונות של מידג'רני עדיין מרגישות מציאותיות יותר. כאילו הן באמת צולמו ולא צוירו כמענה לדרישה של לקוח. אני לא בטוח אם זו הרוויה המוגזמת בתמונה של דאלי או אולי משהו אחר שאני לא יודע לשים את האצבע עליו, אבל התמונה של דאלי פשוט לא נותנת תחושה "אמיתית".


פרומפט #5

A dragonfly standing delicately on a thin green leaf or stem. The wings of the dragonfly are iridescent, reflecting the light in a way that makes them appear to sparkle in shades of blue and black. Her body is thin and looks almost metallic, suggesting the delicate balance of nature's engineering. This moment captures the intersection of fragility and strength, where the dragonfly's lightness allows her to rest on the flimsiest of stages without being disturbed

התוצאות

דעתי

אני קצת חוזר על עצמי אבל זה רק אומר שמה שמפריע לי בתמונות של דאלי זו בעיה שחוזרת על עצמה וגם כאן, התוצאה של דאלי נראית "מושלמת" מדי, החל מהעלה עליו ניצבת השפירית וכלה בטיפת המים שבדיוק ברגע ה"צילום" יצרה גלים במים שמתחת לעלה.
במקרה הזה גם התוצאות של מידג'רני לא הכי מדהימות אותי, אולי בגלל השימוש העודף ב lens flares (שאין לי מושג מה התרגום של זה לעברית). למרות זאת הן ברמה אחת מעל התמונה של דאלי בגלל ששוב, הן נראות אמיתיות יותר.


סיכום

אני אולי קצת מוטה. מאז ומתמיד אהבתי יותר את היצירות של מידג'רני ואני נוטה להשתמש בו הרבה יותר מאשר בדאלי. אבל אני חושב שזה ברור מהתמונות שהוצגו כאן ובפוסט המקורי שהתמונות שמידג'רני יוצר הן הרבה פחות שבלוניות ושהן נראות יותר מציאותיות.

אם אי פעם ארצה תמונות AI המבוססות על תמונות קיימות שלי, אני כנראה אעלה את התמונות שלי לchatgpt, אבקש ממנו לתאר לי אותן ואז אשתמש בתיאור כפרומפט למידג'רני. אמנם קצת יותר צעדים, אבל נראה לי שזה שווה את זה.

מחשבות של 3 על “ואני אראה לך את של מידג'רני

  1. תודה אורי על ההתייחסות. אהבתי את העבודה שלך.
    לקראת כתיבת הפוסט בדקתי כמה מחוללי תמונות. מידג' היא כנראה הטובה שבהם. אלא השילוב בין הצ'אטג'יפיטי4 ודלאי היה לי הרבה יותר נוח. כך או כך, הפרומפט הוא המלך ואפשר לקבל תוצאות כאלה או אחרות, תלוי בהשקעה. ובשולי הדברים, בתור בלוגר וותיק, אני מקנא באסתטיקה של הבלוג שלך ובהתאמה הנהדרת למובייל..

    1. תודה 🙂 מה שמשחק כרגע לטובת דאלי זה לחלוטין השילוב שלו עם chat gpt.
      אני יכול לראות בעתיד את גוגל נלחמים בזה אבל אני תוהה איך מידג'רני יתמודדו עם זה. כרגע הם מעלים כנראה אתר כדי שיהיה אפשר לייצר תמונות שם במקום רק בדיסקורד אבל זה לא יספיק. אני קצת מקווה שהם ישתפו פעולה עם bard או איך שגוגל לא קוראים עכשיו לAI שלהם.

      באשר לעיצוב של הבלוג, אני נוהג אחת לזמן מה לבנות לו תבנית חדשה. אני לא מעצב (כפי שבטח אפשר להסיק משילובי הצבעים כאן D: ), אבל בכל הקשור לפיתוח תבניות אני די סבבה.
      אם אתה לא מרוצה מהעיצוב של הבלוג שלך, אפשר לשבת איזה סופ"ש אחד ולעשות התאמות ביחד לתבנית הקיימת שלך. או אם תרצה להכין עיצוב שונה לגמרי ולשלוח לי, אני אוכל לבנות תבנית שמבוססת עליו.

      1. הרבה תודה אורי. כרגע אני לא אעשה שינויים ואשאר בתבנית הקיימת. אגב יש לי מבחר גדול של תבניות. אני בתוכנית הביזנס של וודפרס ומשלם להם הרבה כסף..

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *