אינטליגנציה של נתונים גנרטיביים

כוונן עדין את דגם Amazon Titan Image Generator G1 באמצעות התאמה אישית של מודל Amazon Bedrock | שירותי האינטרנט של אמזון

תאריך:

Amazon Titan lmage Generator G1 הוא דגם חדשני של טקסט לתמונה, זמין דרך סלע אמזון, שמסוגל להבין הנחיות המתארות אובייקטים מרובים בהקשרים שונים ולוכדת את הפרטים הרלוונטיים הללו בתמונות שהוא יוצר. הוא זמין באזורי AWS של ארה"ב מזרח (נ' וירג'יניה) ומערב ארה"ב (אורגון) ויכול לבצע משימות עריכת תמונות מתקדמות כגון חיתוך חכם, ציור בתוך הציור ושינויי רקע. עם זאת, המשתמשים רוצים להתאים את המודל למאפיינים ייחודיים במערכים מותאמים אישית שהמודל עדיין לא מיומן עליהם. מערכי נתונים מותאמים אישית יכולים לכלול נתונים קנייניים מאוד התואמים את הנחיות המותג שלך או סגנונות ספציפיים כגון מסע פרסום קודם. כדי לטפל במקרי שימוש אלה וליצור תמונות מותאמות אישית לחלוטין, אתה יכול לכוונן עדין את Amazon Titan Image Generator עם הנתונים שלך באמצעות דגמים מותאמים אישית עבור Amazon Bedrock.

מיצירת תמונות ועד לעריכתן, למודלים של טקסט לתמונה יש יישומים רחבים בתעשיות. הם יכולים לשפר את היצירתיות של העובדים ולספק את היכולת לדמיין אפשרויות חדשות פשוט עם תיאורים טקסטואליים. לדוגמה, הוא יכול לסייע בתכנון ותכנון הרצפה עבור אדריכלים ולאפשר חדשנות מהירה יותר על ידי מתן היכולת לדמיין עיצובים שונים ללא תהליך ידני של יצירתם. באופן דומה, זה יכול לסייע בעיצוב בתעשיות שונות כמו ייצור, עיצוב אופנה בקמעונאות ועיצוב משחקים על ידי ייעול יצירת הגרפיקה והאיורים. מודלים של טקסט לתמונה גם משפרים את חווית הלקוח שלך על ידי מתן אפשרות לפרסום מותאם אישית כמו גם צ'אטבוטים ויזואליים אינטראקטיביים וסוחפים במקרים של שימוש במדיה ובידור.

בפוסט זה, אנו מנחים אותך בתהליך של כוונון עדין של מודל Amazon Titan Image Generator כדי ללמוד שתי קטגוריות חדשות: רון הכלב וסמילה החתולה, חיות המחמד האהובות עלינו. אנו דנים כיצד להכין את הנתונים שלך למשימת כוונון המודל וכיצד ליצור משימת התאמה אישית של מודל באמזון Bedrock. לבסוף, אנו מראים לך כיצד לבדוק ולפרוס את הדגם המכוונן שלך עם תפוקה מסופקת.

רון הכלב סמילה החתולה

הערכת יכולות המודל לפני כוונון עדין של עבודה

מודלים של בסיס מאומנים על כמויות גדולות של נתונים, כך שייתכן שהמודל שלך יעבוד מספיק טוב מחוץ לקופסה. לכן כדאי לבדוק אם אתה באמת צריך לכוונן את הדגם שלך למקרה השימוש שלך או אם הנדסה מהירה מספיקה. בואו ננסה ליצור כמה תמונות של רון הכלב וסמילה החתולה עם הדגם הבסיסי של Amazon Titan Image Generator, כפי שמוצג בצילומי המסך הבאים.

כצפוי, הדגם מחוץ לקופסה עדיין לא מכיר את רון וסמילה, והפלטים שנוצרו מראים כלבים וחתולים שונים. עם קצת הנדסה מהירה, נוכל לספק פרטים נוספים כדי להתקרב למראה של חיות המחמד האהובות עלינו.

למרות שהתמונות שנוצרו דומות יותר לרון וסמילה, אנו רואים שהדגם אינו מסוגל לשחזר את מלוא הדמיון שלהן. בוא נתחיל כעת בעבודת כוונון עדין עם התמונות של רון וסמילה כדי לקבל פלטים עקביים ומותאמים אישית.

כוונון עדין של Amazon Titan Image Generator

Amazon Bedrock מספק לך חוויה ללא שרת לכוונון עדין של דגם Amazon Titan Image Generator שלך. אתה רק צריך להכין את הנתונים שלך ולבחור את ההיפרפרמטרים שלך, ו-AWS יטפל במשימות הכבדות עבורך.

כאשר אתה משתמש במודל Amazon Titan Image Generator כדי לכוונן, עותק של מודל זה נוצר בחשבון הפיתוח של מודל AWS, בבעלות ובניהול של AWS, ונוצרת עבודת התאמה אישית של מודל. לאחר מכן, משרה זו ניגשת לנתוני הכוונון העדין מ-VPC, ומשקלו מעודכן לדגם Amazon Titan. לאחר מכן הדגם החדש נשמר ב-an שירות אחסון פשוט של אמזון (Amazon S3) ממוקם באותו חשבון פיתוח מודל כמו הדגם שהוכשר מראש. כעת ניתן להשתמש בו להסקה רק על ידי חשבונך ואינו משותף עם שום חשבון AWS אחר. בעת הפעלת הסקת מסקנות, אתה ניגש למודל זה באמצעות א חישוב קיבולת מסודר או ישירות, באמצעות מסקנות אצווה עבור Amazon Bedrock. ללא תלות בשיטת ההסקה שנבחרה, הנתונים שלך נשארים בחשבונך ואינם מועתקים לשום חשבון בבעלות AWS או משמש לשיפור מודל Amazon Titan Image Generator.

התרשים הבא ממחיש זרימת עבודה זו.

פרטיות נתונים ואבטחת רשת

הנתונים שלך המשמשים לכוונון עדין, כולל הנחיות, כמו גם הדגמים המותאמים אישית, נשארים פרטיים בחשבון AWS שלך. הם אינם משותפים או משמשים להכשרת מודלים או שיפורי שירות, ואינם משותפים עם ספקי דגמים של צד שלישי. כל הנתונים המשמשים לכוונון עדין מוצפנים במעבר ובמנוחה. הנתונים נשארים באותו אזור שבו מעובדת קריאת ה-API. אתה יכול גם להשתמש AWS PrivateLink כדי ליצור חיבור פרטי בין חשבון AWS שבו הנתונים שלך נמצאים לבין ה-VPC.

הכנת נתונים

לפני שתוכל ליצור עבודת התאמה אישית של מודל, עליך לעשות זאת הכן את מערך ההדרכה שלך. הפורמט של מערך ההדרכה שלך תלוי בסוג עבודת ההתאמה האישית שאתה יוצר (כיוונון עדין או המשך אימון מקדים) ובאופן הנתונים שלך (טקסט לטקסט, טקסט לתמונה או תמונה לתמונה) הטבעה). עבור דגם Amazon Titan Image Generator, אתה צריך לספק את התמונות שבהן אתה רוצה להשתמש עבור כוונון עדין וכיתוב עבור כל תמונה. Amazon Bedrock מצפה שהתמונות שלך יאוחסנו ב-Amazon S3 וצמדי התמונות והכתוביות יסופקו בפורמט JSONL עם שורות JSON מרובות.

כל שורת JSON היא דוגמה המכילה תמונה-ref, S3 URI לתמונה וכיתוב הכולל הנחיה טקסטואלית לתמונה. התמונות שלך חייבות להיות בפורמט JPEG או PNG. הקוד הבא מציג דוגמה לפורמט:

{"image-ref": "s3://bucket/path/to/image001.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image002.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image003.png", "caption": ""}

מכיוון ש"רון" ו"סמילה" הם שמות שיכולים לשמש גם בהקשרים אחרים, כמו שם אדם, אנו מוסיפים את המזהים "רון הכלב" ו"סמילה החתול" בעת יצירת ההנחיה לכוונון עדין של המודל שלנו . למרות שזה לא דרישה עבור כוונון העבודה עדין, מידע נוסף זה מספק בהירות הקשרית יותר עבור המודל כאשר הוא מותאם אישית עבור הכיתות החדשות וימנע את הבלבול של "רון הכלב" עם אדם בשם רון ו" סמילה החתולה" עם העיר סמילה באוקראינה. באמצעות ההיגיון הזה, התמונות הבאות מציגות דוגמה של מערך ההדרכה שלנו.

רון הכלב שוכב על מיטת כלב לבנה רון הכלב יושב על רצפת אריחים רון הכלב שוכב על כיסא בטיחות
סמילה החתולה שוכבת על ספה סמילה החתולה בוהה במצלמה המונחת על ספה סמילה החתולה שוכבת במנשא לחיות מחמד

בעת הפיכת הנתונים שלנו לפורמט המצופה מעבודת ההתאמה האישית, אנו מקבלים את המבנה לדוגמה הבא:

{"image-ref": "/ron_01.jpg", "caption": "רון הכלב שוכב על מיטת כלב לבנה"} {"image-ref": "/ron_02.jpg", "caption": "רון הכלב יושב על רצפת אריחים"} {"image-ref": "/ron_03.jpg", "caption": "רון הכלב שוכב על כיסא בטיחות"} {"image-ref": "/smila_01.jpg", "caption": "סמילה החתול שוכב על ספה"} {"image-ref": "/smila_02.jpg", "caption": "סמילה החתול שיושב ליד החלון ליד חתול פסל"} {"image-ref": "/smila_03.jpg", "caption": "סמילה החתול שוכב על מנשא לחיות מחמד"}

לאחר שיצרנו את קובץ ה-JSONL שלנו, עלינו לאחסן אותו על דלי S3 כדי להתחיל את עבודת ההתאמה האישית שלנו. עבודות כוונון עדין של Amazon Titan Image Generator G1 יעבדו עם 5-10,000 תמונות. עבור הדוגמה שנדונה בפוסט זה, אנו משתמשים ב-60 תמונות: 30 של רון הכלב ו-30 של סמילה החתולה. באופן כללי, מתן זנים נוספים של הסגנון או המעמד שאתה מנסה ללמוד ישפר את הדיוק של הדגם המכוונן שלך. עם זאת, ככל שתשתמש ביותר תמונות לכוונון עדין, כך יידרש יותר זמן להשלמת עבודת הכוונון. מספר התמונות בהן נעשה שימוש משפיע גם על התמחור של העבודה המכווננת. מתייחס תמחור סלע אמזון לקבלת מידע נוסף.

כוונון עדין של Amazon Titan Image Generator

כעת, כשיש לנו את נתוני ההדרכה שלנו מוכנים, אנו יכולים להתחיל בעבודת התאמה אישית חדשה. תהליך זה יכול להיעשות הן באמצעות קונסולת אמזון Bedrock או ממשקי API. כדי להשתמש בקונסולת Amazon Bedrock, בצע את השלבים הבאים:

  1. בקונסולת Amazon Bedrock, בחר דגמים מותאמים אישית בחלונית הניווט.
  2. על התאמה אישית של דגם בתפריט, בחר צור עבודת כוונון עדין.
  3. בעד שם דגם מעודן, הזן שם עבור הדגם החדש שלך.
  4. בעד תצורת עבודה, הזן שם עבור עבודת ההדרכה.
  5. בעד נתוני קלט, הזן את נתיב S3 של נתוני הקלט.
  6. ב היפרפרמטרים סעיף, ספק ערכים עבור הדברים הבאים:
    1. מספר השלבים – מספר הפעמים שהדגם נחשף לכל אצווה.
    2. גודל אצווה – מספר הדגימות שעובדו לפני עדכון פרמטרי המודל.
    3. שיעור למידה – קצב עדכון פרמטרי הדגם לאחר כל אצווה. הבחירה של פרמטרים אלה תלויה במערך נתונים נתון. כהנחיה כללית, אנו ממליצים להתחיל בקביעת גודל האצווה ל-8, קצב הלמידה ל-1e-5, ולהגדיר את מספר השלבים בהתאם למספר התמונות בשימוש, כמפורט בטבלה הבאה.
מספר התמונות שסופקו 8 32 64 1,000 10,000
מספר הצעדים המומלצים 1,000 4,000 8,000 10,000 12,000

אם התוצאות של עבודת הכוונון שלך אינן משביעות רצון, שקול להגדיל את מספר הצעדים אם אינך רואה סימנים כלשהם של הסגנון בתמונות שנוצרו, ולהקטין את מספר הצעדים אם אתה צופה בסגנון בתמונות שנוצרו אך עם חפצים או טשטוש. אם המודל המכוונן לא מצליח ללמוד את הסגנון הייחודי במערך הנתונים שלך אפילו לאחר 40,000 שלבים, שקול להגדיל את גודל האצווה או את קצב הלמידה.

  1. ב נתוני פלט סעיף, הזן את נתיב הפלט S3 שבו מאוחסנים פלטי האימות, כולל אובדן האימות המתועדים מעת לעת ומדדי הדיוק.
  2. ב גישה לשירות סעיף, ליצור חדש AWS זהות וניהול גישה תפקיד (IAM) או בחר תפקיד IAM קיים עם ההרשאות הדרושות כדי לגשת לדלי S3 שלך.

הרשאה זו מאפשרת ל-Amazon Bedrock לאחזר מערכי נתונים של קלט ואימות מהדלי הייעודי שלך ולאחסן פלטי אימות בצורה חלקה בדלי S3 שלך.

  1. לבחור דגם עדין.

עם הגדרת התצורות הנכונות, אמזון Bedrock תאמן כעת את הדגם המותאם אישית שלך.

פרוס את מחולל התמונות של Amazon Titan המכוונן עדין עם תפוקה מסודרת

לאחר יצירת מודל מותאם אישית, תפוקה מסודרת מאפשרת לך להקצות קצב קבוע מראש של קיבולת עיבוד למודל המותאם אישית. הקצאה זו מספקת רמה עקבית של ביצועים וקיבולת לטיפול בעומסי עבודה, מה שמביא לביצועים טובים יותר בעומסי עבודה בייצור. היתרון השני של תפוקה מסודרת הוא בקרת עלויות, מכיוון שתמחור סטנדרטי מבוסס אסימון עם מצב הסקה לפי דרישה יכול להיות קשה לניבוי בהיקפים גדולים.

כאשר הכוונון העדין של הדגם שלך הושלם, דגם זה יופיע ב- דגמים מותאמים אישית' עמוד בקונסולת אמזון היסוד.

כדי לרכוש תפוקה מסודרת, בחר את הדגם המותאם אישית שרק כיוונת ובחר תפוקה מסופקת לרכישה.

פעולה זו מאכלסת מראש את הדגם הנבחר שעבורו ברצונך לרכוש תפוקה מסודרת. לבדיקת המודל המכוונן לפני הפריסה, הגדר את יחידות המודל לערך של 1 והגדר את טווח ההתחייבות ל- ללא התחייבות. זה מאפשר לך במהירות להתחיל לבדוק את הדגמים שלך עם ההנחיות המותאמות אישית שלך ולבדוק אם ההדרכה מספקת. יתרה מכך, כאשר דגמים חדשים מכוונים וגרסאות חדשות זמינות, אתה יכול לעדכן את התפוקה המסופקת כל עוד אתה מעדכן אותו עם גרסאות אחרות של אותו דגם.

כוונון עדין של תוצאות

עבור המשימה שלנו להתאים אישית את המודל על רון הכלב וסמילה החתולה, ניסויים הראו שההיפרפרמטרים הטובים ביותר היו 5,000 צעדים עם גודל אצווה של 8 וקצב למידה של 1e-5.

להלן כמה דוגמאות לתמונות שנוצרו על ידי הדגם המותאם אישית.

רון הכלב לובש שכמיית גיבורי על רון הכלב על הירח רון הכלב בבריכת שחייה עם משקפי שמש
סמילה החתולה על השלג סמילה החתולה בשחור לבן בוהה במצלמה סמילה החתולה חובשת כובע חג המולד

סיכום

בפוסט זה, דנו מתי להשתמש בכוונון עדין במקום להנדס את ההנחיות שלך ליצירת תמונה באיכות טובה יותר. הראינו כיצד לכוונן את דגם Amazon Titan Image Generator ולפרוס את הדגם המותאם אישית על Amazon Bedrock. סיפקנו גם הנחיות כלליות כיצד להכין את הנתונים שלך לכוונון עדין ולהגדיר היפרפרמטרים אופטימליים להתאמה אישית מדויקת יותר של המודל.

כשלב הבא, תוכל להתאים את הדברים הבאים דוגמה למקרה השימוש שלך כדי ליצור תמונות היפר-אישיות באמצעות Amazon Titan Image Generator.


על הכותבים

מאירה לדירה טנקה הוא מדען נתונים בכיר בינה מלאכותית בינה מלאכותית ב-AWS. עם רקע בלמידת מכונה, יש לה למעלה מ-10 שנות ניסיון באדריכלות ובניית יישומי בינה מלאכותית עם לקוחות בכל תעשיות. כמובילה טכנית, היא עוזרת ללקוחות להאיץ את השגת הערך העסקי שלהם באמצעות פתרונות בינה מלאכותית גנרטיבית ב-Amazon Bedrock. בזמנה הפנוי, מאירה נהנית לטייל, לשחק עם החתולה שלה סמילה ולבלות עם משפחתה במקום חמים.

דני מיטשל הוא אדריכל פתרונות AI/ML מומחה בשירותי האינטרנט של אמזון. הוא מתמקד במקרים של שימוש בראייה ממוחשבת ובסיוע ללקוחות ברחבי EMEA להאיץ את מסע ה-ML שלהם.

בהראטי סריניוואסן היא מדענית נתונים ב-AWS Professional Services, שם היא אוהבת לבנות דברים מגניבים על אמזון. היא נלהבת להניע ערך עסקי מיישומי למידת מכונה, עם התמקדות בבינה מלאכותית אחראית. מלבד בניית חוויות AI חדשות ללקוחות, בהראתי אוהבת לכתוב מדע בדיוני ולאתגר את עצמה בספורט סיבולת.

אצ'ין ג'יין הוא מדען יישומי בצוות הבינה הכללית המלאכותית של אמזון (AGI). יש לו מומחיות במודלים של טקסט לתמונה והוא מתמקד בבניית ה- Amazon Titan Image Generator.

ספוט_ימג

המודיעין האחרון

ספוט_ימג

דבר איתנו

שלום שם! איך אני יכול לעזור לך?