هوش داده های تولیدی

با استفاده از سفارشی سازی مدل Amazon Bedrock، مدل Amazon Titan Image Generator G1 خود را به خوبی تنظیم کنید خدمات وب آمازون

تاریخ:

آمازون Titan lmage Generator G1 یک مدل متن به تصویر پیشرفته است که از طریق بستر آمازون، که قادر به درک اعلان‌هایی است که چندین شی را در زمینه‌های مختلف توصیف می‌کنند و این جزئیات مرتبط را در تصاویری که تولید می‌کند به تصویر می‌کشد. این در مناطق AWS شرق ایالات متحده (N. Virginia) و غرب ایالات متحده (اورگان) موجود است و می تواند کارهای ویرایش تصویر پیشرفته مانند برش هوشمند، نقاشی درون رنگ و تغییرات پس زمینه را انجام دهد. با این حال، کاربران می‌خواهند مدل را با ویژگی‌های منحصربه‌فرد در مجموعه داده‌های سفارشی تطبیق دهند که مدل قبلاً روی آنها آموزش ندیده است. مجموعه داده های سفارشی می تواند شامل داده های بسیار اختصاصی باشد که با دستورالعمل های برند شما یا سبک های خاص مانند کمپین قبلی سازگار است. برای رسیدگی به این موارد استفاده و تولید تصاویر کاملاً شخصی‌سازی‌شده، می‌توانید با استفاده از داده‌های خود Amazon Titan Image Generator را تنظیم کنید. مدل های سفارشی برای Amazon Bedrock.

از تولید تصاویر گرفته تا ویرایش آنها، مدل‌های متن به تصویر کاربردهای گسترده‌ای در صنایع دارند. آنها می توانند خلاقیت کارکنان را افزایش دهند و توانایی تصور امکانات جدید را به سادگی با توضیحات متنی فراهم کنند. به عنوان مثال، می‌تواند به طراحی و برنامه‌ریزی کف برای معماران کمک کند و با ارائه توانایی تجسم طرح‌های مختلف بدون فرآیند دستی ایجاد آنها، نوآوری سریع‌تری را امکان‌پذیر می‌سازد. به طور مشابه، می تواند به طراحی در صنایع مختلف مانند تولید، طراحی مد در خرده فروشی، و طراحی بازی با ساده سازی تولید گرافیک و تصاویر کمک کند. مدل‌های متن به تصویر همچنین با امکان تبلیغات شخصی‌سازی‌شده و همچنین چت‌بات‌های تعاملی و غوطه‌ورکننده بصری در موارد استفاده رسانه‌ای و سرگرمی، تجربه مشتری شما را افزایش می‌دهند.

در این پست، ما شما را در فرآیند تنظیم دقیق مدل آمازون تایتان تصویر ژنراتور راهنمایی می کنیم تا دو دسته جدید را بیاموزید: ران سگ و گربه اسمیلا، حیوانات خانگی مورد علاقه ما. ما در مورد چگونگی آماده سازی داده های خود برای کار تنظیم دقیق مدل و نحوه ایجاد یک کار سفارشی سازی مدل در Amazon Bedrock بحث می کنیم. در نهایت، ما به شما نشان می‌دهیم که چگونه مدل تنظیم‌شده خود را با آن تست و استقرار دهید توان عملیاتی تامین شده.

رون سگ اسمیلا گربه

ارزیابی قابلیت های مدل قبل از تنظیم دقیق یک کار

مدل‌های پایه بر روی مقادیر زیادی داده آموزش داده می‌شوند، بنابراین ممکن است مدل شما به اندازه کافی خوب کار کند. به همین دلیل است که بررسی کنید که آیا واقعاً نیاز به تنظیم دقیق مدل خود برای مورد استفاده خود دارید یا اینکه مهندسی سریع کافی است، تمرین خوبی است. بیایید سعی کنیم تصاویری از سگ ران و گربه اسمیلا را با مدل پایه آمازون Titan Image Generator تولید کنیم، همانطور که در تصاویر زیر نشان داده شده است.

همانطور که انتظار می رفت، مدل خارج از جعبه هنوز رون و اسمیلا را نمی شناسد و خروجی های تولید شده سگ ها و گربه های مختلف را نشان می دهد. با مهندسی سریع، می‌توانیم جزئیات بیشتری را برای نزدیک‌تر شدن به ظاهر حیوانات خانگی مورد علاقه‌مان ارائه کنیم.

اگرچه تصاویر تولید شده بیشتر شبیه به رون و اسمیلا هستند، اما می بینیم که مدل قادر به بازتولید شباهت کامل آنها نیست. بیایید اکنون یک کار تنظیم دقیق با عکس‌های رون و اسمیلا شروع کنیم تا خروجی‌های شخصی‌سازی شده و ثابتی داشته باشیم.

تنظیم دقیق مولد تصویر آمازون تایتان

Amazon Bedrock یک تجربه بدون سرور برای تنظیم دقیق مدل Amazon Titan Image Generator برای شما فراهم می کند. شما فقط باید داده های خود را آماده کنید و هایپرپارامترهای خود را انتخاب کنید و AWS کارهای سنگین را برای شما انجام خواهد داد.

هنگامی که از مدل Amazon Titan Image Generator برای تنظیم دقیق استفاده می کنید، یک کپی از این مدل در حساب توسعه مدل AWS که متعلق به و مدیریت آن AWS است ایجاد می شود و یک کار سفارشی سازی مدل ایجاد می شود. سپس این کار به داده های تنظیم دقیق از یک VPC دسترسی پیدا می کند و مدل آمازون تایتان وزن های خود را به روز می کند. سپس مدل جدید در یک ذخیره می شود سرویس ذخیره سازی ساده آمازون (Amazon S3) در همان حساب توسعه مدل با مدل از پیش آموزش دیده قرار دارد. اکنون فقط برای استنباط توسط حساب شما قابل استفاده است و با هیچ حساب AWS دیگری به اشتراک گذاشته نمی شود. هنگام اجرای استنتاج، از طریق a به این مدل دسترسی دارید محاسبه ظرفیت تامین شده یا به طور مستقیم، با استفاده از استنتاج دسته ای برای Amazon Bedrock. مستقل از روش استنتاج انتخاب شده، داده‌های شما در حساب شما باقی می‌ماند و در هیچ حساب متعلق به AWS کپی نمی‌شود یا برای بهبود مدل Amazon Titan Image Generator استفاده نمی‌شود.

نمودار زیر این گردش کار را نشان می دهد.

حریم خصوصی داده ها و امنیت شبکه

داده‌های مورد استفاده برای تنظیم دقیق از جمله درخواست‌ها، و همچنین مدل‌های سفارشی، در حساب AWS شما خصوصی می‌مانند. آنها به اشتراک گذاشته نمی شوند یا برای آموزش مدل یا بهبود خدمات استفاده نمی شوند، و با ارائه دهندگان مدل شخص ثالث به اشتراک گذاشته نمی شوند. تمام داده هایی که برای تنظیم دقیق استفاده می شوند در هنگام انتقال و در حالت استراحت رمزگذاری می شوند. داده ها در همان منطقه ای باقی می مانند که تماس API در آن پردازش می شود. همچنین می توانید استفاده کنید AWS PrivateLink برای ایجاد یک اتصال خصوصی بین حساب AWS که داده های شما در آن قرار دارد و VPC.

آماده سازی داده ها

قبل از اینکه بتوانید یک کار سفارشی سازی مدل ایجاد کنید، باید مجموعه داده آموزشی خود را آماده کنید. قالب مجموعه داده های آموزشی شما به نوع کار سفارشی سازی که ایجاد می کنید (تنظیم دقیق یا ادامه پیش آموزش) و روش داده های شما (متن به متن، متن به تصویر، یا تصویر به-) بستگی دارد. جاسازی). برای مدل آمازون تایتان Image Generator، باید تصاویری را که می‌خواهید برای تنظیم دقیق استفاده کنید و برای هر تصویر توضیح دهید. Amazon Bedrock انتظار دارد که تصاویر شما در Amazon S3 ذخیره شوند و جفت تصاویر و زیرنویس ها در قالب JSONL با چندین خط JSON ارائه شوند.

هر خط JSON نمونه ای است شامل یک تصویر-ref، S3 URI برای یک تصویر، و یک عنوان که شامل یک دستور متنی برای تصویر است. تصاویر شما باید با فرمت JPEG یا PNG باشند. کد زیر نمونه ای از قالب را نشان می دهد:

{"image-ref": "s3://bucket/path/to/image001.png"، "caption": ""} {"image-ref": "s3://bucket/path/to/image002.png"، "caption": ""} {"image-ref": "s3://bucket/path/to/image003.png"، "caption": ""}

از آنجایی که «رون» و «اسمیلا» نام‌هایی هستند که می‌توانند در زمینه‌های دیگر نیز استفاده شوند، مانند نام یک شخص، هنگام ایجاد درخواست برای تنظیم دقیق مدل، شناسه‌های «ران سگ» و «اسمیلا گربه» را اضافه می‌کنیم. . اگرچه این یک الزام برای گردش کار دقیق نیست، این اطلاعات اضافی وضوح متنی بیشتری را برای مدل زمانی که برای کلاس‌های جدید سفارشی می‌شود فراهم می‌کند و از اشتباه گرفتن "ران سگ" با شخصی به نام رون و " جلوگیری می‌کند. Smila the cat” با شهر اسمیلا در اوکراین. با استفاده از این منطق، تصاویر زیر نمونه ای از مجموعه داده های آموزشی ما را نشان می دهد.

رون سگی که روی تخت سگ سفید دراز کشیده است ران سگی که روی زمین کاشی نشسته است رون سگی که روی صندلی ماشین دراز کشیده است
اسمیلا گربه ای که روی کاناپه دراز کشیده است اسمیلا گربه ای که به دوربین که روی کاناپه دراز کشیده خیره شده است اسمیلا گربه ای که در یک حمل کننده حیوان خانگی دراز کشیده است

هنگام تبدیل داده های خود به فرمت مورد انتظار توسط کار سفارشی سازی، ساختار نمونه زیر را دریافت می کنیم:

{"image-ref": "/ron_01.jpg"، "caption": "رون، سگی که روی تخت سگ سفید دراز کشیده است"} {"image-ref": "/ron_02.jpg"، "caption": "ران سگی که روی زمین کاشی نشسته است"} {"image-ref": "/ron_03.jpg، "caption": "ران سگ دراز کشیده روی صندلی ماشین"} {"image-ref": "/smila_01.jpg، "caption": "Smila گربه دراز کشیده روی کاناپه"} {"image-ref": "/smila_02.jpg"، "caption": "اسمیلا گربه ای که کنار پنجره کنار یک گربه مجسمه نشسته است"} {"image-ref": "/smila_03.jpg"، "caption": "اسمیلا گربه دراز کشیده روی یک حیوان خانگی"}

پس از اینکه فایل JSONL خود را ایجاد کردیم، باید آن را در یک سطل S3 ذخیره کنیم تا کار سفارشی سازی خود را شروع کنیم. کارهای تنظیم دقیق Amazon Titan Image Generator G1 با 5 تا 10,000 تصویر کار می کنند. برای مثال مورد بحث در این پست، از 60 تصویر استفاده می کنیم: 30 تصویر از رون سگ و 30 تصویر از گربه اسمیلا. به طور کلی، ارائه انواع بیشتری از سبک یا کلاسی که می خواهید یاد بگیرید، دقت مدل تنظیم شده شما را بهبود می بخشد. با این حال، هرچه تعداد تصاویر بیشتری را برای تنظیم دقیق استفاده کنید، زمان بیشتری برای تکمیل کار تنظیم دقیق نیاز است. تعداد تصاویر استفاده شده نیز بر قیمت کار تنظیم شده شما تأثیر می گذارد. رجوع شود به قیمت گذاری سنگ بستر آمازون برای اطلاعات بیشتر.

تنظیم دقیق مولد تصویر آمازون تایتان

اکنون که داده های آموزشی خود را آماده کرده ایم، می توانیم یک کار سفارشی سازی جدید را آغاز کنیم. این فرآیند هم از طریق کنسول بستر آمازون یا API ها قابل انجام است. برای استفاده از کنسول بستر آمازون، مراحل زیر را انجام دهید:

  1. در کنسول بستر آمازون، انتخاب کنید مدل های سفارشی در صفحه ناوبری
  2. بر سفارشی کردن مدل منو ، انتخاب کنید ایجاد کار تنظیم دقیق.
  3. برای نام مدل دقیق تنظیم شده، یک نام برای مدل جدید خود وارد کنید.
  4. برای پیکربندی کار، یک نام برای کار آموزشی وارد کنید.
  5. برای داده های ورودی، مسیر S3 داده های ورودی را وارد کنید.
  6. در فراپارامترها بخش، مقادیر زیر را ارائه دهید:
    1. تعداد مراحل – تعداد دفعاتی که مدل در معرض هر دسته قرار می گیرد.
    2. اندازه دسته - تعداد نمونه های پردازش شده قبل از به روز رسانی پارامترهای مدل.
    3. میزان یادگیری – سرعتی که پارامترهای مدل پس از هر دسته به روز می شوند. انتخاب این پارامترها به یک مجموعه داده معین بستگی دارد. به‌عنوان یک دستورالعمل کلی، توصیه می‌کنیم اندازه دسته را روی 8، نرخ یادگیری را روی 1e-5 قرار دهید و تعداد مراحل را بر اساس تعداد تصاویر استفاده‌شده تنظیم کنید، همانطور که در جدول زیر توضیح داده شده است.
تعداد تصاویر ارائه شده 8 32 64 1,000 10,000
تعداد مراحل توصیه شده 1,000 4,000 8,000 10,000 12,000

اگر نتایج کار تنظیم دقیق شما رضایت بخش نیست، در صورت عدم مشاهده علائم سبک در تصاویر تولید شده، تعداد مراحل را افزایش دهید و اگر سبک را در تصاویر تولید شده مشاهده می کنید، تعداد مراحل را کاهش دهید. با مصنوعات یا تاری. اگر مدل تنظیم شده حتی پس از 40,000 مرحله نتوانست سبک منحصر به فرد را در مجموعه داده شما یاد بگیرد، اندازه دسته یا نرخ یادگیری را افزایش دهید.

  1. در داده های خروجی بخش، مسیر خروجی S3 را وارد کنید، جایی که خروجی‌های اعتبارسنجی، از جمله معیارهای تلفات اعتبارسنجی و دقت ثبت‌شده دوره‌ای، ذخیره می‌شوند.
  2. در دسترسی به خدمات بخش جدید ایجاد کنید هویت AWS و مدیریت دسترسی (IAM) یا نقش IAM موجود را با مجوزهای لازم برای دسترسی به سطل های S3 خود انتخاب کنید.

این مجوز به Amazon Bedrock امکان می‌دهد مجموعه داده‌های ورودی و اعتبارسنجی را از سطل تعیین‌شده شما بازیابی کند و خروجی‌های اعتبارسنجی را به‌طور یکپارچه در سطل S3 شما ذخیره کند.

  1. را انتخاب کنید مدل تنظیم دقیق.

با تنظیم تنظیمات صحیح، Amazon Bedrock اکنون مدل سفارشی شما را آموزش خواهد داد.

مولد تصویر آمازون تایتان تنظیم شده با توان عملیاتی ارائه شده را مستقر کنید

پس از ایجاد مدل سفارشی، عملیات تدارک دیده شده به شما این امکان را می دهد که یک نرخ از پیش تعیین شده و ثابت از ظرفیت پردازش را به مدل سفارشی اختصاص دهید. این تخصیص سطح ثابتی از عملکرد و ظرفیت برای رسیدگی به بارهای کاری را فراهم می کند که منجر به عملکرد بهتر در بارهای کاری تولید می شود. دومین مزیت عملیات تامین شده، کنترل هزینه است، زیرا پیش‌بینی قیمت‌گذاری مبتنی بر توکن استاندارد با حالت استنتاج درخواستی در مقیاس‌های بزرگ دشوار است.

هنگامی که تنظیم دقیق مدل شما کامل شد، این مدل بر روی صفحه ظاهر می شود مدل های سفارشی صفحه در کنسول آمازون بستر.

برای خرید Provisioned Throughput، مدل سفارشی را که به‌خوبی تنظیم کرده‌اید انتخاب کنید و انتخاب کنید خرید بازده تامین شده.

این مدل انتخابی را که می‌خواهید برای آن Throughput ارائه شده خریداری کنید، از قبل پر می‌کند. برای آزمایش مدل تنظیم شده خود قبل از استقرار، واحدهای مدل را روی مقدار 1 تنظیم کنید و مدت تعهد را بر روی بدون تعهد. این به سرعت به شما امکان می دهد مدل های خود را با اعلان های سفارشی خود آزمایش کنید و بررسی کنید که آیا آموزش کافی است یا خیر. علاوه بر این، زمانی که مدل‌های جدید تنظیم‌شده و نسخه‌های جدید در دسترس هستند، می‌توانید تا زمانی که آن را با نسخه‌های دیگر همان مدل به‌روزرسانی کنید، Throughput ارائه شده را به‌روزرسانی کنید.

نتایج تنظیم دقیق

برای وظیفه ما برای سفارشی سازی مدل روی سگ ران و گربه اسمیلا، آزمایش ها نشان داد که بهترین هایپرپارامترها 5,000 مرحله با اندازه دسته ای 8 و نرخ یادگیری 1e-5 بودند.

در زیر چند نمونه از تصاویر تولید شده توسط مدل سفارشی آورده شده است.

ران سگی که شنل ابرقهرمانی پوشیده است رون سگ روی ماه رون سگ در یک استخر شنا با عینک آفتابی
لبخند بزن گربه روی برف اسمیلا گربه سیاه و سفید که به دوربین خیره شده است اسمیلا گربه ای که کلاه کریسمس بر سر دارد

نتیجه

در این پست، در مورد زمان استفاده از تنظیم دقیق به جای مهندسی کردن دستورات خود برای تولید تصویر با کیفیت بهتر بحث کردیم. ما نحوه تنظیم دقیق مدل Amazon Titan Image Generator و استقرار مدل سفارشی را در Amazon Bedrock نشان دادیم. ما همچنین دستورالعمل های کلی در مورد نحوه آماده سازی داده های خود برای تنظیم دقیق و تنظیم فراپارامترهای بهینه برای سفارشی سازی مدل دقیق تر ارائه کردیم.

به عنوان مرحله بعدی، می توانید موارد زیر را تطبیق دهید مثال برای تولید تصاویر فوق شخصی با استفاده از آمازون تایتان Image Generator.


درباره نویسنده

مایرا لادیرا تانکه یک دانشمند ارشد داده های هوش مصنوعی در AWS است. او با سابقه‌ای در یادگیری ماشین، بیش از 10 سال تجربه معماری و ساخت برنامه‌های هوش مصنوعی با مشتریان در سراسر صنایع دارد. او به عنوان یک رهبر فنی، به مشتریان کمک می کند تا از طریق راه حل های هوش مصنوعی مولد در Amazon Bedrock، دستیابی به ارزش تجاری خود را تسریع بخشند. مایرا در اوقات فراغت خود از مسافرت کردن، بازی با گربه اش اسمیلا و گذراندن وقت با خانواده اش در جایی گرم لذت می برد.

دنی میچل یک معمار راه حل های تخصصی AI/ML در خدمات وب آمازون است. او روی موارد استفاده از بینایی رایانه و کمک به مشتریان در سراسر EMEA برای تسریع سفر ML خود متمرکز است.

بهاراتی سرینیواسان دانشمند داده در AWS Professional Services است، جایی که او عاشق ساختن چیزهای جالب در Amazon Bedrock است. او علاقه زیادی به ایجاد ارزش تجاری از برنامه های کاربردی یادگیری ماشین، با تمرکز بر هوش مصنوعی مسئول دارد. بهاراتی خارج از ساختن تجربیات جدید هوش مصنوعی برای مشتریان، عاشق نوشتن داستان های علمی تخیلی و به چالش کشیدن خود با ورزش های استقامتی است.

آچین جین یک دانشمند کاربردی با تیم هوش مصنوعی آمازون (AGI) است. او در مدل‌های تبدیل متن به تصویر تخصص دارد و بر ساخت مولد تصویر آمازون تایتان متمرکز است.

نقطه_img

جدیدترین اطلاعات

نقطه_img

چت با ما

سلام! چگونه می توانم به شما کمک کنم؟