Generatiivinen tiedustelu

Hienosäädä Amazon Titan Image Generator G1 -mallisi käyttämällä Amazon Bedrock -mallin mukauttamista | Amazon Web Services

Treffi:

Amazon Titan lmage Generator G1 on huippuluokan tekstistä kuvaksi -malli, joka on saatavilla osoitteessa Amazonin kallioperä, joka pystyy ymmärtämään kehotteita, jotka kuvaavat useita objekteja eri yhteyksissä, ja tallentaa nämä olennaiset yksityiskohdat luomiinsa kuviin. Se on saatavilla US East (N. Virginia) ja US West (Oregon) AWS-alueilla ja voi suorittaa edistyneitä kuvankäsittelytehtäviä, kuten älykästä rajausta, maalausta ja taustamuutoksia. Käyttäjät haluavat kuitenkin mukauttaa mallin mukautettujen tietojoukkojen ainutlaatuisiin ominaisuuksiin, joihin mallia ei ole vielä koulutettu. Muokatut tietojoukot voivat sisältää erittäin omaa dataa, joka on yhdenmukainen brändisi ohjeiden tai tiettyjen tyylien, kuten edellisen kampanjan, kanssa. Voit käsitellä näitä käyttötapauksia ja luoda täysin yksilöllisiä kuvia hienosäätämällä Amazon Titan Image Generatoria omilla tiedoillasi käyttämällä mukautettuja malleja Amazon Bedrockille.

Tekstistä kuvaksi -malleilla on laajoja sovelluksia eri toimialoilla aina kuvien luomisesta niiden muokkaamiseen. Ne voivat parantaa työntekijöiden luovuutta ja antaa mahdollisuuden kuvitella uusia mahdollisuuksia yksinkertaisesti tekstin avulla. Se voi esimerkiksi auttaa arkkitehtien suunnittelussa ja lattiasuunnittelussa ja mahdollistaa nopeamman innovaation tarjoamalla mahdollisuuden visualisoida erilaisia ​​suunnitelmia ilman manuaalista luomisprosessia. Samoin se voi auttaa suunnittelussa eri aloilla, kuten valmistus, muotisuunnittelu vähittäiskaupassa ja pelisuunnittelu virtaviivaistamalla grafiikan ja kuvien luomista. Tekstistä kuvaksi -mallit parantavat myös asiakaskokemustasi mahdollistamalla personoidun mainonnan sekä interaktiiviset ja mukaansatempaavat visuaaliset chatbotit median ja viihteen käyttötapauksissa.

Tässä viestissä opastamme sinut Amazon Titan Image Generator -mallin hienosäätöprosessin läpi, jotta voit oppia kaksi uutta luokkaa: Ron-koira ja Smila-kissa, suosikkilemmikkimme. Keskustelemme kuinka valmistelet tietosi mallin hienosäätötehtävää varten ja kuinka voit luoda mallin mukauttamistyön Amazon Bedrockissa. Lopuksi näytämme, kuinka voit testata ja ottaa käyttöön hienosäädetyn mallisi Tarjottu läpimeno.

Ron koira Hymyile kissa

Mallin ominaisuuksien arviointi ennen työn hienosäätöä

Pohjamallit on koulutettu suurille tietomäärille, joten on mahdollista, että mallisi toimii riittävän hyvin heti alusta alkaen. Tästä syystä on hyvä käytäntö tarkistaa, tarvitseeko sinun todella hienosäätää mallisi käyttötarkoitustasi varten vai riittääkö nopea suunnittelu. Yritetään luoda kuvia Ron-koirasta ja Smila-kissasta Amazon Titan Image Generator -perusmallilla, kuten seuraavissa kuvakaappauksissa näkyy.

Odotusten mukaisesti käyttövalmis malli ei vielä tunne Ronia ja Smilaa, ja syntyneissä lähdöissä näkyy erilaisia ​​koiria ja kissoja. Nopealla suunnittelulla voimme tarjota lisätietoja päästäksemme lähemmäksi suosikkilemmikkiemme ulkonäköä.

Vaikka luodut kuvat ovat samankaltaisempia kuin Ron ja Smila, näemme, että malli ei pysty toistamaan niiden täyttä samankaltaisuutta. Aloitetaan nyt hienosäätötyö Ronin ja Smilan valokuvilla, jotta saadaan johdonmukaisia, yksilöllisiä tuloksia.

Hienosäädettävä Amazon Titan Image Generator

Amazon Bedrock tarjoaa sinulle palvelimettoman kokemuksen Amazon Titan Image Generator -mallisi hienosäätämiseen. Sinun tarvitsee vain valmistella tietosi ja valita hyperparametrisi, ja AWS hoitaa raskaan noston puolestasi.

Kun käytät Amazon Titan Image Generator -mallia hienosäätämiseen, tästä mallista luodaan kopio AWS-mallin kehitystilille, jonka omistaa ja hallinnoi AWS, ja mallin mukauttamistyö luodaan. Tämä työ käyttää sitten VPC:n hienosäätötietoja ja Amazon Titan -mallin painot päivitetään. Uusi malli tallennetaan sitten kansioon Amazonin yksinkertainen tallennuspalvelu (Amazon S3) sijaitsee samalla mallikehitystilillä kuin esikoulutettu malli. Vain tilisi voi nyt käyttää sitä päättelyyn, eikä sitä jaeta minkään muun AWS-tilin kanssa. Kun suoritat johtopäätöstä, pääset tähän malliin a varattu kapasiteettilaskenta tai suoraan käyttämällä eräpäätelmä Amazon Bedrockille. Riippumatta valitusta päättelytavasta, tietosi pysyvät tililläsi, eikä niitä kopioida millekään AWS:n omistamalle tilille eikä käytetä Amazon Titan Image Generator -mallin parantamiseen.

Seuraava kaavio kuvaa tätä työnkulkua.

Tietosuoja ja verkkoturvallisuus

Hienosäätöön, mukaan lukien kehotteet, käytetyt tietosi sekä mukautetut mallit pysyvät yksityisinä AWS-tililläsi. Niitä ei jaeta tai käytetä mallikoulutukseen tai palvelujen parantamiseen, eikä niitä jaeta kolmannen osapuolen mallintarjoajien kanssa. Kaikki hienosäätöön käytettävä data on salattu siirron aikana ja lepotilassa. Tiedot pysyvät samalla alueella, jossa API-kutsu käsitellään. Voit myös käyttää AWS PrivateLink luodaksesi yksityisen yhteyden sen AWS-tilin, jossa tietosi sijaitsevat, ja VPC:n välille.

Tietojen valmistelu

Ennen kuin voit luoda mallin mukauttamistyön, sinun on tehtävä se valmistele harjoitustietojoukkosi. Harjoitustietojoukon muoto riippuu luomasi mukauttamistyön tyypistä (hienosäätö tai jatkuva esikoulutus) ja tietojesi modaalisuudesta (teksti tekstiksi, tekstistä kuvaksi tai kuvasta upottaminen). Amazon Titan Image Generator -mallissa sinun on annettava kuvat, joita haluat käyttää hienosäädössä, ja kuvateksti jokaiselle kuvalle. Amazon Bedrock odottaa, että kuvasi tallennetaan Amazon S3:lle ja kuvaparit ja kuvatekstit toimitetaan JSONL-muodossa, jossa on useita JSON-rivejä.

Jokainen JSON-rivi on esimerkki, joka sisältää kuvaviitteen, kuvan S3-URI:n ja kuvatekstin, joka sisältää tekstikehotteen kuvalle. Kuvien on oltava JPEG- tai PNG-muodossa. Seuraava koodi näyttää esimerkin muodosta:

{"image-ref": "s3://bucket/path/to/image001.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image002.png", "caption": ""} {"image-ref": "s3://bucket/path/to/image003.png", "caption": ""}

Koska "Ron" ja "Smila" ovat nimiä, joita voidaan käyttää myös muissa yhteyksissä, kuten henkilön nimessä, lisäämme tunnisteet "Ron the dog" ja "Smila the cat" luodessamme kehotteen hienosäätääksemme malliamme. . Vaikka se ei ole vaatimus työnkulun hienosäädölle, nämä lisätiedot antavat mallille enemmän kontekstuaalista selkeyttä, kun sitä mukautetaan uusiin luokkiin ja vältetään "Ron the dog" sekoittaminen Ron-nimiseen henkilöön ja " Smila kissa” Smilan kaupungin kanssa Ukrainassa. Tätä logiikkaa käyttäen seuraavat kuvat näyttävät näytteen harjoitustietojoukostamme.

Ron koira makaa valkoisella koiransängyllä Ron koira istuu laattalattialla Ron koira makaa auton istuimella
Smila kissa makaa sohvalla Smila kissa tuijottaa kameraa sohvalla makaamassa Smila kissa makaa lemmikkilaukussa

Kun muutamme tietomme mukauttamistyön odottamaan muotoon, saamme seuraavan mallirakenteen:

{"image-ref": "/ron_01.jpg", "caption": "Ron koira makaa valkoisella koiransängyllä"} {"image-ref": "/ron_02.jpg", "kuvateksti": "Ron koira istuu laattalattialla"} {"image-ref": "/ron_03.jpg", "caption": "Ron koira makaa turvaistuimella"} {"image-ref": "/smila_01.jpg", "kuvateksti": "Smila kissa makaa sohvalla"} {"image-ref": "/smila_02.jpg", "caption": "Smila kissa istuu ikkunan vieressä patsaskissan vieressä"} {"image-ref": "/smila_03.jpg", "kuvateksti": "Smila kissa makaa kantolaukussa"}

Kun olemme luoneet JSONL-tiedostomme, meidän on tallennettava se S3-ämpäriin, jotta voimme aloittaa mukautustyömme. Amazon Titan Image Generator G1:n hienosäätötyöt toimivat 5–10,000 60 kuvan kanssa. Tässä postauksessa käsitellyssä esimerkissä käytämme 30 kuvaa: 30 koirasta Ronista ja XNUMX kissasta Smilasta. Yleisesti ottaen, tarjoamalla enemmän erilaisia ​​tyylejä tai luokkia, joita yrität oppia, parantaa hienosäädetyn mallisi tarkkuutta. Kuitenkin, mitä enemmän kuvia käytät hienosäätöön, sitä enemmän aikaa kuluu hienosäätötyön suorittamiseen. Käytettyjen kuvien määrä vaikuttaa myös hienosäädetyn työn hinnoitteluun. Viitata Amazonin kallioperän hinnoittelu lisätietoja.

Hienosäädettävä Amazon Titan Image Generator

Nyt kun koulutustietomme ovat valmiina, voimme aloittaa uuden räätälöintityön. Tämä prosessi voidaan tehdä sekä Amazon Bedrock -konsolin tai API:iden kautta. Voit käyttää Amazon Bedrock -konsolia seuraavasti:

  1. Valitse Amazon Bedrock -konsolista Mukautetut mallit navigointipaneelissa.
  2. On Mukauta mallia valikosta, valitse Luo hienosäätötyötä.
  3. varten Hienosäädetty mallinimi, anna nimi uudelle mallillesi.
  4. varten Työn määritys, anna koulutustehtävän nimi.
  5. varten Syöttötiedot, syötä syötetietojen S3-polku.
  6. In hyperparametrien osio, anna arvot seuraaville:
    1. Vaiheiden lukumäärä – Kuinka monta kertaa malli on altistettu jokaiselle erälle.
    2. Erän koko – Käsiteltyjen näytteiden määrä ennen malliparametrien päivittämistä.
    3. Oppimisnopeus – Nopeus, jolla malliparametrit päivitetään jokaisen erän jälkeen. Näiden parametrien valinta riippuu tietystä tietojoukosta. Yleisenä ohjeena suosittelemme, että aloitat kiinnittämällä erän kooksi 8, oppimisnopeudeksi 1e-5 ja määrittämällä vaiheiden lukumäärän käytettyjen kuvien määrän mukaan seuraavan taulukon mukaisesti.
Tarjottujen kuvien määrä 8 32 64 1,000 10,000
Suositeltu askelmäärä 1,000 4,000 8,000 10,000 12,000

Jos hienosäätötyösi tulokset eivät ole tyydyttäviä, harkitse vaiheiden määrän lisäämistä, jos et havaitse tyylin merkkejä luoduissa kuvissa, ja vaiheiden määrän vähentämistä, jos havaitset tyylin luoduissa kuvissa, mutta esineitä tai epäselvyyttä. Jos hienosäädetty malli ei opi tietojoukkosi ainutlaatuista tyyliä edes 40,000 XNUMX vaiheen jälkeen, harkitse eräkoon tai oppimisnopeuden lisäämistä.

  1. In Lähtötiedot Syötä S3-tulostuspolku, johon validoinnin lähdöt, mukaan lukien säännöllisin väliajoin tallennetut validointihäviöt ja tarkkuusmittarit, on tallennettu.
  2. In Palveluihin pääsy -osio, luo uusi AWS-henkilöllisyyden ja käyttöoikeuksien hallinta (IAM) rooli tai valitse olemassa oleva IAM-rooli, jolla on tarvittavat oikeudet käyttää S3-säilöjäsi.

Tämä valtuutus antaa Amazon Bedrockille mahdollisuuden noutaa syöte- ja validointitietojoukot määritetyistä säilöistäsi ja tallentaa validointitulosteet saumattomasti S3-säihösi.

  1. Valita Hienosäädetty malli.

Oikeilla kokoonpanoilla Amazon Bedrock kouluttaa nyt mukautetun mallisi.

Ota käyttöön hienosäädetty Amazon Titan Image Generator Provisioned Throughput -toiminnolla

Kun olet luonut mukautetun mallin, Provisioned Throughput antaa sinun varata ennalta määritetyn kiinteän käsittelykapasiteetin mukautetulle mallille. Tämä allokointi tarjoaa tasaisen suorituskyvyn ja kapasiteetin työkuormien käsittelyyn, mikä johtaa parempaan tuotantomäärään. Provisioned Throughputin toinen etu on kustannusten hallinta, koska vakiomuotoista token-pohjaista hinnoittelua on-demand-johtopäätöstilassa voi olla vaikea ennustaa suurissa mittakaavassa.

Kun mallisi hienosäätö on valmis, tämä malli tulee näkyviin mukautetut mallit' sivu Amazon Bedrock -konsolissa.

Jos haluat ostaa Provisioned Throughput, valitse mukautettu malli, jota juuri hienosääsit ja valitse Osto-ohjattu suorituskyky.

Tämä esitäyttää valitun mallin, jolle haluat ostaa Provisioned Throughput. Testaaksesi hienosäädettyä malliasi ennen käyttöönottoa, aseta malliyksiköiden arvoksi 1 ja määritä sitoutumisjaksoksi Ei sitoumuksia. Näin voit nopeasti alkaa testata mallejasi mukautettujen kehotteiden avulla ja tarkistaa, onko koulutus riittävä. Lisäksi kun uusia hienosäädettyjä malleja ja uusia versioita on saatavilla, voit päivittää Provisioned Throughput, kunhan päivität sen saman mallin muilla versioilla.

Hienosäätötulokset

Tehtävässämme mukauttaa mallia koiran Ronin ja kissa Smilan kohdalla kokeet osoittivat, että parhaat hyperparametrit olivat 5,000 8 askelta eräkoon 1 ja oppimisnopeuden ollessa 5e-XNUMX.

Seuraavassa on esimerkkejä mukautetun mallin luomista kuvista.

Ron-koira yllään supersankariviitta Ron koira kuussa Ron koira uima-altaassa aurinkolasien kanssa
Hymyile kissaa lumella Hymyile mustavalkoinen kissa kameraan Smila kissa, jolla on jouluhattu

Yhteenveto

Tässä viestissä keskustelimme siitä, milloin kannattaa käyttää hienosäätöä sen sijaan, että kehitämme kehotteita laadukkaamman kuvan luomiseksi. Näitimme kuinka hienosäätää Amazon Titan Image Generator -mallia ja ottaa mukautettu malli käyttöön Amazon Bedrockissa. Annoimme myös yleiset ohjeet tietojen valmistelemisesta hienosäätöä varten ja optimaalisten hyperparametrien asettamisesta mallin tarkempaa räätälöintiä varten.

Seuraavana vaiheena voit mukauttaa seuraavaa esimerkki käyttötapauksiisi luodaksesi hyperpersonoituja kuvia Amazon Titan Image Generatorilla.


Tietoja Tekijät

Maira Ladeira Tanke on vanhempi generatiivinen AI-datatutkija AWS:ssä. Hänellä on koneoppimistausta, ja hänellä on yli 10 vuoden kokemus tekoälysovellusten suunnittelusta ja rakentamisesta asiakkaiden kanssa eri toimialoilla. Teknisenä johtajana hän auttaa asiakkaita nopeuttamaan liiketoiminnan arvon saavuttamista luovien tekoälyratkaisujen avulla Amazon Bedrockissa. Vapaa-ajallaan Maira nauttii matkustamisesta, kissansa Smilan kanssa leikkimisestä ja perheensä kanssa viettämisestä jossain lämpimässä paikassa.

Dani Mitchell on AI/ML Specialist Solutions -arkkitehti Amazon Web Servicesissä. Hän keskittyy tietokonenäön käyttötapauksiin ja auttaa asiakkaita kaikkialla EMEA-alueella nopeuttamaan ML-matkaansa.

Bharathi Srinivasan on datatutkija AWS Professional Services -palvelussa, jossa hän rakastaa upeiden asioiden rakentamista Amazon Bedrockille. Hän on intohimoinen liikearvon kasvattamiseen koneoppimissovelluksilla keskittyen vastuulliseen tekoälyyn. Sen lisäksi, että Bharathi rakentaa asiakkaille uusia tekoälykokemuksia, hän rakastaa tieteiskirjallisuuden kirjoittamista ja haastaa itsensä kestävyyslajeissa.

Achin Jain on soveltuva tutkija Amazon Artificial General Intelligence (AGI) -tiimissä. Hänellä on asiantuntemusta tekstistä kuvaksi -malleista ja hän on keskittynyt Amazon Titan Image Generatorin rakentamiseen.

spot_img

Uusin älykkyys

spot_img

Keskustele kanssamme

Hei siellä! Kuinka voin olla avuksi?