Generatiivinen tiedustelu

Optimoi lemmikkiprofiilit Purinan Petfinder-sovellukselle käyttämällä Amazon Rekognitionin mukautettuja tarroja ja AWS-vaihetoimintoja | Amazon Web Services

Treffi:

Nestlén tytäryhtiöllä Purina US:lla on pitkä historia mahdollistanut lemmikkien adoptoinnin helpommin. Lemmikkieläinten etsintä, yli 11,000 XNUMX eläinsuojan ja pelastusryhmän digitaalinen markkinapaikka Yhdysvalloissa, Kanadassa ja Meksikossa. Johtavana lemmikkien adoptointialustana Petfinder on auttanut miljoonia lemmikkejä löytämään ikuisen kotinsa.

Purina etsii jatkuvasti tapoja tehdä Petfinder-alustasta entistäkin parempi sekä turvakotien että pelastusryhmien ja lemmikkien adoptoijille. Yksi heidän kohtaamistaan ​​haasteista oli ottaa asianmukaisesti huomioon tietty eläinrotu, joka oli otettu käyttöön. Koska monet tarhan eläimet ovat sekarotuisia, rotujen ja ominaisuuksien oikea tunnistaminen lemmikkiprofiilista vaati manuaalista työtä, mikä vei aikaa. Purina käytti tekoälyä (AI) ja koneoppimista (ML) automatisoidakseen eläinrotujen havaitsemisen laajassa mittakaavassa.

Tämä viesti kertoo kuinka Purina käytti Amazon Rekognition mukautetut etiketit, AWS-vaihetoiminnotja muita AWS-palveluita luodakseen ML-mallin, joka tunnistaa lemmikkirodun ladatusta kuvasta ja käyttää sitten ennustetta lemmikin määritteiden automaattiseen täyttämiseen. Ratkaisu keskittyy AI/ML-sovelluksen työnkulun kehittämisen perusperiaatteisiin tietojen valmisteluun, mallikoulutukseen, mallien arviointiin ja mallien seurantaan.

Ratkaisun yleiskatsaus

Eläinrotujen ennustaminen kuvasta vaatii mukautettuja ML-malleja. Mukautetun mallin kehittäminen kuvien analysointia varten on merkittävä urakka, joka vaatii aikaa, asiantuntemusta ja resursseja ja kestää usein kuukausia. Lisäksi se vaatii usein tuhansia tai kymmeniä tuhansia käsin merkittyjä kuvia tarjotakseen mallille tarpeeksi tietoa, jotta se voi tehdä tarkkoja päätöksiä. Työnkulun määrittäminen malliennusteiden auditointia tai tarkistamista varten vaatimusten noudattamisen vahvistamiseksi voi entisestään lisätä yleistä monimutkaisuutta.

Rekognition Custom Labelsillä, joka perustuu olemassa oleviin ominaisuuksiin Amazonin tunnistus, voit tunnistaa kuvista kohteet ja kohtaukset, jotka vastaavat yrityksesi tarpeita. Se on jo koulutettu kymmeniin miljooniin kuviin useissa luokissa. Tuhansien kuvien sijaan voit ladata pienen joukon harjoituskuvia (yleensä muutama sata kuvaa tai vähemmän luokkaa kohden), jotka ovat omia käyttötapauksiasi.

Ratkaisu käyttää seuraavia palveluita:

  • Amazon API -yhdyskäytävä on täysin hallittu palvelu, jonka avulla kehittäjien on helppo julkaista, ylläpitää, valvoa ja suojata API-liittymiä missä tahansa mittakaavassa.
  • - AWS Cloud Development Kit (AWS CDK) on avoimen lähdekoodin ohjelmistokehityskehys, jolla pilviinfrastruktuuri voidaan määritellä koodiksi nykyaikaisilla ohjelmointikielillä ja ottaa se käyttöön AWS-pilven muodostuminen.
  • AWS CodeBuild on täysin hallittu jatkuva integraatiopalvelu pilvessä. CodeBuild kokoaa lähdekoodin, suorittaa testejä ja tuottaa paketteja, jotka ovat valmiita käyttöön.
  • Amazon DynamoDB on nopea ja joustava ei-relaatiotietokantapalvelu mihin tahansa mittakaavaan.
  • AWS Lambda on tapahtumapohjainen laskentapalvelu, jonka avulla voit suorittaa koodia käytännöllisesti katsoen minkä tahansa tyyppisille sovelluksille tai taustapalveluille ilman palvelimien hallintaa tai hallintaa.
  • Amazonin tunnistus tarjoaa valmiiksi koulutetut ja mukautettavat tietokonenäköominaisuudet (CV), joiden avulla voit poimia tietoja ja oivalluksia kuvistasi ja videoistasi. Kanssa Amazon Rekognition mukautetut etiketit, voit tunnistaa kuvista kohteet ja kohtaukset, jotka vastaavat yrityksesi tarpeita.
  • AWS-vaihetoiminnot on täysin hallittu palvelu, joka helpottaa hajautettujen sovellusten ja mikropalvelujen komponenttien koordinointia visuaalisten työnkulkujen avulla.
  • AWS-järjestelmien päällikkö on turvallinen päästä päähän -hallintaratkaisu resursseille AWS:ssä sekä multicloud- ja hybridiympäristöissä. Parametrikauppa, Systems Managerin ominaisuus, tarjoaa turvallisen, hierarkkisen tallennustilan konfigurointitietojen ja salaisuuksien hallintaan.

Purinan ratkaisu on otettu käyttöön API-yhdyskäytävä HTTP päätepiste, joka reitittää pyynnöt lemmikkimääritteiden hankkimiseksi. Se käyttää Rekognition Custom Labels -merkintöjä lemmikkirodun ennustamiseen. ML-malli on koulutettu Purinan tietokannasta poimituista lemmikkiprofiileista olettaen, että ensisijainen rotumerkki on oikea merkki. DynamoDB:tä käytetään lemmikkien attribuuttien tallentamiseen. Lambdaa käytetään lemmikkien attribuuttipyynnön käsittelemiseen järjestämällä API Gatewayn, Amazon Rekognitionin ja DynamoDB:n välillä.

Arkkitehtuuri toteutetaan seuraavasti:

  1. Petfinder-sovellus reitittää pyynnön hankkia lemmikin attribuutit API Gatewayn kautta.
  2. API-yhdyskäytävä kutsuu Lambda-funktiota saadakseen lemmikin attribuutit.
  3. Lambda-funktio kutsuu Rekognition Custom Label -päätepäätepistettä lemmikkirodun ennustamiseksi.
  4. Lambda-funktio käyttää ennustettuja lemmikkieläinrotutietoja lemmikkimääritteiden haun suorittamiseen DynamoDB-taulukosta. Se kerää lemmikin määritteet ja lähettää ne takaisin Petfinder-sovellukseen.

Seuraava kaavio kuvaa ratkaisun työnkulkua.

Purinan Petfinder-tiimi haluaa automatisoidun ratkaisun, jonka he voivat ottaa käyttöön vähäisellä huollolla. Tämän toteuttamiseksi luomme vaihefunktioiden avulla tilakoneen, joka kouluttaa mallit uusimmilla tiedoilla, tarkistaa niiden suorituskyvyn vertailujoukossa ja ottaa mallit uudelleen käyttöön, jos ne ovat parantuneet. Mallin uudelleenkoulutus käynnistyy profiilitietoja lähettävien käyttäjien tekemien rotukorjausten lukumäärästä.

Malliharjoittelu

Mukautetun mallin kehittäminen kuvien analysointiin on merkittävä urakka, joka vaatii aikaa, asiantuntemusta ja resursseja. Lisäksi se vaatii usein tuhansia tai kymmeniä tuhansia käsin merkittyjä kuvia tarjotakseen mallille tarpeeksi tietoa, jotta se voi tehdä tarkkoja päätöksiä. Näiden tietojen luominen voi kestää kuukausia keräämiseen, ja sen merkitseminen koneoppimisessa käytettäväksi vaatii paljon vaivaa. Tekniikka ns siirrä oppimista auttaa tuottamaan korkealaatuisempia malleja lainaamalla valmiiksi koulutetun mallin parametreja ja mahdollistaa mallien kouluttavuuden vähemmällä kuvalla.

Haasteenamme on, että tietomme eivät ole täydellisesti merkittyjä: profiilitietoja syöttävät ihmiset voivat tehdä virheitä ja tekevätkin virheitä. Huomasimme kuitenkin, että riittävän suurilla tietonäytteillä väärin merkittyjen kuvien osuus oli riittävän pieni ja että mallin suorituskyky ei vaikuttanut enempää kuin 2 % tarkkuuteen.

ML-työnkulku ja tilakone

Step Functions -tilakone on kehitetty auttamaan Amazon Rekognition -mallin automaattisessa uudelleenkoulutuksessa. Palaute kerätään profiilin syöttämisen yhteydessä – joka kerta, kun käyttäjä muokkaa kuvasta pääteltyä rotua toiseksi roduksi, korjaus tallennetaan. Tämä tilakone laukeaa konfiguroitavasta korjausten ja lisätietojen kynnysmäärästä.

Tilakone käy läpi useita vaiheita luodakseen ratkaisun:

  1. Luo koulutus- ja testausluettelotiedostoja, jotka sisältävät luettelon Amazonin yksinkertainen tallennuspalvelu (Amazon S3) kuvapolut ja niiden tunnisteet Amazon Rekognitionin käyttöön.
  2. Luo Amazon Rekognition -tietojoukko luettelotiedostojen avulla.
  3. Kouluta Amazon Rekognition -malliversio tietojoukon luomisen jälkeen.
  4. Käynnistä malliversio, kun koulutus on valmis.
  5. Arvioi malli ja luo suorituskykymittareita.
  6. Jos suorituskykymittarit ovat tyydyttäviä, päivitä mallin versio Parameter Storessa.
  7. Odota, että uusi malliversio leviää Lambda-toiminnoissa (20 minuuttia), ja lopeta sitten edellinen malli.

Mallin arviointi

Käytämme mallimme validoimiseksi satunnaista 20 %:n pidätysjoukkoa, joka on otettu tietonäytteestämme. Koska havaitsemamme rodut ovat konfiguroitavissa, emme käytä kiinteää tietojoukkoa validointiin koulutuksen aikana, mutta käytämme manuaalisesti merkittyä arviointisarjaa integraatiotestaukseen. Manuaalisesti merkityn joukon ja mallin havaittavissa olevien rotujen päällekkäisyyttä käytetään mittareiden laskemiseen. Jos mallin roduntunnistustarkkuus ylittää tietyn kynnyksen, suosittelemme mallia käytettäväksi päätepisteessä.

Seuraavassa on muutamia kuvakaappauksia lemmikkieläinten ennakoinnin työnkulusta Rekognition Custom Labels -palvelusta.

Käyttöönotto AWS CDK:n kanssa

Step Functions -tilakone ja siihen liittyvä infrastruktuuri (mukaan lukien Lambda-funktiot, CodeBuild-projektit ja Systems Manager -parametrit) otetaan käyttöön AWS CDK:n kanssa Pythonin avulla. AWS CDK -koodi syntetisoi CloudFormation-mallin, jonka avulla se ottaa käyttöön kaiken ratkaisun infrastruktuurin.

Integrointi Petfinder-sovellukseen

Petfinder-sovellus käyttää kuvan luokittelun päätepistettä API Gateway -päätepisteen kautta käyttämällä POST-pyyntöä, joka sisältää JSON-hyötykuorman kentät Amazon S3 -polulle kuvaan ja palautettavien tulosten lukumäärälle.

KPI:t, joihin vaikuttaa

Perustellaksemme kuvapäätelmän päätepisteen suorittamisesta aiheutuvat lisäkustannukset suoritimme kokeita määrittääksemme arvon, jonka päätepiste lisää Petfinderille. Päätepisteen käyttö tarjoaa kaksi pääasiallista parannustyyppiä:

  • Vähemmän työtä lemmikkieläinten turvakodeille, jotka luovat lemmikkiprofiileja
  • Täydelliset lemmikkiprofiilit, joiden odotetaan parantavan haun osuvuutta

Työn ja profiilin täydellisyyden mittausmittarit sisältävät korjattujen automaattisesti täytettyjen kenttien määrän, täytettyjen kenttien kokonaismäärän ja lemmikkiprofiilin lataamiseen kuluvan ajan. Hakurelevanssin parannuksia päätellään epäsuorasti käyttöönottoasteeseen liittyvien keskeisten suoritusindikaattoreiden mittaamisesta. Purinan mukaan ratkaisun käyttöönoton jälkeen keskimääräinen aika lemmikkiprofiilin luomiseen Petfinder-sovelluksessa lyheni 7 minuutista 4 minuuttiin. Tämä on valtava parannus ja ajansäästö, koska vuonna 2022 lähetettiin 4 miljoonaa lemmikkiprofiilia.

Turvallisuus

Arkkitehtuurikaavion läpi kulkeva data on salattu siirron ja lepotilan aikana AWS Hyvin suunniteltuja parhaita käytäntöjä. Kaikkien AWS-toimien aikana tietoturvaasiantuntija arvioi ratkaisun varmistaakseen, että toteutus on turvallinen.

Yhteenveto

Rekognition Custom Labels -merkintöihin perustuvalla ratkaisullaan Petfinder-tiimi pystyy nopeuttamaan lemmikkieläinten turvakotien lemmikkiprofiilien luomista, mikä vähentää turvakotien henkilökunnan hallinnollista taakkaa. AWS CDK:hen perustuva käyttöönotto ottaa käyttöön Step Functions -työnkulun koulutus- ja käyttöönottoprosessin automatisoimiseksi. Aloita Rekognition Custom Labels -tunnisteiden käyttö kohdasta Amazon Rekognition Custom Labels -sovelluksen käytön aloittaminen. Voit myös tarkistaa joitain Esimerkkejä askelfunktioista ja Aloita AWS CDK:n käyttö.


Tietoja Tekijät

Mason Cahill on vanhempi DevOps-konsultti AWS:n asiantuntijapalveluissa. Hän nauttii organisaatioiden auttamisesta saavuttamaan liiketoimintatavoitteensa, ja hän on intohimoinen automatisoitujen ratkaisujen rakentamiseen ja toimittamiseen AWS-pilvessä. Työn ulkopuolella hän rakastaa viettää aikaa perheensä kanssa, vaeltaa ja pelata jalkapalloa.

Matthew Chasse on datatieteen konsultti Amazon Web Servicesissä, jossa hän auttaa asiakkaita rakentamaan skaalautuvia koneoppimisratkaisuja. Matthew on matematiikan tohtori ja nauttii kalliokiipeilystä ja musiikista vapaa-ajallaan.

Rushikesh Jagtap on ratkaisuarkkitehti, jolla on yli 5 vuoden kokemus AWS Analytics -palveluista. Hän haluaa auttaa asiakkaita rakentamaan skaalautuvia ja nykyaikaisia ​​data-analytiikkaratkaisuja saadakseen tietoa tiedoista. Työn ulkopuolella hän rakastaa Formula 1:n katsomista, sulkapallon pelaamista ja Go Karts -kilpailua.

Tayo Olajide on kokenut Cloud Data Engineeringin yleisasiantuntija, jolla on yli vuosikymmenen kokemus dataratkaisujen suunnittelusta ja toteuttamisesta pilviympäristöissä. Tayolla on intohimo muuttaa raakadata arvokkaiksi oivalluksiksi, ja sillä on ollut keskeinen rooli dataputkien suunnittelussa ja optimoinnissa eri toimialoille, mukaan lukien rahoitus-, terveydenhuolto- ja autoteollisuus. Alan ajatusjohtajana Tayo uskoo, että datan voima piilee sen kyvyssä ohjata tietoon perustuvaa päätöksentekoa ja on sitoutunut auttamaan yrityksiä hyödyntämään datansa täyden potentiaalin pilviaikakaudella. Kun hän ei suunnittele dataputkia, voit löytää Tayon tutkivan tekniikan uusimpia trendejä, vaeltamassa ulkona tai puuhailemassa laitteiden ja ohjelmistojen parissa.

spot_img

Uusin älykkyys

spot_img