Generatiivinen tiedustelu

Luo rokotusten vahvistusratkaisu Amazon Textract |:n Queries-ominaisuuden avulla Amazon Web Services

Treffi:

Amazonin teksti on koneoppimispalvelu (ML), joka mahdollistaa tekstin, käsinkirjoituksen ja datan automaattisen poimimisen skannatuista asiakirjoista, ohittaen perinteisen optisen merkintunnistuksen (OCR). Se voi tunnistaa, ymmärtää ja poimia tietoja taulukoista ja lomakkeista huomattavalla tarkkuudella. Tällä hetkellä useat yritykset luottavat manuaalisiin poimintamenetelmiin tai OCR-perusohjelmistoihin, mikä on työlästä ja aikaa vievää ja vaatii manuaalista konfigurointia, joka on päivitettävä lomakkeen muuttuessa. Amazon Textract auttaa ratkaisemaan nämä haasteet hyödyntämällä ML:ää käsittelemään automaattisesti eri asiakirjatyyppejä ja poimimaan tiedot tarkasti minimaalisella manuaalisella toimenpiteellä. Näin voit automatisoida asiakirjojen käsittelyn ja käyttää poimittuja tietoja eri tarkoituksiin, kuten lainojen käsittelyn automatisointiin tai tietojen keräämiseen laskuista ja kuiteista.

Matkailun jatkuessa pandemian jälkeen, matkustajan rokotustilan tarkistaminen saattaa olla tarpeen monissa tapauksissa. Hotellien ja matkatoimistojen on usein tarkistettava rokotuskortit saadakseen tärkeitä tietoja, kuten onko matkustaja täysin rokotettu, rokotuspäivämäärät ja matkustajan nimi. Jotkut virastot tekevät tämän korttien manuaalisella todentamisella, mikä voi viedä henkilökunnalta aikaa ja jättää tilaa inhimillisille virheille. Toiset ovat rakentaneet räätälöityjä ratkaisuja, mutta ne voivat olla kalliita ja vaikeita skaalata ja viedä huomattavasti aikaa. Tulevaisuudessa saattaa olla mahdollisuuksia tehostaa rokotusten tilan varmistusprosessia tavalla, joka on tehokas yrityksille samalla kun kunnioitetaan matkustajien yksityisyyttä ja mukavuutta.

Amazonin tekstikyselyt auttaa vastaamaan näihin haasteisiin. Amazon Textract Queriesin avulla voit määrittää ja poimia asiakirjasta vain tarvitsemasi tiedon. Se antaa sinulle tarkat ja tarkat tiedot asiakirjasta.

Tässä viestissä opastamme sinut vaiheittaisen käyttöönottooppaan läpi, jonka avulla voit rakentaa rokotuksen tilan vahvistusratkaisun Amazon Textract Queriesin avulla. Ratkaisu esittelee rokotuskorttien käsittelyä Amazon Textract -kyselyn avulla, rokotustilan tarkistamista ja tietojen tallentamista tulevaa käyttöä varten.

Ratkaisun yleiskatsaus

Seuraava kaavio kuvaa ratkaisuarkkitehtuuria.

Työnkulku sisältää seuraavat vaiheet:

  1. Käyttäjä ottaa valokuvan rokotuskortista.
  2. Kuva ladataan osoitteeseen Amazonin yksinkertainen tallennuspalvelu (Amazon S3)-kauha.
  3. Kun kuva tallennetaan S3-ämpäriin, se kutsuu a AWS-vaihetoiminnot työnkulku:
  4. Kyselyt-päättäjä AWS Lambda -toiminto tutkii lähetetyn asiakirjan ja lisää tietoja MIME-tyypistä, sivujen määrästä ja kyselyiden määrästä Step Functions -työnkulkuun (esimerkissämme meillä on neljä kyselyä).
  5. NumberQueriesAndPagesChoice on valintatila, joka lisää ehdollista logiikkaa työnkulkuun. Jos kyselyitä on 15–31 ja sivujen määrä 2–3,001 15, on Amazon Textractin asynkroninen käsittely ainoa vaihtoehto, koska synkroniset API:t tukevat vain XNUMX kyselyä ja yksisivuisia asiakirjoja. Kaikissa muissa tapauksissa reititämme synkronisen tai asynkronisen käsittelyn satunnaiseen valintaan.
  6. - TextractSync Lambda-toiminto lähettää Amazon Textractille pyynnön analysoida asiakirja seuraavien Amazon Textract -kyselyiden perusteella:
    1. Mikä on rokotuksen tila?
    2. Mikä on nimi?
    3. Mikä on syntymäaika?
    4. Mikä on asiakirjanumero?
  7. Amazon Textract analysoi kuvan ja lähettää vastaukset näihin kyselyihin takaisin Lambda-funktiolle.
  8. Lambda-toiminto tarkistaa asiakkaan rokotustilan ja tallentaa lopputuloksen CSV-muodossa samaan S3-ämpäriin (demoqueries-textractxxx) On csv-output kansio.

Edellytykset

Tämän ratkaisun viimeistelemiseksi sinulla tulee olla AWS-tili ja asianmukaiset oikeudet luoda tarvittavat resurssit osana ratkaisua.

Lataa käyttöönottokoodi ja näyterokotuskortti osoitteesta GitHub.

Käytä Amazon Textract -konsolin Kyselyt-ominaisuutta

Ennen kuin rakennat rokotusten vahvistusratkaisun, tutkitaan, kuinka voit käyttää Amazon Textract Queriesia rokotustilan poimimiseen Amazon Textract -konsolin kautta. Voit käyttää GitHub-reposta lataamaasi rokotuskorttinäytettä.

  1. Valitse Amazon Textract -konsolissa Analysoi asiakirja navigointipaneelissa.
  2. Alle Lähetä asiakirja, valitse Valitse asiakirja ladataksesi rokotuskortin paikalliselta asemaltasi.
  3. Kun olet ladannut asiakirjan, valitse Kyselyt vuonna Määritä asiakirja osiossa.
  4. Voit sitten lisätä kyselyitä luonnollisen kielen kysymysten muodossa. Lisätään seuraava:
    • Mikä on rokotuksen tila?
    • Mikä on nimi?
    • Mikä on syntymäaika?
    • Mikä on asiakirjanumero?
  5. Kun olet lisännyt kaikki kyselysi, valitse Käytä määritystä.
  6. Tarkista kyselyt -välilehteä nähdäksesi vastaukset kysymyksiin.

Voit nähdä, kuinka Amazon Textract poimii vastauksen kysymykseesi asiakirjasta.

Ota käyttöön rokotuksen vahvistusratkaisu

Tässä viestissä käytämme an AWS-pilvi9 ilmentymä ja asenna tarvittavat riippuvuudet ilmentymään kanssa AWS Cloud Development Kit (AWS CDK) ja Docker. AWS Cloud9 on pilvipohjainen integroitu kehitysympäristö (IDE), jonka avulla voit kirjoittaa, suorittaa ja korjata koodiasi vain selaimella.

  1. Valitse terminaalissa Lataa paikallisia tiedostoja på den filee valikosta.
  2. Valita Valitse kansio Ja valitse vaccination_verification_solution kansio, jonka latasit GitHubista.
  3. Valmistele palvelimeton sovellus terminaalissa kehitystyönkulun myöhempiä vaiheita varten AWS-palvelimeton sovellusmalli (AWS SAM) seuraavalla komennolla:
    $ cd vaccination_verification_solution/
    $ pip install -r requirements.txt
    

  4. Ota sovellus käyttöön käyttämällä cdk deploy komento:
    cdk deploy DemoQueries --outputs-file demo_queries.json --require-approval never

    Odota, että AWS CDK ottaa mallin käyttöön ja luo mallissa mainitut resurssit.

  5. Kun käyttöönotto on valmis, voit tarkistaa käyttöönotetut resurssit AWS-pilven muodostuminen konsoli päällä Esittelymateriaalit pinon tietosivun välilehti.

Testaa ratkaisu

Nyt on aika testata ratkaisua. Käynnistä työnkulku käyttämällä aws s3 cp ladata vac_card.jpg tiedosto DemoQueries.DocumentUploadLocation docs-kansion sisällä:

aws s3 cp docs/vac_card.JPG $(aws cloudformation list-exports --query 'Exports[?Name==`DemoQueries-DocumentUploadLocation`].Value' --output text)


Rokotustodistustiedosto ladataan automaattisesti S3-ämpäriin demoqueries-textractxxx latauskansiossa.

Step Functions -työnkulku käynnistyy Lambda-toiminnon kautta heti, kun rokotustodistustiedosto ladataan S3-ämpäriin.

Queries-Decider Lambda -toiminto tutkii asiakirjan ja lisää Step Functions -työnkulkuun tiedot mime-tyypistä, sivujen määrästä ja kyselyiden määrästä (tässä esimerkissä käytämme neljää kyselyä – asiakirjan numero, asiakkaan nimi, päivämäärä syntymä ja rokotustila).

- TextractSync toiminto lähettää syöttökyselyt Amazon Textractille ja palauttaa synkronisesti täyden tuloksen osana vastausta. Se tukee 1-sivuisia asiakirjoja (TIFF, PDF, JPG, PNG) ja jopa 15 kyselyä. The GenerateCsvTask -toiminto ottaa JSON-lähdön Amazon Textractista ja muuntaa sen CSV-tiedostoksi.

Lopullinen tulos tallennetaan samaan S3-säihöön csv-tulostuskansiossa CSV-tiedostona.

Voit ladata tiedoston paikalliselle koneellesi seuraavalla komennolla:

aws s3 cp <paste the S3 URL from TextractOutputCSVPath>

Tuloksen muoto on timestamp, classification, filename, page number, key name, key_confidence, value, value_confidence, key_bb_top, key_bb_height, key_bb.width, key_bb_left, value_bb_top, value_bb_height, value_bb_width, value_bb_left.

Voit skaalata ratkaisun satoihin rokotustodistusasiakirjoihin useille asiakkaille lataamalla heidän rokotustodistuksensa osoitteeseen DemoQueries.DocumentUploadLocation. Tämä käynnistää automaattisesti useita Step Functions -tilakoneen ajoja, ja lopputulos tallennetaan samaan S3-säihöön csv-tulostuskansioon.

Voit muuttaa Amazon Textractiin syötettävien kyselyjen alkuperäistä joukkoa siirtymällä AWS Cloud9 -esiintymään ja avaamalla tiedoston start_execution.py. Siirry vasemman ruudun tiedostonäkymässä kohtaan lambda, start_queries, app, start_execution.py. Tämä Lambda-toiminto käynnistyy, kun tiedosto ladataan DemoQueries.DocumentUploadLocation. Työnkulkuun lähetettävät kyselyt määritellään start_execution.py; voit muuttaa niitä päivittämällä koodin seuraavan kuvakaappauksen mukaisesti.

Puhdistaa

Voit välttää jatkuvia kuluja poistamalla tässä viestissä luodut resurssit seuraavalla komennolla:

cdk destroy DemoQueries

Vastaa kysymykseen Are you sure you want to delete: DemoQueries (y/n)? y:n kanssa.

Yhteenveto

Tässä viestissä näytimme sinulle, kuinka voit käyttää Amazon Textract Queriesia rokotusten todentamisratkaisun rakentamiseen matkailualalle. Voit käyttää Amazon Textract Queriesia ratkaisujen rakentamiseen muilla aloilla, kuten rahoituksessa ja terveydenhuollossa, ja hakea tietoja asiakirjoista, kuten palkkaluetteloista, asuntolainailmoituksista ja vakuutuskorteista luonnollisen kielen kysymyksiin perustuen.

Lisätietoja katso Asiakirjojen analysointi, tai tutustu Amazon Textract -konsoliin ja kokeile tätä ominaisuutta.


Tietoja Tekijät

Dhiraj Thakur on ratkaisuarkkitehti Amazon Web Services -palvelun kanssa. Hän tarjoaa AWS-asiakkaiden ja -kumppaneiden kanssa neuvoja yrityksen pilvipalvelujen käyttöönotosta, siirtymisestä ja strategiasta. Hän on intohimoinen tekniikkaan ja nauttii rakentamisesta ja kokeilemisesta analytiikan ja tekoälyn / ML-avaruudessa.

Rishabh Yadav on AWS:n Partner Solutions -arkkitehti, jolla on laaja tausta AWS:n DevOps- ja tietoturvatarjonnasta. Hän työskentelee ASEAN-kumppaneiden kanssa tarjotakseen ohjeita yrityspilvipalveluiden käyttöönotosta ja arkkitehtuurin arvioinneista sekä AWS-käytäntöjen rakentamisesta Well-Architected Frameworkin avulla. Työn ulkopuolella hän viettää mielellään aikaansa urheilukentällä ja FPS-pelaamisessa.

spot_img

Uusin älykkyys

spot_img