Generatiivinen tiedustelu

Quantum Vision Transformers

Treffi:

El Amine Cherrat1, Iordanis Kerenidis1,2, Natansh Mathur1,2, Jonas Landman3,2, Martin Strahm4ja Yun Yvonna Li4

1IRIF, CNRS – Université Paris Cité, Ranska
2QC Ware, Palo Alto, USA ja Pariisi, Ranska
3Informatiikkakoulu, Edinburghin yliopisto, Skotlanti, Iso-Britannia
4F. Hoffmann La Roche AG

Onko tämä artikkeli mielenkiintoinen vai haluatko keskustella? Scite tai jätä kommentti SciRate.

Abstrakti

Tässä työssä kvanttimuuntajia suunnitellaan ja analysoidaan yksityiskohtaisesti laajentamalla uusinta klassista muuntajahermoverkkoarkkitehtuuria, joiden tiedetään olevan erittäin tehokkaita luonnollisen kielen käsittelyssä ja kuva-analyysissä. Edellisen työn pohjalta, jossa käytetään parametroituja kvanttipiirejä tiedon lataamiseen ja ortogonaalisia hermokerroksia, esittelemme kolmen tyyppisiä kvanttimuuntajia harjoitteluun ja päättelyyn, mukaan lukien yhdistelmämatriiseihin perustuva kvanttimuuntaja, joka takaa kvanttihuomiomekanismin teoreettisen edun. verrattuna klassiseen vastineeseensa sekä asymptoottisen ajoajan että malliparametrien lukumäärän suhteen. Nämä kvanttiarkkitehtuurit voidaan rakentaa käyttämällä matalia kvanttipiirejä ja tuottaa laadullisesti erilaisia ​​luokitusmalleja. Kolme ehdotettua kvanttihuomiokerrosta vaihtelevat spektrillä klassisten muuntajien tarkkaan seuraamisen ja enemmän kvanttiominaisuuksien välillä. Kvanttimuuntajan rakennuspalikoihin ehdotamme uutta menetelmää matriisin lataamiseen kvanttitiloihin sekä kahta uutta koulutettavaa kvanttiortogonaalista kerrosta, jotka voidaan mukauttaa kvanttitietokoneiden eri yhteyksien ja laadun mukaan. Suoritimme kvanttimuuntajien laajoja simulaatioita tavallisilla lääketieteellisillä kuvaaineistoilla, jotka osoittivat kilpailukykyisesti ja toisinaan parempaa suorituskykyä verrattuna klassisiin vertailuarvoihin, mukaan lukien luokkansa parhaat klassiset näkömuuntajat. Näillä pienimuotoisilla tietojoukoilla kouluttamamme kvanttimuuntajat vaativat vähemmän parametreja verrattuna tavanomaisiin klassisiin vertailuarvoihin. Lopuksi toteutimme kvanttimuuntajamme suprajohtaviin kvanttitietokoneisiin ja saimme rohkaisevia tuloksia jopa kuudelle kubittikokeelle.

Tässä tutkimuksessa tutkimme kvanttilaskennan mahdollisuuksia parantaa hermoverkkoarkkitehtuuria keskittyen muuntajiin, jotka tunnetaan tehokkuudestaan ​​kielenkäsittelyssä ja kuva-analyysissä. Esittelemme kolmen tyyppisiä kvanttimuuntajia, jotka hyödyntävät parametroituja kvanttipiirejä ja ortogonaalisia hermokerroksia. Nämä kvanttimuuntajat voisivat joillakin oletuksilla (esim. laitteistoliitettävyys) tarjota etuja klassisiin vastineisiin verrattuna sekä ajonaikaisten että malliparametrien suhteen. Näiden kvanttipiirien luomiseksi esittelemme uuden menetelmän matriisien lataamiseen kvanttitiloihin ja esittelemme kaksi koulutettavaa kvanttiortogonaalista kerrosta, jotka voidaan mukauttaa erilaisiin kvanttitietokoneiden ominaisuuksiin. Ne vaativat matalia kvanttipiirejä ja voivat auttaa luomaan luokitusmalleja, joilla on ainutlaatuiset ominaisuudet. Laajat simulaatiot lääketieteellisille kuvatietosarjoille osoittavat kilpailukykyisen suorituskyvyn verrattuna klassisiin vertailuarvoihin, jopa pienemmillä parametreilla. Lisäksi suprajohtavilla kvanttitietokoneilla tehdyt kokeet tuottavat lupaavia tuloksia.

► BibTeX-tiedot

► Viitteet

[1] Jacob Biamonte, Peter Wittek, Nicola Pancotti, Patrick Rebentrost, Nathan Wiebe ja Seth Lloyd. "Kvanttikoneoppiminen". Nature 549, 195–202 (2017).
https: / / doi.org/ 10.1038 / nature23474

[2] Iris Cong, Soonwon Choi ja Mikhail D Lukin. "Kvanttikonvoluutiohermoverkot". Nature Physics 15, 1273–1278 (2019).
https:/​/​doi.org/​10.1038/​s41567-019-0648-8

[3] Kishor Bharti, Alba Cervera-Lierta, Thi Ha Kyaw, Tobias Haug, Sumner Alperin-Lea, Abhinav Anand, Matthias Degroote, Hermanni Heimonen, Jakob S Kottmann, Tim Menke ym. "Meteliäiset keskikokoiset kvanttialgoritmit". Reviews of Modern Physics 94, 015004 (2022).
https: / / doi.org/ 10.1103 / RevModPhys.94.015004

[4] Marco Cerezo, Andrew Arrasmith, Ryan Babbush, Simon C Benjamin, Suguru Endo, Keisuke Fujii, Jarrod R McClean, Kosuke Mitarai, Xiao Yuan, Lukasz Cincio jne. "Variaatiokvanttialgoritmit". Nature Reviews Physics 3, 625–644 (2021).
https:/​/​doi.org/​10.1038/​s42254-021-00348-9

[5] Jonas Landman, Natansh Mathur, Yun Yvonna Li, Martin Strahm, Skander Kazdaghli, Anupam Prakash ja Iordanis Kerenidis. "Kvanttimenetelmät hermoverkkoihin ja sovellus lääketieteelliseen kuvien luokitukseen". Quantum 6, 881 (2022).
https:/​/​doi.org/​10.22331/​q-2022-12-22-881

[6] Bobak Kiani, Randall Balestriero, Yann LeCun ja Seth Lloyd. "projunn: Tehokas menetelmä syvien verkkojen harjoittamiseen unitaarisilla matriiseilla". Advances in Neural Information Processing Systems 35, 14448–14463 (2022).

[7] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N Gomez, Łukasz Kaiser ja Illia Polosukhin. "Huomio on kaikki mitä tarvitset". Neuraalitietojen käsittelyjärjestelmien kehitys 30 (2017).

[8] Jacob Devlin, Ming-Wei Chang, Kenton Lee ja Kristina Toutanova. "Bert: Syvien kaksisuuntaisten muuntajien esikoulutus kielen ymmärtämiseen" (2018).

[9] Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit ja Neil Houlsby. "Kuva on 16 × 16 sanan arvoinen: Transformers for kuvantunnistus mittakaavassa". International Conference on Learning Representations (2021). url: openreview.net/​forum?id=YicbFdNTTy.
https://​/​openreview.net/​forum?id=YicbFdNTTy

[10] Yi Tay, Mostafa Dehghani, Dara Bahri ja Donald Metzler. "Tehokkaat muuntajat: tutkimus". ACM Computing Surveys (CSUR) (2020).
https: / / doi.org/ 10.1145 / +3530811

[11] Dzmitry Bahdanau, Kyunghyun Cho ja Yoshua Bengio. "Neuraalinen konekäännös yhteisesti oppimalla tasaamaan ja kääntämään" (2016). arXiv:1409.0473 [cs, stat].
arXiv: 1409.0473

[12] J. Schmidhuber. "Oppimisen monimutkaisuuden ja aikavaihtelevien muuttujien lukumäärän välisen suhteen vähentäminen täysin toistuvissa verkoissa". Teoksessa Stan Gielen ja Bert Kappen, toimittajat, ICANN '93. Sivut 460-463. Lontoo (1993). Springer.
https:/​/​doi.org/​10.1007/​978-1-4471-2063-6_110

[13] Jürgen Schmidhuber. "Oppiminen hallitsemaan nopeita muistoja: vaihtoehto dynaamisille toistuville verkoille". Neural Computation 4, 131-139 (1992).
https: / / doi.org/ 10.1162 / neco.1992.4.1.131

[14] Peter Cha, Paul Ginsparg, Felix Wu, Juan Carrasquilla, Peter L McMahon ja Eun-Ah Kim. "Huomioon perustuva kvanttitomografia". Koneoppiminen: Science and Technology 3, 01LT01 (2021).
https://​/​doi.org/​10.1088/​2632-2153/​ac362b

[15] Riccardo Di Sipio, Jia-Hong Huang, Samuel Yen-Chi Chen, Stefano Mangini ja Marcel Worring. "Kvantti luonnollisen kielen prosessoinnin kynnyksellä". ICASSP 2022-2022 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). Sivut 8612–8616. IEEE (2022).
https://​/​doi.org/​10.1109/​ICASSP43922.2022.9747675

[16] Guangxi Li, Xuanqiang Zhao ja Xin Wang. "Kvantti itsetarkkailuhermoverkot tekstin luokitteluun" (2022).

[17] Fabio Sanches, Sean Weinberg, Takanori Ide ja Kazumitsu Kamiya. "Oikosulkupiirit vahvistetussa oppimispolitiikassa ajoneuvojen reititysongelmassa". Physical Review A 105, 062403 (2022).
https: / / doi.org/ 10.1103 / PhysRevA.105.062403

[18] YuanFu Yang ja Min Sun. "Puolijohdevikojen havaitseminen hybridiklassis-kvantti-syväoppimisen avulla". CVPRPPages 2313–2322 (2022).
https://​/​doi.org/​10.1109/​CVPR52688.2022.00236

[19] Maxwell Henderson, Samriddhi Shakya, Shashindra Pradhan ja Tristan Cook. "Kvanvolutionaaliset hermoverkot: kuvantunnistuksen tehostaminen kvanttipiireillä". Quantum Machine Intelligence 2, 1–9 (2020).
https: / / doi.org/ 10.1007 / s42484-020-00012-y

[20] Edward Farhi ja Hartmut Neven. "Luokittelu kvanttihermoverkkojen kanssa lähiajan prosessoreissa" (2018). url: doi.org/​10.48550/​arXiv.1802.06002.
https://​/​doi.org/​10.48550/​arXiv.1802.06002

[21] Kosuke Mitarai, Makoto Negoro, Masahiro Kitagawa ja Keisuke Fujii. "Kvanttipiirin oppiminen". Physical Review A 98, 032309 (2018).
https: / / doi.org/ 10.1103 / PhysRevA.98.032309

[22] Kui Jia, Shuai Li, Yuxin Wen, Tongliang Liu ja Dacheng Tao. "Ortogonaaliset syvät neuroverkot". IEEE-tapahtumat kuvioanalyysistä ja koneälystä (2019).
https: / / doi.org/ 10.1109 / TPAMI.2019.2948352

[23] Roger A Horn ja Charles R Johnson. "Matriisianalyysi". Cambridgen yliopiston lehdistö. (2012).
https: / / doi.org/ 10.1017 / CBO9780511810817

[24] Iordanis Kerenidis ja Anupam Prakash. "Kvanttikoneoppiminen aliavaruuden tiloilla" (2022).

[25] Brooks Foxen, Charles Neill, Andrew Dunsworth, Pedram Roushan, Ben Chiaro, Anthony Megrant, Julian Kelly, Zijun Chen, Kevin Satzinger, Rami Barends jne. "Esitetään jatkuva kahden kubitin porttien sarja lähiajan kvanttialgoritmeille". Physical Review Letters 125, 120504 (2020).
https: / / doi.org/ 10.1103 / PhysRevLett.125.120504

[26] Sonika Johri, Shantanu Debnath, Avinash Mocherla, Alexandros Singk, Anupam Prakash, Jungsang Kim ja Iordanis Kerenidis. "Lähimmän sentroidin luokitus loukkuun jääneessä ionikvanttitietokoneessa". npj Quantum Information 7, 122 (2021).
https:/​/​doi.org/​10.1038/​s41534-021-00456-5

[27] James W Cooley ja John W Tukey. "Algoritmi monimutkaisten Fourier-sarjojen konelaskentaan". Laskennan matematiikka 19, 297–301 (1965).
https:/​/​doi.org/​10.1090/​S0025-5718-1965-0178586-1

[28] Li Jing, Yichen Shen, Tena Dubcek, John Peurifoy, Scott A. Skirlo, Yann LeCun, Max Tegmark ja Marin Soljacic. Viritettävät tehokkaat unitaariset hermoverkot (eunn) ja niiden soveltaminen rnns-verkkoihin. Kansainvälisessä koneoppimiskonferenssissa. (2016). url: api.semanticscholar.org/​CorpusID:5287947.
https://​/​api.semanticscholar.org/​CorpusID:5287947

[29] Léo Monbroussou, Jonas Landman, Alex B. Grilo, Romain Kukla ja Elham Kashefi. "Hamming-weight säilyttävien kvanttipiirien koulutettavuus ja ilmeisyys koneoppimiseen" (2023). arXiv:2309.15547.
arXiv: 2309.15547

[30] Enrico Fontana, Dylan Herman, Shouvanik Chakrabarti, Niraj Kumar, Romina Yalovetzky, Jamie Heredge, Shree Hari Sureshbabu ja Marco Pistoia. "Adjoint on kaikki mitä tarvitset: karujen tasangoiden karakterisointi kvanttiansätzessä" (2023). arXiv:2309.07902.
arXiv: 2309.07902

[31] Michael Ragone, Bojko N. Bakalov, Frédéric Sauvage, Alexander F. Kemper, Carlos Ortiz Marrero, Martin Larocca ja M. Cerezo. "Yhdistetty teoria karuista tasangoista syville parametroiduille kvanttipiireille" (2023). arXiv:2309.09342.
arXiv: 2309.09342

[32] Xuchen You ja Xiaodi Wu. "Eksponentiaalisesti monta paikallista minimiä kvanttihermoverkoissa". Kansainvälisessä koneoppimiskonferenssissa. Sivut 12144–12155. PMLR (2021).

[33] Eric R. Anschuetz ja Bobak Toussi Kiani. "Kvanttivariaatioalgoritmit ovat täynnä ansoja". Nature Communications 13 (2022).
https:/​/​doi.org/​10.1038/​s41467-022-35364-5

[34] Ilya O. Tolstikhin, Neil Houlsby, Alexander Kolesnikov, Lucas Beyer, Xiaohua Zhai, Thomas Unterthiner, Jessica Yung, Daniel Keysers, Jakob Uszkoreit, Mario Lucic ja Alexey Dosovitskiy. "Mlp-mixer: All-mlp-arkkitehtuuri visioon". NeurIPSissä. (2021).

[35] Jiancheng Yang, Rui Shi ja Bingbing Ni. "Medmnist-luokitus kymmenenottelu: Kevyt automl-vertailu lääketieteelliseen kuva-analyysiin" (2020).
https://​/​doi.org/​10.1109/​ISBI48211.2021.9434062

[36] Jiancheng Yang, Rui Shi, Donglai Wei, Zequan Liu, Lin Zhao, Bilian Ke, Hanspeter Pfister ja Bingbing Ni. "Medmnist v2 - laajamittainen kevyt vertailuarvo 2D- ja 3D-biolääketieteellisille kuville." Scientific Data 10, 41 (2023).
https:/​/​doi.org/​10.1038/​s41597-022-01721-8

[37] Angelos Katharopoulos, Apoorv Vyas, Nikolaos Pappas ja François Fleuret. "Muuntajat ovat rnns: Nopeat autoregressiiviset muuntajat lineaarisella huomiolla". Kansainvälisessä koneoppimiskonferenssissa. Sivut 5156–5165. PMLR (2020).

[38] James Bradbury, Roy Frostig, Peter Hawkins, Matthew James Johnson, Chris Leary, Dougal Maclaurin, George Necula, Adam Paszke, Jake VanderPlas, Skye Wanderman-Milne ja Qiao Zhang. "JAX: Python+NumPy-ohjelmien käännettävät muunnokset". Github (2018). URL-osoite: http://​/​github.com/​google/​jax.
http: / / github.com/ google / jax

[39] Diederik P. Kingma ja Jimmy Ba. "Adam: Menetelmä stokastiseen optimointiin". CORR abs/​1412.6980 (2015).

[40] Hyeonwoo Noh, Tackgeun You, Jonghwan Mun ja Bohyung Han. "Syvien hermoverkkojen säänteleminen kohinalla: sen tulkinta ja optimointi". NeurIPS (2017).

[41] Xue Ying. "Yleissovituksesta ja sen ratkaisuista". Julkaisussa Journal of Physics: Conference Series. Osa 1168, sivu 022022. IOP Publishing (2019).
https:/​/​doi.org/​10.1088/​1742-6596/​1168/​2/​022022

Viitattu

[1] David Peral García, Juan Cruz-Benito ja Francisco José García-Peñalvo, "Systematic Literature Review: Quantum Machine Learning and its applications", arXiv: 2201.04093, (2022).

[2] El Amine Cherrat, Snehal Raj, Iordanis Kerenidis, Abhishek Shekhar, Ben Wood, Jon Dee, Shouvanik Chakrabarti, Richard Chen, Dylan Herman, Shaohan Hu, Pierre Minssen, Ruslan Shaydulin, Yue Sun, Romina Yalovetzky ja Marco Pistoia, "Quantum Deep Hedging", Kvantti 7, 1191 (2023).

[3] Léo Monbroussou, Jonas Landman, Alex B. Grilo, Romain Kukla ja Elham Kashefi, Trainability and Expressivity of Hamming-Weight Preserving Quantum Circuits for Machine Learning, arXiv: 2309.15547, (2023).

[4] Sohum Thakkar, Skander Kazdaghli, Natansh Mathur, Iordanis Kerenidis, André J. Ferreira-Martins ja Samurai Brito, "Parannettu talousennuste kvanttikoneoppimisen kautta", arXiv: 2306.12965, (2023).

[5] Jason Iaconis ja Sonika Johri, "Tensor Network Based Efficient Quantum Data Loading of Images", arXiv: 2310.05897, (2023).

[6] Nishant Jain, Jonas Landman, Natansh Mathur ja Iordanis Kerenidis, "Quantum Fourier Networks for Solving Parametric PDE", arXiv: 2306.15415, (2023).

[7] Daniel Mastropietro, Georgios Korpas, Vjatseslav Kungurtsev ja Jakub Marecek, "Fleming-Viot auttaa nopeuttamaan variaatiokvanttialgoritmeja karujen tasangojen läsnä ollessa", arXiv: 2311.18090, (2023).

[8] Aliza U. Siddiqui, Kaitlin Gili ja Chris Ballance, "Stressing Out Modern Quantum Hardware: Performance Evaluation and Execution Insights", arXiv: 2401.13793, (2024).

Yllä olevat sitaatit ovat peräisin SAO: n ja NASA: n mainokset (viimeksi päivitetty onnistuneesti 2024-02-22 13:37:43). Lista voi olla puutteellinen, koska kaikki julkaisijat eivät tarjoa sopivia ja täydellisiä viittaustietoja.

Ei voitu noutaa Crossref siteeratut tiedot viimeisen yrityksen aikana 2024-02-22 13:37:41: Ei voitu noutaa viittauksia 10.22331 / q-2024-02-22-1265 mainittuihin tietoihin Crossrefiltä. Tämä on normaalia, jos DOI rekisteröitiin äskettäin.

spot_img

Uusin älykkyys

spot_img