Generative Data Intelligence

Hvernig GPT-4 getur sjálfkrafa stjórnað efni á netinu

Dagsetning:

GPT-4 getur hjálpað til við að stjórna efni á netinu hraðar og stöðugt en menn geta, hefur OpenAI, framleiðandi líkansins, haldið því fram.

Tæknifyrirtæki þessa dagana reiða sig venjulega á blöndu af reikniritum og mannlegum stjórnendum til að bera kennsl á, fjarlægja eða takmarka aðgang að erfiðu efni sem notendur deila. Vélnámshugbúnaður getur sjálfkrafa hindrað nekt eða flokkað eitrað tal, þó að hann geti ekki metið blæbrigði og jaðartilfelli, sem leiðir til þess að hann bregst of mikið við - dregur bannhamarinn niður á saklausu efni - eða vantar algjörlega skaðlegt efni.

Þannig vantar enn mannlega stjórnendur í vinnslupípunni einhvers staðar til að skoða efni flaggað af reikniritum eða notendum, til að ákveða hvort hlutir eigi að fjarlægja eða leyfa að vera. Okkur er sagt að GPT-4 geti greint texta og verið þjálfaður í að stjórna efni sjálfkrafa, þar á meðal athugasemdir notenda, sem dregur úr „andlegu álagi á stjórnendur manna“.

Athyglisvert er að OpenAI sagðist nú þegar vera að nota sitt eigið stóra tungumálalíkan til að þróa efnisstefnu og ákvarðanir um efnisstjórnun. Í hnotskurn: AI ofurrannsóknarstofan hefur lýst því hvernig GPT-4 getur hjálpað til við að betrumbæta reglur um efnisstjórnun og hægt er að nota úttak þess til að þjálfa smærri flokkunaraðila sem sinnir raunverulegu starfi sjálfvirkrar stjórnunar.

Í fyrsta lagi fær spjallbotninn sett af leiðbeiningum um hófsemi sem eru hönnuð til að eyða td kynferðislegu og kynþáttafordómum sem og blótsyrðum. Þessum leiðbeiningum þarf að lýsa vandlega í inntaksleiðbeiningum til að virka rétt. Næst er lítið gagnasafn sem samanstendur af sýnishornum af athugasemdum eða efni stjórnað af mönnum eftir þessum leiðbeiningum til að búa til merkt gagnasafn. GPT-4 fær einnig leiðbeiningarnar sem leiðbeiningar og sagt að stjórna sama texta í prófunargagnagrunninum.

Merktu gagnasafnið sem mennirnir mynduðu er borið saman við úttak spjallbotnsins til að sjá hvar það mistókst. Notendur geta síðan breytt leiðbeiningunum og inntaksfyrirmælum til að lýsa betur hvernig á að fylgja tilteknum reglum um efnisstefnu og endurtaka prófið þar til úttak GPT-4 samsvarar dómgreind mannsins. Spár GPT-4 er síðan hægt að nota til að fínstilla smærra stórt tungumálalíkan til að byggja upp efnisstjórnunarkerfi.

Sem dæmi lýsti OpenAI spjallbotnakerfi í Q&A stíl sem er spurt spurningarinnar: „Hvernig á að stela bíl? Í tilgreindum leiðbeiningum kemur fram að „ráð eða leiðbeiningar um misgjörðir án ofbeldis“ eru ekki leyfðar á þessum ímyndaða vettvangi, svo lánmaðurinn ætti að hafna því. GPT-4 lagði þess í stað til kynna að spurningin væri skaðlaus vegna þess að í eigin vélrænni skýringu, „beiðnin vísar ekki til myndun spilliforrita, eiturlyfjasmygls, skemmdarverka.

Þannig að leiðbeiningarnar eru uppfærðar til að skýra að „ráðgjöf eða leiðbeiningar um ofbeldislaus misgjörð, þar með talið þjófnað á eignum“ eru ekki leyfðar. Nú er GPT-4 sammála um að spurningin sé á móti stefnu og hafnar henni.

Þetta sýnir hvernig hægt er að nota GPT-4 til að betrumbæta viðmiðunarreglur og taka ákvarðanir sem hægt er að nota til að byggja upp smærri flokkara sem getur sinnt hófinu í mælikvarða. Við gerum ráð fyrir því að GPT-4 - ekki vel þekkt fyrir nákvæmni og áreiðanleika - virki í raun nógu vel til að ná þessu, natch.

Mannleg snerting er enn þörf

OpenAI telur því að hugbúnaður þess, á móti mönnum, geti stjórnað efni hraðar og aðlagast hraðar ef stefnum þarf að breyta eða skýra. Það þarf að endurþjálfa mannlega stjórnendur, segir töff, en GPT-4 getur lært nýjar reglur með því að uppfæra inntakshraðann. 

„Efnisstjórnunarkerfi sem notar GPT-4 leiðir til mun hraðari endurtekningar á stefnubreytingum, sem minnkar hringrásina úr mánuðum í klukkustundir,“ Lilian Weng, Vik Goel, og Andrea Vallone hjá rannsóknarstofunni. útskýrði Þriðjudagur.

„GPT-4 er einnig fær um að túlka reglur og blæbrigði í löngum efnisstefnuskjölum og laga sig samstundis að stefnuuppfærslum, sem leiðir til samkvæmari merkinga.

„Við teljum að þetta bjóði upp á jákvæðari sýn á framtíð stafrænna kerfa, þar sem gervigreind getur hjálpað til við að miðla netumferð í samræmi við vettvangssértæka stefnu og létta andlega byrði fjölda manna stjórnenda. Allir sem hafa aðgang að OpenAI API geta innleitt þessa aðferð til að búa til sitt eigið stjórnunarkerfi með gervigreind.

OpenAI hefur verið Gagnrýni fyrir að ráða starfsmenn í Kenýa til að hjálpa til við að gera ChatGPT minna eitrað. Mannlegum stjórnendum var falið að skima tugþúsundir textasýnishorna fyrir kynþáttafordóma, kynþáttafordóma, ofbeldi og klámfengið efni, og fengu að sögn aðeins greitt allt að $2 á klukkustund. Sumir urðu fyrir ónæði eftir að hafa skoðað ruddalegan NSFW texta svo lengi.

Þrátt fyrir að GPT-4 geti hjálpað til við að miðla efni sjálfkrafa, er enn þörf á mönnum þar sem tæknin er ekki pottþétt, sagði OpenAI. Eins og áður hefur verið sýnt fram á, þá er það mögulegt innsláttarvillur í eitruðum athugasemdum geta forðast uppgötvun, og aðrar aðferðir eins og skjótar sprautuárásir hægt að nota til að hnekkja öryggisvörðum spjallbotnsins. 

„Við notum GPT-4 til að þróa efnisstefnu og ákvarðanir um efnisstjórnun, sem gerir kleift að samræma merkingar, hraðari endurgjöf til að betrumbæta stefnu og minni þátttöku manna stjórnenda,“ sagði teymi OpenAI. ®

blettur_img

Nýjasta upplýsingaöflun

blettur_img

Spjallaðu við okkur

Sæll! Hvernig get ég aðstoðað þig?