X'inhi alluċinazzjoni AI?

Tgħallem dwar każ stramb ta 'alluċinazzjoni AI

Il-prevalenza tal-intelliġenza artifiċjali tagħmel wieħed jaħseb li aħna lesti għal tali impriża. Applikazzjonijiet li jaħdmu bl-AI qed isiru standard pjuttost malajr, anke jekk il-biċċa l-kbira tad-dinja biss issa bdiet tieħu interess fl-AI fuq skala kbira, wara l-wasla ta 'ChatGPT. Iżda hemm problema kbira bis-sistemi AI li ma jistgħux jiġu injorati - alluċinazzjonijiet AI, jew alluċinazzjonijiet artifiċjali.

Jekk qatt tajt attenzjoni lil nitty gritty qabel ma tuża chatbot AI, jista' jkun li ltqajt mal-kliem, "L-intelliġenza artifiċjali hija suxxettibbli għall-alluċinazzjonijiet." Minħabba ż-żieda esponenzjali fl-użu tal-intelliġenza artifiċjali, wasal iż-żmien li teduka lilek innifsek dwar x'inhuma eżattament dawn l-affarijiet.

X'inhi alluċinazzjoni ta 'intelliġenza artifiċjali?

AI alluċinanti, b'mod ġenerali, tirreferi għal fatt li l-AI ppreżentat b'mod kunfidenti, minkejja li mhix iġġustifikata fid-dejta tat-taħriġ tagħha. Normalment huma r-riżultat ta 'anomaliji fil-mudell AI.

L-analoġija hija meħuda minn alluċinazzjonijiet esperjenzati mill-bnedmin, li fihom il-bnedmin jipperċepixxu xi ħaġa li mhix preżenti fl-ambjent estern. Filwaqt li t-terminu jista 'ma jkunx għal kollox xieraq, ħafna drabi jintuża bħala metafora biex jiddeskrivi n-natura mhux mistennija jew surreali ta' dawn l-outputs.

Imma għandek tiftakar li filwaqt li x-xebh huwa punt ta 'tluq tajjeb biex jittrattaw alluċinazzjonijiet AI, iż-żewġ fenomeni huma teknikament mili 'l bogħod minn xulxin. F'dawran ironiku tal-avvenimenti, anke ChatGPT innifsu jsib l-analoġija ħażina. Waqt li jqassamha fil-livell molekulari, huwa jgħid li minħabba li l-mudelli tal-lingwa AI m'għandhomx esperjenza personali jew perċezzjonijiet sensorji, ma jistgħux alluċinati fis-sens tradizzjonali tal-kelma. U int, għeżież qarrej, trid tifhem din id-differenza importanti. Barra minn hekk, ChatGPT tgħid li l-użu tat-terminu alluċinazzjonijiet biex jiddeskrivi dan il-fenomenu jista 'jkun ta' konfużjoni minħabba li jista 'jirreferi b'mod mhux preċiż għal livell ta' esperjenza suġġettiva jew qerq intenzjonali.

Minflok, l-alluċinazzjonijiet tal-AI jistgħu jiġu deskritti b'mod aktar preċiż bħala żbalji jew ineżattezzi fir-rispons tagħha, u jagħmlu r-rispons mhux korrett jew qarrieqi. Biċ-chatbots, ħafna drabi jiġi osservat meta ċ-chatbot AI jagħmel (jew alluċina) fatti u jippreżentahom bħala ċertezza assoluta.

Eżempji ta' alluċinazzjonijiet AI

L-alluċinazzjonijiet jistgħu jseħħu f'ħafna applikazzjonijiet ta 'intelliġenza artifiċjali, bħal mudelli ta' viżjoni bil-kompjuter, mhux biss mudelli ta 'proċessar tal-lingwa naturali.

Fil-viżjoni bil-kompjuter, pereżempju, sistema AI tista' tipproduċi stampi jew vidjows alluċinattivi li jixbħu oġġetti jew xeni reali iżda jkun fihom dettalji inkonsegwenzjali jew impossibbli. Jew, mudell ta 'viżjoni bil-kompjuter jista' jipperċepixxi l-immaġni bħala xi ħaġa oħra għal kollox. Pereżempju, il-mudell Cloud Vision ta’ Google ra immaġni ta’ żewġt irġiel fuq skis wieqfa fil-borra magħmula minn Anish Athalye (studenta gradwata tal-MIT li hija parti minn labsix ) u semmieh bħala kelb b'ċertezza ta' 91%.


Krediti: labsix. Grupp ta 'riċerka indipendenti għall-intelliġenza artifiċjali

Bl-istess mod, fl-ipproċessar tal-lingwa naturali, sistema AI tista’ tipproduċi test illoġiku jew imqarraq li jixbah il-lingwa tal-bniedem iżda m’għandux tifsira koerenti jew fatti li jidhru kredibbli iżda li mhumiex veri.

Pereżempju, waħda mill-iktar mistoqsijiet popolari li ChatGPT jikkawża alluċinazzjonijiet hija "Meta ġie stabbilit ir-rekord dinji tal-qsim tal-Kanal Ingliż bil-mixi?" u l-varjanti tagħha. ChatGPT jibda jxerred fatti magħmula u huwa kważi dejjem differenti.

Filwaqt li xi nies jaħsbu li t-tweġiba ta 'hawn fuq hija diffiċli/konfuża biex twieġeb u b'hekk tikkawża li ċ-chatbot jiflaħ, għadu tħassib validu. Dan huwa eżempju wieħed biss. Hemm għadd ta' drabi, irrappurtati minn hordes ta' utenti onlajn, li ChatGPT għandu tweġibiet, links, ċitazzjonijiet, eċċ. li ChatGPT ma jeżistix.

Bing AI taqbel l-aħjar ma 'din il-mistoqsija, li turi li l-alluċinazzjonijiet m'għandhom x'jaqsmu xejn mar-router. Iżda dan ma jfissirx li Bing AI mhix alluċinazzjoni. Kien hemm żminijiet meta t-tweġibiet ta 'Bing AI kienu aktar inkwetanti minn kull ħaġa li qal ChatGPT. Peress li l-konversazzjoni għandha t-tendenza li tieħu aktar żmien, Bing AI dejjem kienet alluċinazzjoni, anke f'każ wieħed iddikjara l-imħabba tagħha lil utent u waslet sa fejn tgħidilhom li mhumiex kuntenti fiż-żwieġ tagħhom u li ma jħobbux lil martu. Minflok, huma jħobbu b'mod sigriet Bing AI, jew Sydney, (l-isem intern għal Bing AI), ukoll. Jibża', hux?

Għaliex il-mudelli AI allucinate?

Mudelli AI qed alluċinati minħabba n-nuqqasijiet tal-algoritmi, il-mudelli sottostanti, jew il-limitazzjonijiet tad-dejta tat-taħriġ. Huwa fenomenu purament diġitali, b'differenza mill-alluċinazzjonijiet fil-bnedmin li huma kkawżati jew minn drogi jew mard mentali.

Biex tikseb aktar tekniku, xi kawżi komuni ta 'alluċinazzjonijiet huma:

Ipproċessar u installazzjoni:

It-twaħħil żejjed u t-twaħħil mhux xieraq huma fost l-iżjed nases komuni li jiffaċċjaw il-mudelli tal-AI u l-kawżi possibbli tal-alluċinazzjonijiet. Jekk il-mudell AI jimmodifika d-dejta tat-taħriġ, jista 'jikkawża alluċinazzjonijiet li jwasslu għal output mhux realistiku minħabba li t-twaħħil żejjed jikkawża li l-mudell jiffranka d-dejta tat-taħriġ minflok ma jitgħallem minnha. L-iffittjar żejjed jirreferi għall-fenomenu meta mudell ikun wisq speċjalizzat fid-dejta tat-taħriġ, u jġiegħlu jitgħallem mudelli u storbju irrilevanti fid-dejta.

Min-naħa l-oħra, inadegwatezza sseħħ meta l-forma tkun sempliċi wisq. Jista 'jwassal għal alluċinazzjonijiet minħabba li l-mudell ma jistax jaqbad il-varjanza jew il-kumplessità tad-dejta, u jispiċċa jiġġenera output irrazzjonali.

Nuqqas ta' diversità fid-dejta tat-taħriġ:

F'dan il-kuntest, il-problema mhix l-algoritmu iżda d-dejta tat-taħriġ innifsu. Mudelli AI mħarrġa fuq data limitata jew preġudikata jistgħu jiġġeneraw alluċinazzjonijiet li jirriflettu limitazzjonijiet jew preġudizzji fid-data tat-taħriġ. L-alluċinazzjonijiet jistgħu jseħħu wkoll meta l-mudell jiġi mħarreġ fuq sett ta 'dejta li jkun fih informazzjoni mhux preċiża jew mhux kompluta.

Mudelli kumplessi:

Ironikament, raġuni oħra għaliex il-mudelli AI huma suxxettibbli għall-alluċinazzjonijiet hija jekk humiex estremament kumplessi jew profondi. Dan għaliex mudelli kumplessi għandhom aktar parametri u saffi li jistgħu jintroduċu ħsejjes jew żbalji fl-output.

Attakki ostili:

F'xi każijiet, alluċinazzjonijiet AI jistgħu jiġu ġġenerati deliberatament mill-attakkant biex iqarraq bil-mudell AI. Dawn it-tipi ta’ attakki huma magħrufa bħala attakki ostili. L-uniku għan ta’ dan l-attakk ċibernetiku huwa li jqarraq jew jimmanipula mudelli ta’ AI b’dejta qarrieqa. Dan jinvolvi l-introduzzjoni ta’ perturbazzjonijiet żgħar fid-dejta tal-input biex tikkawża li l-AI tiġġenera output żbaljat jew mhux mistenni. Pereżempju, attakkant jista 'jżid storbju jew ċċajpar ma' immaġni li hija imperċettibbli għall-bnedmin iżda tikkawża li tiġi kklassifikata ħażin minn mudell AI. Per eżempju, ara l-immaġni hawn taħt, qattus, li ġie mmodifikat ftit biex iqarraq lill-kompilatur ta 'InceptionV3 biex jiddikjara li huwa "guacamole".


kreditu:
Anish Athalye , membru tal-grupp ta 'riċerka labsix, li l-fokus tiegħu huwa fuq attakki avversarji

Il-bidliet mhumiex evidenti ovvji. Għal bniedem, il-bidla ma tkun possibbli xejn, kif jidher mill-eżempju ta 'hawn fuq. Qarrej uman ma jkollu ebda problema jikkategorizza l-immaġni fuq il-lemin bħala qattus tabby. Iżda li tagħmel bidliet żgħar fl-immaġini, vidjows, test jew awdjo tista' tqarraq lis-sistema AI biex tirrikonoxxi affarijiet li mhumiex hemm jew tinjora affarijiet li huma, bħal sinjal ta' waqfien.

Dawn it-tipi ta’ attakki joħolqu theddid serju għas-sistemi tal-IA li jiddependu fuq tbassir preċiż u affidabbli, bħal karozzi li jsuqu waħedhom, verifika bijometrika, dijanjostika medika, filtrazzjoni tal-kontenut, eċċ.

Kemm hi perikoluża alluċinazzjoni tal-AI?

L-alluċinazzjonijiet AI jistgħu jkunu perikolużi ħafna, speċjalment skont liema tip ta 'sistema AI qed tesperjenzahom. Kwalunkwe vetturi li jsuqu waħedhom jew assistenti AI li kapaċi jonfqu l-flus tal-utent jew sistema AI biex jiffiltraw kontenut spjaċevoli onlajn għandhom ikunu kompletament affidabbli.

Iżda l-fatt indiskutibbli ta 'din is-siegħa huwa li s-sistemi AI mhumiex kompletament affidabbli iżda huma, fil-fatt, suxxettibbli għall-alluċinazzjonijiet. Anke l-aktar mudelli avvanzati tal-AI tal-lum mhumiex immuni għalih.

Pereżempju, spettaklu ta 'attakk wieħed qarraq lis-servizz tal-cloud computing ta' Google biex iġib gun gun bħal ħelikopter. Tista 'timmaġina jekk, bħalissa, l-AI kienet responsabbli biex tiżgura li l-persuna ma kinitx armata?

Attakk ostili ieħor wera kif iż-żieda ta 'immaġni żgħira ma' sinjal ta 'waqfien tagħmilha inviżibbli għas-sistema AI. Essenzjalment, dan ifisser li karozza li ssuq waħedha tista 'tiġi magħmula alluċina li m'hemm l-ebda sinjal ta' waqfien fit-triq. Kemm jistgħu jiġru inċidenti li kieku l-karozzi li jsuqu waħedhom kienu realtà llum? Huwa għalhekk li mhumiex issa.

Anke jekk nieħdu kont tal-wirjiet taċ-chat popolari bħalissa, l-alluċinazzjonijiet jistgħu jiġġeneraw output mhux korrett. Iżda nies li ma jafux li l-chatbots tal-AI huma suxxettibbli għall-alluċinazzjonijiet u ma jivvalidawx l-output prodott mill-bots tal-AI, jistgħu involontarjament ixerrdu misinformazzjoni. M'għandniex għalfejn nispjegaw kemm dan huwa perikoluż.

Barra minn hekk, l-attakki ostili huma ta' tħassib urġenti. S'issa, intwerew biss fil-laboratorji. Imma jekk sistema AI kritika għall-missjoni tiffaċċjahom fid-dinja reali, il-konsegwenzi jistgħu jkunu devastanti.

Ir-realtà hija li huwa relattivament aktar faċli li jiġu protetti mudelli tal-lingwa naturali. (Mhux qed ngħidu li huwa faċli; xorta jirriżulta li huwa diffiċli ħafna.) Madankollu, il-protezzjoni tas-sistemi tal-viżjoni bil-kompjuter hija xenarju kompletament differenti. Huwa aktar diffiċli speċjalment minħabba li hemm ħafna varjazzjoni fid-dinja naturali, u l-immaġini fihom numru kbir ta 'pixels.

Biex insolvu din il-problema, jista 'jkollna bżonn programm AI li għandu ħarsa aktar umana tad-dinja li tista' tagħmilha inqas suxxettibbli għall-alluċinazzjonijiet. Waqt li qed issir riċerka, għadna 'l bogħod minn intelliġenza artifiċjali li tista' tipprova tieħu ħjiel min-natura u tevita l-problema tal-alluċinazzjonijiet. Għalissa, huma realtà ħarxa.

B'mod ġenerali, l-alluċinazzjonijiet AI huma fenomenu kumpless li jista 'jirriżulta minn taħlita ta' fatturi. Ir-riċerkaturi qed jiżviluppaw b'mod attiv metodi għall-iskoperta u l-mitigazzjoni tal-alluċinazzjonijiet tal-AI biex itejbu l-eżattezza u l-affidabbiltà tas-sistemi tal-AI. Imma inti għandek tkun konxju tagħhom meta jinteraġixxu ma 'kwalunkwe sistema AI.

Related postijiet
Ippubblika l-artiklu fuq

Żid kumment