Stol ikke på ChatGPT til matematik

Stol ikke på ChatGPT til matematik:

Det er afgørende at validere alt, hvad der kommer fra ChatGPT أو bingchat أو google bard eller nogen Endnu et chatprogram . Tro det eller ej, det gælder især matematik. Gå ikke ud fra, at ChatGPT kan regne ud. Moderne AI-chatbots er bedre til kreativ skrivning, end de er til aritmetik og aritmetik.

Chatbots er ikke computere

Som altid, når du arbejder med kunstig intelligens, er agil teknik vigtig. Du ønsker at give en masse information og udforme din tekstprompt omhyggeligt for at få et godt svar.

Men selvom du får et fejlfrit stykke logik i svaret, stirrer du måske midt i det og indser, at ChatGPT lavede en fejl i retning af 1 + 1 = 3. ChatGPT savner dog ofte logik - og det er ikke godt ved at tælle enten.

At bede en stor sprogmodel om at fungere som lommeregner er som at bede en lommeregner om at skrive et teaterstykke – hvad forventede du? Det er ikke, hvad det er.

Vores hovedbudskab her: Det er afgørende at dobbelttjekke eller tredoble AI's funktion. Det gælder mere end bare matematik.

Her er nogle eksempler på, at ChatGPT falder pladask. Vi brugte ChatGPT Den gratis gpt-3.5-baserede turbo til denne artikel også bingchat , som er baseret på GPT 4. Så selvom ChatGPT Plus med GPT 4 vil være bedre end ChatGPTs gratis version, bliver du nødt til at opleve disse problemer selv med en chatbot med et højt niveau af AI.

ChatGPT kan ikke beregnes

ChatGPT og Bing ser ikke ud til at være pålidelige til at beregne varelister. Det virker som en væsentlig opgave – men regn ikke med at få et troværdigt svar.

Vi forsynede ChatGPT med en kolonne med tal og bad den om at tælle forekomster af et tal. (Du behøver ikke selv at tælle: det rigtige svar er, at tallet 100 optræder 14 gange.)

Selv når du retter ChatGPT og undskylder og giver et nyt svar, får du ikke nødvendigvis et korrekt svar.

ChatGPT opfører sig ofte som en, der febrilsk forsøger at dække over en fejl og giver dig et svar - ethvert svar - for at få dig væk fra ryggen. Det er faktisk meget naturtro!

Som sædvanlig er et af de store problemer, hvor absolut sikker ChatGPT er om alle sine svar, selv når det skyder dig med forskellige svar.

Vi prøvede GPT 4 via Bing Chat fra Microsoft og stødte på et lignende problem. Bing besluttede at skrive noget Python-kode for at løse dette vanskelige problem, men det lykkedes heller ikke at få det rigtige svar. (Bing har faktisk ikke kørt koden.)

ChatGPT kæmper med matematiske logiske problemer

Hvis du giver ChatGPT et "ordproblem" i matematik, vil du ofte se mærkelige drejninger af logik, der ikke vil give dig det rigtige svar.

ChatGPT har givet os et frugtbaseret matematisk problem, der afspejler, hvad nogen kunne spørge, hvis de forsøgte at rebalancere en investeringsportefølje ved at allokere et bidrag mellem forskellige fonde – eller måske bare købe en masse frugt og holde sig til en frugtbaseret portefølje 

ChatGPT starter fint, men bliver hurtigt til useriøs logik og vil ikke give et korrekt svar.

Du behøver ikke følge hver tur for at indse, at det endelige svar er forkert.

ChatGPT vil ofte også søge og diskutere med dig om deres svar. (Igen, dette er meget menneskelignende adfærd.)

I dette tilfælde, argumenterede ChatGPT, gav dette dig ikke det rigtige svar - men det fik dig tættere på den procentdel, du ønskede, end du var før! Det er meget sjovt.

For god ordens skyld kæmpede Microsofts Bing Chat baseret på GPT 4 også med dette problem, hvilket gav os et åbenlyst forkert svar. GPT 4-logikken slår også hurtigt ind her.

Vi anbefaler ikke at prøve at følge hver eneste drejning af logikken - svaret er tydeligvis forkert.

Da vi påpegede, at Bings svar var forkert, fortsatte hun med at skændes med os i cirkler og gav forkert svar efter forkert svar.

ChatGPT kan heller ikke pålideligt regne ud

Det er værd at bemærke, at ChatGPT nogle gange springes over og også nævner den primære konto forkert. Vi har set logiske svar på forkerte regneopgaver svarende til 1 + 1 = 3 smæk midt i et velbegrundet svar.

Sørg for at tjekke tilbage og dobbelttjekke alt, hvad du får fra ChatGPT og andre AI-chatbots.

Relaterede stillinger
Udgiv artiklen på

Tilføj en kommentar