ChatGPT V4 päihittää, SAT:t ja tunnistaa hyväksikäytöt ETH-sopimuksissa

GPT-4, tekoälyn (AI) chatbotin, ChatGPT:n, uusin versio, voi läpäistä lukion kokeet ja oikeustieteellisen koulun kokeet 90. prosenttipisteen pisteillä, ja siinä on uusia käsittelyominaisuuksia, jotka eivät olleet mahdollisia aiemmassa versiossa.

Sen luoja OpenAI jakoi GPT-4:n testituloksista saadut luvut 14. maaliskuuta ja paljasti, että se voi myös muuntaa kuva-, ääni- ja videotulot tekstiksi sen lisäksi, että se käsittelee "paljon vivahteikkaampia ohjeita" luovemmin ja luotettavammin.

"Se läpäisee simuloidun baarikokeen, jonka pisteet ovat noin 10 % testin ottajista", OpenAI lisäsi. "Päinvastoin, GPT-3.5:n pistemäärä oli noin 10 %:n alapuolella."

Luvut osoittavat, että GPT-4 saavutti pistemäärän 163 88. prosenttipisteessä LSAT-kokeessa – koeopiskelijoiden on läpäistävä Yhdysvalloissa päästäkseen oikeustieteelliseen tiedekuntaan.

*GPT-4:n ja GPT-3.5:n kokeen tulokset useissa viimeaikaisissa Yhdysvaltojen kokeissa. Lähde:* *OpenAI*

GPT4:n pisteet antaisivat sille hyvän aseman päästäkseen 20 parhaan joukkoon lakikoulussa, ja se on vain muutaman pisteen alle ilmoitetuista pisteistä, jotka vaaditaan hyväksytyksi arvostettuihin kouluihin, kuten Harvardiin, Stanfordiin, Princetoniin tai Yaleen.

ChatGPT:n aiempi versio sai vain 149 pistettä LSAT:ssa, mikä sijoittui 40 prosentin alimmalle tasolle.

GPT-4 sai myös 298 pistettä 400:sta Uniform Bar Exam -testissä – äskettäin valmistuneiden oikeustieteen opiskelijoiden suorittamassa testissä, jonka ansiosta he voivat harjoittaa asianajajan ammattia millä tahansa Yhdysvaltain lainkäyttöalueella.

*UBE-pisteet täytyi päästä harjoittamaan lakia jokaisella Yhdysvaltain lainkäyttöalueella. Lähde:* *Kansallinen asianajajien konferenssi*

ChatGPT:n vanha versio oli vaikeuksissa tässä testissä ja sijoittui alimmalle 10 %:lle pisteellä 213/400.

Mitä tulee yhdysvaltalaisten lukiolaisten opiskeluvalmiuksien mittaamiseen suorittamiin SAT-todistuspohjaiseen lukemiseen ja kirjoittamiseen ja SAT-matematiikan kokeisiin, GPT-4 sijoittui 93. ja 89. prosenttipisteeseen.

GPT-4 loisti myös "kovissa" tieteissä, ja se saavutti selvästi keskimääräistä prosenttipisteet korkeammat pisteet AP-biologiassa (85-100 %), kemiassa (71-88 %) ja fysiikassa 2 (66-84 %).

*GPT-4- ja GPT-3.5-koetulokset useissa viimeaikaisissa Yhdysvaltain kokeissa.* *Lähde: OpenAI.*

Kuitenkin sen AP Calculus -pistemäärä oli melko keskimääräinen ja sijoittui 43r - 59 prosenttipisteeseen.

Toinen alue, josta GPT-4 puuttui, oli englanninkielisen kirjallisuuden kokeet, joissa pisteet kirjattiin 8.–44. prosenttipisteeseen kahdessa erillisessä testissä.

OpenAI sanoi, että GPT-4 ja GPT-3.5 ottivat nämä testit 2022-2023 harjoituskokeista ja että "ei erityiskoulutusta" kielenkäsittelytyökaluilla:

"Emme tehneet erityistä koulutusta näitä kokeita varten. Pienen osan kokeiden ongelmista malli näki koulutuksen aikana, mutta uskomme tulosten edustavan."

Tulokset herättivät pelkoa myös Twitter-yhteisössä.

Related: Miten ChatGPT vaikuttaa Web3-tilaan? Teollisuus vastaa

Nick Almond, FactoryDAO:n perustaja kertoi Hänen 14,300 14 Twitter-seuraajansa 4. maaliskuuta sanoi, että GPTXNUMX "pelottelee ihmisiä" ja se "romahtaa" globaalin koulutusjärjestelmän.

Arviointiteoria oli iso osa elämääni useiden vuosien ajan. Pohdin tästä päivästä monta vuotta sitten. Kuulosin kirjaimellisesti asukkaan kammalta tuolloin.
Mutta… tämä tarkoittaa itse asiassa, että kaikki muu kuin valvottu arviointi on ohi tästä eteenpäin.
- drnick ️² (@DrNickA) Maaliskuussa 14, 2023

Coinbasen entinen johtaja Conor Grogan sanoi lisänneensä Ethereum-älysopimuksen GPT-4:ään ja viittasi välittömästi useisiin "tietoturvahaavoittuvuuksiin" ja hahmotteli, kuinka koodia voidaan hyödyntää:

Jätin live-Ethereum-sopimuksen GPT-4:ään.
Se korosti hetkessä useita tietoturva-aukkoja ja osoitti pinta-alat, joilla sopimusta voitiin hyödyntää. Sitten se vahvisti tietyn tavan, jolla voin hyödyntää sopimusta pic.twitter.com/its5puakUW
- Conor (@jconorrogan) Maaliskuussa 14, 2023

Aiemmat ChatGPT:n älykkäiden sopimusten auditoinnit havaitsivat, että sen ensimmäinen versio pystyi myös havaitsemaan koodivirheitä kohtuullisessa määrin.

Rowan Cheung, tekoäly-uutiskirjeen "The Rundown" perustaja jakoi videon GPT:stä, jossa GPT transkriptoi paperille käsin piirretyn väärennetyn verkkosivuston koodiksi.

Katselin juuri GPT-4:n muuttavan käsin piirretystä luonnoksesta toimivan verkkosivuston.
Tämä on hullua. pic.twitter.com/P5nSjrk7Wn
— Rowan Cheung (@rowancheung) Maaliskuussa 14, 2023