OpenAI julkaisi listan työtehtävistä, joissa ChatGPT voi jo korvata ihmisen

Tekoäly uutiset – ajankohtaiset tekoälyuutiset suomeksi

TAGS: ChatGPT, OpenAI

OpenAI julkaisi listan työtehtävistä, joissa ChatGPT voi jo korvata ihmisen

OpenAI on julkaissut uuden arviointimallin GDPval, joka mittaa tekoälyn kykyä suoriutua taloudellisesti arvokkaista, todellisen maailman tehtävistä eri ammateissa. Lista kattaa 44 ammattia, aina kiinteistönvälittäjistä ja sosiaalityöntekijöistä ohjelmistokehittäjiin, juristeihin, sairaanhoitajiin, farmaseutteihin ja talousneuvojiiin.

Tulosten mukaan tämän päivän kehittyneimmät mallit yltävät jo lähes alan ammattilaisten tasolle. Listalla on muun muassa kiinteistönvälittäjiä, sosiaalityöntekijöitä, ohjelmistokehittäjiä, juristeja, sairaanhoitajia, asiakaspalvelijoita, farmaseutteja ja talousneuvojia.

OpenAI:n mukaan “paras tapa ymmärtää tekoälyn potentiaalia on katsoa, mitä se jo nyt pystyy tekemään”. Tulokset näyttävät, että tämän päivän huippumallit alkavat lähestyä alan ammattilaisten tasoa.

Mitä tehtäviä testattiin?

Arvioidut tehtävät vaihtelevat myyntiesitteen suunnittelusta ja kilpailijakartoituksen tekemisestä aina ihomuutosten arviointiin hoitosuunnitelmia varten.

Paperissa mainittuja konkreettisia esimerkkejä olivat mm.:

Rahoitusanalyytikko: kilpailijakartoituksen laatiminen viimeisen kilometrin toimituksista.
Sairaanhoitaja: ihomuutosten kuvien arviointi hoitosuunnitelmaa varten.
Kiinteistönvälittäjä: myyntiesitteen suunnittelu.

Toisin sanoen kyse ei ollut yksittäisestä chattailusta, vaan oikean työelämän kaltaisista tehtävistä.

Kuka pärjäsi parhaiten?

Yllättäen paras tulos ei tullut OpenAI:lta, vaan kilpailijalta. Anthropicin Claude Opus 4.1 arvioitiin asiantuntijoiden toimesta parhaiten suoriutuvaksi malliksi 220 tehtävän skaalassa. Heti perässä tuli OpenAI:n GPT-5, joka loisti erityisesti tarkkuudessa.

OpenAI testasi myös tehostettua versiota nimeltä GPT-5-high. Se arvioitiin yli 40 % tapauksista yhtä hyväksi tai paremmaksi kuin alan asiantuntijat. Vertailun vuoksi vuotta vanhempi GPT-4o jäi kauas taakse, vain 13,7 prosenttiin.

Työpaikat – uhka vai tuki?

OpenAI puhuu varovaisesti. Virallinen viesti on, että tekoäly “tukee ihmisiä heidän päivittäisessä työssään” – ei että se korvaisi heidät kokonaan. Tämä on toki ymmärrettävää, koska työpaikkojen katoamisesta juhliminen olisi huonoa PR:ää.

Todellisuus on kuitenkin monimutkaisempi. Monet johtajat ovat avoimesti puhuneet työntekijöiden korvaamisesta kustannusten säästämiseksi, ja joissain yrityksissä tämä on ehtinyt kääntyä itseään vastaan. AI ei ole vielä täydellinen – ja sen rajoitteet ovat hyvin todellisia.

Suurimmat ongelmat: hallusinaatiot ja epäluotettavuus

Isoin kompastuskivi on yhä hallusinaatiot: tekoäly keksii uskottavan kuuloista mutta täysin virheellistä tietoa. Tämä pakottaa käyttäjät tarkistamaan tuloksia manuaalisesti, mikä voi viedä enemmän aikaa kuin säästää.

Lisäksi AI pärjää hyvin lyhyissä, tarkasti määritellyissä tehtävissä. Mutta kun työ venyy, muuttuu ennakoimattomaksi tai vaatii luovaa ongelmanratkaisua, mallit lähtevät helposti sivuraiteille. OpenAI itsekin myönsi: ”Todellisen maailman tehtävät eivät yleensä ole siististi määriteltyjä yhden promptin avulla.”

Mitä tämä tarkoittaa?

OpenAI:n sanoin:

“Varhaiset GDPval-tulokset osoittavat, että mallit voivat jo nyt ottaa hoitaakseen osan toistuvista ja tarkasti määritellyistä tehtävistä nopeammin ja halvemmalla kuin asiantuntijat. Mutta useimmat työt ovat paljon muutakin kuin kasa tehtäviä, jotka voi kirjoittaa listaksi.”

Toisin sanoen – kyllä, tekoäly pystyy jo osittain syrjäyttämään asiantuntijoita, mutta se ei vielä kykene ottamaan haltuun kokonaista ammattia. Suurin hyöty tällä hetkellä syntyy siitä, että ihminen ja tekoäly tekevät töitä yhdessä.

jyrimustonen.fi