Harrastan höntsäsulkapalloa ja entisenä juniorikilpapelaajana myös edelleen seuraan aktiivisesti suomalaista ja kansainvälistä kilpasulkapalloa, joten päätin kokeilla paljon esillä olleella kiinalaisella Manus AI -tekoälyohjelmalla, miten sen agentit kykenevät tekemään antamani kehotteen perusteella sulkapallouutisia ja hakemaan sitä varten tiedot netistä. Antamani tehtävä oli melko yksinkertainen ja tässä tapauksessa annoin tekoälylle lähteen jo valmiiksi:
Kirjoita tämän Kaarinassa Suomessa parhaillaan käynnissä olevan sulkapalloturnauksen miesten kaksinpelin valioluokan (V) tähänastisista tuloksista urheilu-uutisia, jotka olet otsikoinut kiinnostavasti ja todenmukaisesti. Älä lisää uutisiin omia tietojasi, mutta voit tutkia oheisen sivuston eri pelaajista tarjoamia muita tietoja, kuten mitä seuraa he edustavat tai mahdollisesti, minkä ikäisiä he ovat. Toimi uutisia kirjoittaessasi kuin kokenut urheilutoimittaja. Kiinnitä erityistä huomiota siihen, että kirjoittamasi tiedot pitävät paikkansa. Kirjoita viisi uutista eri tuloksista. Otsikoissa saisi olla keskenään variaatiota, eli älä tee niistä liian samantyyppisiä. Tässä sivu, jossa on turnauksen tietoja ja tuloksia (turnaus jatkuu vielä huomenna, minkä asian voit huomioida uutisissasi): https://badmintonfinland.tournamentsoftware.com/tournament/1be8364c-7ad5-4aeb-8024-5a167584123d/Matches
Edellä kerrotun promptin perusteella Manus teki kyllä sinänsä hyvin kirjoitettuja perusuutisia pääosin oikein tulostiedoin, mutta kiellostani huolimatta sävelsi sinne myös omiaan, eli mm. keksi pelaajille sitaatteja ja luonnehti pelin kulkua, vaikka ei tietenkään voinut esimerkiksi tietää, hallitsiko Tapion Sulan pelaaja ”erityisesti verkkopeliä”:
Pyysin korjausta eli Manusta vielä tekemään esimerkkiuutisen, johon se ei oikeasti keksi mitään. Tulos oli tämä eli paikkansapitävä ihan kelpo uutinen. Lopussa on pieniä virheitä, joita ei huomaisi ellei tarkistaisi asioiden todellista laitaa. Pelaajia oli kyllä kaaviossa 16, tosin yksi oli jo luovuttanut ennen Kaarinaan tuloaan. Lisäksi eri seurojen edustajien määrän laskeminen osoittautui vaikeaksi – luvut ovat kyllä suunnilleen oikein, mutta eivät täysin
Se infografiikka, jota myös pyysin (pelaajien seurajakaumasta ja pelaajamäärästä miesten kaksinpelin valioluokassa)? Ihan hyvältä ensisilmäyksellä näyttää, mutta kolmenkaan korjauspyynnön jälkeen seurojen määrät eivät menneet täysin oikein, toki lähes:
Mitä opin tekoäly(agentti)työkaluista tästä kokeilusta? Varmaankin kaksi asiaa: oikean lähtöpromptin ja jatko-ohjeiden tärkeyden (olisin varmasti voinut tehdä heti alkuun esim. rakenteellisemman askeleittaisen promptin, jossa annan sille roolin, kontekstin, tehtävän ja muut raamit selkeämmin) sekä samaa mitä aina ennenkin: yleistä varovaisuutta: ihmisen vastuun korostamisen tarve tietojen oikeellisuuden takaamiseksi ei ihan heti tule loppumaan.
Olen tässä blogissa aiemminkin kertonut kokeiluistani brittiläisen, nopeasti kasvavan startupin Convergence AI:n Proxy-työkalulla, jolla voi helposti rakentaa nettiä automaattisesti koluavan tekoälyagentin ja lähetyttää sen hakemat tulokset omaan sähköpostiinsa vaikkapa kerran viikossa.
Tämä uusin testi on tähänastisista pisimmälle viety: halusin havainnollistaa, mihin kaikkeen Proxy pystyy samaan aikaan – vai pystyykö, ja miten laadukkaalla lopputuloksella. Otin esimerkkikunnaksi syntymäkuntani Varkauden ja annoin Proxylle seuraavan pitkän kehotteen:
”Haluan rakentaa toiminnon, jossa on viisi eri osaa. Ota näitä toimintoja toteuttaessasi huomioon, että toimit kuten huippuluokan tutkiva journalisti, joka on erityisen taitava hakemaan tietoa sekä tekemään tietojen perusteella uutisia etenkin paikallisista asioista Suomessa.
Osa 1: Tiivistä Varkauden kaupunginhallituksen seuraavan kokouksen esityslistan asiat siten, että arvioit, millä listan asialla voisi olla mahdollisesti uutisarvoa. Uutisarvoa arvioidessasi otat huomioon ainakin nämä seikat: kuinka paljon löydös poikkeaa aiemmasta datasta, kuinka moni ihminen tai yritys on asianosainen, onko aiheesta jo olemassa keskustelua somessa tai muissa uutislähteissä, ovatko vastaavat aiheet aiemmin päätyneet uutisotsikoihin tai sisältääkö asia mahdollisesti jonkinlaista kitkaa. Pidä erittely tiivinä, kerro sen yhteydessä esityslistan julkaisupäivämäärä ja linkkaa lähdesivulle.
Osa 2: Varkaus kuuluu Pohjois-Savon hyvinvointialueeseen. Tee edellämainittu erittely myös hyvinvointialueen aluehallituksen tulevan kokouksen esityslistalle huomioiden kohdat, joissa mainitaan Varkaus. Voit myös arvioida, mikäli jokin esityslistan asia olisi Varkauden kannalta erityisen tärkeä, vaikka Varkautta ei mainittaisikaan. Listat löytyvät täältä: https://pshyvinvointialue.fi/esityslistat-ja-poytakirjat
Osa 3: Hae yhdistysrekisterin julkisesta hausta (https://yhdistysrekisteri.prh.fi/) tiedot siitä, milloin Varkaus-nimiseen kaupunkiin on viimeksi (huom: huomioi Varkautta koskevista hakutuloksista viimeisin rekisteröintipäivä eli vain tuorein merkintä kaikista) perustettu jokin yhdistys, ja kerro tiedot yhdistyksestä tiedot tiiviisti. Kerro myös yhdistysmerkinnän julkaisupäivämäärä ja linkkaa lähdesivulle.
Osa 4: Hae julkisia hankintoja listaavalta Hilma-sivustolta viimeisin merkintä, jossa Varkaus-niminen kaupunki on mukana. Kerro merkinnän julkaisupäivämäärä sekä tiedot merkinnästä muutamalla virkkeellä siten, että siitä ymmärtää helposti, mistä hankinnassa on kyse.
Osa 5: Kerro tiiviisti kolme tuoreinta merkintää STT:n julkaisemista lehdistötiedotteista, joissa mainitaan Varkaus-niminen kaupunki. Kerro merkinnän julkaisupäivämäärä ja tiedot merkinnästä hyvin tiiviisti siten, että siitä ymmärtää helposti, mistä on kyse. STT:n lehdistötiedotteet löytyvät täältä: https://www.sttinfo.fi/
Tee kaikista edellämainituista kohdista esitystavaltaan suurin piirtein yhdenmukaisia esimerkiksi bullet pointein jäsentäen. Käytä mahdollisimman selkeää ja kansantajuista suomen kieltä. Kokoa kaikki tulokset samaan vastaukseen, kiitos.”
Muutama huomio kehotteesta. Annoin Proxylle valmiiksi muutaman linkin suoraan, vaikka se olisi löytänyt ne itsekin, mutta olen huomannut, että linkkien vinkkaaminen nopeuttaa sen toimintaa.
Huomiona itse testistä: tässäkään asiassa kone ei korvaa journalistista silmää – mikään kehote ei ole niin täydellinen, että se hoksaisi kaikki mahdolliset uutisarvoiset aiheet. Työtä se toki helpottaa. Mutta mikä tärkeintä ja sanon tämän, vaikka on itsestään selvää: tekoäly ei tietenkään kaivele sellaisia potentiaalisia uutisaiheita, joiden jäljille ei pääse digitaalisista lähteistä.
Tässä Proxyn antama vastaus:
Kokeilin tässä testissä sekä Proxyn maksullisen tilauksen (20e/kk) sisältämää Deepwork-toimintoa että ilmaista. Deepwork oli ehkä jopa huonompi tähän tarkoitukseen, koska se esitti tarpeettoman paljon täsmentäviä kysymyksiä, vaikka ilmankin niitä tulos oli samankaltainen. Ilmaiseksi tällaisia agentteja voi tehdä Proxyllä yhden päivässä – niistäkin voit kyllä tilata sähköpostin tulemaan itsellesi säännöllisesti.
On syytä huomioida, että kaikki ei aina mene odotetusti: tietoja tarkistaessani huomasin, että yhdistyshaussa tekoäly ei ollut hakenut tuoreinta merkintää (joka olisi ollut vuodelta 2021 eikä 2019), eikä se useista täsmennyspyynnöistä huolimattakaan kyennyt ottamaan tuoreinta merkintää mukaan. Voi myös hyvin olla, että tuloksista puuttuu edelleen jotakin olennaista, mitä en vain hoksaa. Pintapuolisesti katsottuna tekoäly tiivisti kunnanhallituksen ja hyvinvointialueen hallituksen esityslistat kertaheitolla melko hyvin. STT:n tiedotehausta se ei poiminut tuoreinta, vaan kolmanneksi tuoreimman, mutta tämä saattoi johtua antamastani kehotteesta, jossa pyysin tekoälyä arvioimaan uutisarvoa (tuoreemmat tiedotteet liittyivät Voice of Finland -ohjelmaan, johon osallistuu Varkaudesta kotoisin oleva kilpailija, mitä tekoäly ei tässä ehkä tulkinnut uutisarvoiseksi – mitä se paikallislehdelle kuitenkin varmasti olisi). Myös julkisten hankintojen merkintä meni tekoälyltä kerralla oikein.
Pidemmittä johdannoitta listaan tähän lähdelinkkeineen esimerkkejä tekoälytyökaluista, joita mediataloissa käytetään toimituksellisen työn apuna. Lista perustuu julkisesti löydettävissä oleviin lähteisiin, jotka olen linkannut asiayhteyteen. Lista on uutistoimituspainotteinen, vaikka työkaluja käytetään muuhunkin.
SUOMI
Alma Media – mm. “vastaväittelijä”-toiminto, tekstin muuttaminen puheeksi koneäänen avulla, tekstien tiivistäminen, kuvatekstien automaattinen luominen, kääntäminen…
Alma Median vuoden 2024 puolivuotiskatsauksessa todetaan, että uusi AI-tiimi aloitti työnsä “ja ensimmäiset toimituksellista työtä avustavat työkalut otettiin käyttöön”.
Sanoma – tiivistäminen, ennakoiva otsikkoanalytiikka ja ehdotukset toimittajille…
Helsingin Sanomien ja Ilta-Sanomien yhteinen tekoälytiimi aloitti työnsä alkuvuonna 2024. Sen tehtävänä on “testata, ideoida ja myös kriittisesti arvioida omaan työhön vaikuttavia työkaluja”. Työkaluista ei ole kovin paljoa julkisesti saatavilla olevaa tietoa. Joitain esimerkkejä on mainittu Sanoman toimitusjohtajan Rob Kolkmanin esityksessä vuodelta 2024 (sivu 13).
Washington Post – “Neulaa-heinäsuovasta-etsijä” laajojen tietomassojen käsittelyyn
Washington Post julkaisi 18. elokuuta ensimmäisen jutun, joka perustuu uuden Haystacker-nimisen tekoälytyökalun käyttöön. Työkalu mahdollistaa suurten tietomäärien seulomisen ja niistä erilaisten ilmiöiden ja trendien havaitsemisen. WP:n teknologiajohtajan mukaan kaupalliset yleiskäyttöiset työkalut eivät pysty vastaavaan. Toistaiseksi työkalua käyttävät visuaalisen journalismin tekijät ja datajournalistit.
Ensimmäinen Haystackerilla tehty juttu käsitteli 700:aa maahanmuuttoa käsittelevää vaalimainosta ja sitä, miten kuvia tai tekstiä oli manipuloitu harhaanjohtavien väitteiden luomiseksi. Haystacker mm. otti automaattisesti stillejä mainosvideoista.
WP:n mukaan Haystackeria voidaan käyttää missä tahansa suuressa tietoaineistossa, joka on käytettävissä joko julkisen rajapinnan kautta tai toimitukselle suoraan annettuna.
+ bonus: aihetarjonnan monipuolisuusmittari eliamerikkalaisten yliopistotutkijoiden kehittämä Media Bias Detector
Nimestään huolimatta tämä työkalu ei ota kantaa uutisjuttujen puolueettomuuteen, vaan mittaa käytännössä juttuaiheiden tarjonnan monipuolisuutta: sitä, montako juttuartikkelia mistäkin aihepiiristä on tietyllä ajanjaksolla kussakin mediassa ollut. Tekoälyn rooli työkalussa on tehdä sellaista sisältöanalyysiä, jota vielä muutama vuosi sitten teki ihminen. Esimerkkikuva alla.
Tämä(kään) tekoälytyökalu ei ajattele puolestasi, mutta kyllä se lupaamansa asian kieltämättä pienin varauksin tehokkaasti hoitaa.
Kokeilin SlidesAI-työkalua, joka ladataan Google Slides -esitysohjelman laajennusosaksi, ruokitaan sitten haluamillaan teksteillä ja painetaan Enteriä. Prese syntyi tässä tapauksessa alle minuutissa – jos siis lasketaan vain tuo Enterin jälkeinen ruksuttaminen.
Olen liittänyt tämän kirjoituksen loppuun muokkaamattomina ne 5 slideä, jotka SlidesAI teki antamani lähdetekstin pohjalta suoraan Google Slides -muotoon. Myös lähdeteksti on mainittu lopussa.
Miinukset:
Alkusäätäminen vei 5–10 minuuttia. En mielestäni ihan tumpelo ole tietokoneiden kanssa, mutta tästä en olisi selvinnyt ilman varmistavaa kyselyä valistuneemmalle kaverilleni. Isoin ongelma: uskaltaako juuri tähän ohjelmaan luottaa? Ovatko sen esittämät vaateet tietojeni käytöstä “normi” vai ei? Jouduin myös lopulta avaamaan SlidesAI:lla rikastetun Google Slidesin eri selainohjelmassa kuin yleensä, koska se ei tykännyt kahdesta yhtä aikaa kirjautuneena olevasta sähköpostitilistä. Incognito-moodi olisi ollut toinen vaihtoehto.
Työkaluun ei voi eikä kannata syöttää mitä tahansa, koska se voi periaatteessa päätyä minne tahansa. Syötä vain sellaista tietoa, jonka julkisuuteen päätyminen ei itseäsi haittaisi. Vrt. SlidesAI:n tietoturvasivu: We make every effort to protect your personal information and keep it secure. However, please be aware that no internet transmission is 100% secure, and we cannot guarantee the security of your information. By using our Add-On, you accept the inherent risks of providing information online and will not hold us responsible for any breach of security.
Lopputuloksen suomi ei ole aivan täydellistä (Helposti toki itse muokattavissa).
Plussat:
Hoitaa lupaamansa homman nopeasti, vaikkei täydellistä teekään.
Helppo käyttöliittymä.
Presen manuaalinen viimeistely on helppoa.
Kuvien vaihtaminen toisiin tekoälyllä luotuihin on helppoa. Ylipäänsä visun kanssa ei tarvitse välttämättä käsin venkslata lainkaan. Tämä on iso syy, miksi voisin kuvitella käyttäväni tällaista työkalua jatkossakin, ei välttämättä niinkään tekstit.
Kun laitetaan riviin yli 300 mediapomoa yli 50 maasta ja kysytään heiltä, mitkä ovat uutismedian menestyksen kannalta tärkeimmät kysymykset vuonna 2023, niitä syntyy viisi (lähde: Reuters-instituutin vuosiennakointi):
Kuinka uutismedia kykenee selviämään talouden taantumasta?
Miten uutismedia kykenee ehkäisemään uutisten välttelyä ja tekemään uutisista merkityksellisempiä?
Jos ihmiset enenevässä määrin pettyvät teknologiajätteihin, tarjoaako se medialle mahdollisuuksia?
Kykeneekö uutismedia kehittämään uusia tuotteita, jotka osuvat aiempaa paremmin asiakastarpeisiin?
Kun tekoäly helpottaa luovan sisällön tuotantoa, kykeneekö uutismedia sitä kautta tekemään tehokkaammin ja merkityksellisempää sisältöä?
Nämä slidet SlidesAI putkautti ulos (olin määrittänyt slidejen määräksi viisi kappaletta):
Analyytikon unelma lähenee, kun generatiivisen tekoälyn sovellukset kehittyvät: unelma on tietysti simppelillä käyttöliittymällä varustettu härveli, joka hoitaa duunarihommat eli tiedon raapimisen eri paikoista, jotta analyytikko voi keskittyä olennaiseen eli näkemyksen tuottamiseen (toki tekoälyn rajoitteet kriittisin silmin tiedostaen).
Kysyin ChatGPT:ltä, mikä yhdistää Helsingin Sanomien, Ilta-Sanomien ja Iltalehden suosituimpia uutisotsikoita. Poimin otsikot sivustojen luetuimmat-osioista, kultakin lehdeltä vajaat kaksikymmentä otsikkoa. Olen listannut ChatGPT:lle syöttämäni uutisotsikot erikseen tämän kirjoituksen loppuun.
ChatGPT:n vastaukset olivat sellaisia, joita voisi hyvin kuvitella kuulevansa myös ihmisanalyytikon tai yleisönsä hyvin tuntevan toimittajan suusta. Vaikkapa sen tunnistaminen ja sanoittaminen, mitkä otsikkoesimerkit vetoavat juuri lukijan empatiaan, oli jopa yllättävää.
Kysyin: Mitkä seikat tekevät näistä uutisotsikoista kiinnostavia? (otsikot tämän kirjoituksen lopussa)
Vastaus, Ilta-Sanomat:
Ilta-Sanomien kohdalla kysyin lisäksi, “Onko otsikoiden kirjoitustavassa yhdistäviä tekijöitä?”, johon vastaus oli:
Joissakin otsikoissa käytetään dramaattista kieltä tai kysymyksiä, jotka herättävät lukijan uteliaisuuden. Esimerkiksi otsikot ”Nämä nimet uhkaavat kuolla sukupuuttoon – katso, löytyykö omasi listalta” ja ”Muistisairauden 12 hälytysmerkkiä, joihin on syytä hakea apua – yksi voi näkyä ruokapöydässä” herättävät lukijan huomion ja antavat vinkkejä siitä, että otsikon takana on tärkeää tietoa tai jotain mielenkiintoista.
Toisissa otsikoissa käytetään suoraa kieltä ja kerrotaan tapahtumasta tai tilanteesta selkeästi. Esimerkiksi otsikot ”Kiinan presidentti Venäjällä – samaan aikaan Japanin pääministeri tapaa Zelenskyin Kiovassa” ja ”Vladimir Putinista annettu pidätysmääräys” kertovat suoraan tapahtumista, joilla on merkittäviä poliittisia seurauksia.
Jotkin otsikot sisältävät henkilökohtaisia tai inhimillisiä tarinoita, kuten ”Kun 23 ihmistä kuoli, Saana selvisi hengissä – vakuutusyhtiöltä käsittämätön linjaus” ja ”Mies lähti jäljittämään latukonetta, maastossa odotti surullinen näky”. Tällaiset otsikot vetoavat ihmisten tunteisiin ja herättävät empatiaa lukijassa.
Yhteenvetona voidaan todeta, että otsikoiden kirjoitustavassa on erilaisia lähestymistapoja, jotka yrittävät herättää lukijan huomion eri tavoilla.
Kysyin: Mitkä seikat tekevät näistä uutisotsikoista kiinnostavia? (otsikot tämän kirjoituksen lopussa)
Vastaus, Helsingin Sanomat:
Kysyin: Mitkä seikat tekevät näistä uutisotsikoista kiinnostavia?(otsikot tämän kirjoituksen lopussa)