Strategia ja liiketoiminta

Julkiset hankinnat, yhdistystiedot, kuntapäätökset, sh-piirin päätökset ja tiedotemaininnat automaattisesti mailiisi: Näin rakennat toimittajan Varkaus-haravan

Olen tässä blogissa aiemminkin kertonut kokeiluistani brittiläisen, nopeasti kasvavan startupin Convergence AI:n Proxy-työkalulla, jolla voi helposti rakentaa nettiä automaattisesti koluavan tekoälyagentin ja lähetyttää sen hakemat tulokset omaan sähköpostiinsa vaikkapa kerran viikossa.

Tämä uusin testi on tähänastisista pisimmälle viety: halusin havainnollistaa, mihin kaikkeen Proxy pystyy samaan aikaan – vai pystyykö, ja miten laadukkaalla lopputuloksella. Otin esimerkkikunnaksi syntymäkuntani Varkauden ja annoin Proxylle seuraavan pitkän kehotteen:

”Haluan rakentaa toiminnon, jossa on viisi eri osaa. Ota näitä toimintoja toteuttaessasi huomioon, että toimit kuten huippuluokan tutkiva journalisti, joka on erityisen taitava hakemaan tietoa sekä tekemään tietojen perusteella uutisia etenkin paikallisista asioista Suomessa.

Osa 1: Tiivistä Varkauden kaupunginhallituksen seuraavan kokouksen esityslistan asiat siten, että arvioit, millä listan asialla voisi olla mahdollisesti uutisarvoa. Uutisarvoa arvioidessasi otat huomioon ainakin nämä seikat: kuinka paljon löydös poikkeaa aiemmasta datasta, kuinka moni ihminen tai yritys on asianosainen, onko aiheesta jo olemassa keskustelua somessa tai muissa uutislähteissä, ovatko vastaavat aiheet aiemmin päätyneet uutisotsikoihin tai sisältääkö asia mahdollisesti jonkinlaista kitkaa. Pidä erittely tiivinä, kerro sen yhteydessä esityslistan julkaisupäivämäärä ja linkkaa lähdesivulle.

Varkauden esityslistat, pöytäkirjat, viranhaltijapäätökset ja kuulutukset löydät täältä: https://varkaus.fi/fi/sivu/osallisuus-ja-paatoksenteko/paatoksenteko

Osa 2: Varkaus kuuluu Pohjois-Savon hyvinvointialueeseen. Tee edellämainittu erittely myös hyvinvointialueen aluehallituksen tulevan kokouksen esityslistalle huomioiden kohdat, joissa mainitaan Varkaus. Voit myös arvioida, mikäli jokin esityslistan asia olisi Varkauden kannalta erityisen tärkeä, vaikka Varkautta ei mainittaisikaan. Listat löytyvät täältä: https://pshyvinvointialue.fi/esityslistat-ja-poytakirjat

Osa 3: Hae yhdistysrekisterin julkisesta hausta (https://yhdistysrekisteri.prh.fi/) tiedot siitä, milloin Varkaus-nimiseen kaupunkiin on viimeksi (huom: huomioi Varkautta koskevista hakutuloksista viimeisin rekisteröintipäivä eli vain tuorein merkintä kaikista) perustettu jokin yhdistys, ja kerro tiedot yhdistyksestä tiedot tiiviisti. Kerro myös yhdistysmerkinnän julkaisupäivämäärä ja linkkaa lähdesivulle.

Osa 4: Hae julkisia hankintoja listaavalta Hilma-sivustolta viimeisin merkintä, jossa Varkaus-niminen kaupunki on mukana. Kerro merkinnän julkaisupäivämäärä sekä tiedot merkinnästä muutamalla virkkeellä siten, että siitä ymmärtää helposti, mistä hankinnassa on kyse.

Osa 5: Kerro tiiviisti kolme tuoreinta merkintää STT:n julkaisemista lehdistötiedotteista, joissa mainitaan Varkaus-niminen kaupunki. Kerro merkinnän julkaisupäivämäärä ja tiedot merkinnästä hyvin tiiviisti siten, että siitä ymmärtää helposti, mistä on kyse. STT:n lehdistötiedotteet löytyvät täältä: https://www.sttinfo.fi/

Tee kaikista edellämainituista kohdista esitystavaltaan suurin piirtein yhdenmukaisia esimerkiksi bullet pointein jäsentäen. Käytä mahdollisimman selkeää ja kansantajuista suomen kieltä. Kokoa kaikki tulokset samaan vastaukseen, kiitos.”

Muutama huomio kehotteesta. Annoin Proxylle valmiiksi muutaman linkin suoraan, vaikka se olisi löytänyt ne itsekin, mutta olen huomannut, että linkkien vinkkaaminen nopeuttaa sen toimintaa.

Huomiona itse testistä: tässäkään asiassa kone ei korvaa journalistista silmää – mikään kehote ei ole niin täydellinen, että se hoksaisi kaikki mahdolliset uutisarvoiset aiheet. Työtä se toki helpottaa. Mutta mikä tärkeintä ja sanon tämän, vaikka on itsestään selvää: tekoäly ei tietenkään kaivele sellaisia potentiaalisia uutisaiheita, joiden jäljille ei pääse digitaalisista lähteistä.

Tässä Proxyn antama vastaus:

Kokeilin tässä testissä sekä Proxyn maksullisen tilauksen (20e/kk) sisältämää Deepwork-toimintoa että ilmaista. Deepwork oli ehkä jopa huonompi tähän tarkoitukseen, koska se esitti tarpeettoman paljon täsmentäviä kysymyksiä, vaikka ilmankin niitä tulos oli samankaltainen. Ilmaiseksi tällaisia agentteja voi tehdä Proxyllä yhden päivässä – niistäkin voit kyllä tilata sähköpostin tulemaan itsellesi säännöllisesti.

On syytä huomioida, että kaikki ei aina mene odotetusti: tietoja tarkistaessani huomasin, että yhdistyshaussa tekoäly ei ollut hakenut tuoreinta merkintää (joka olisi ollut vuodelta 2021 eikä 2019), eikä se useista täsmennyspyynnöistä huolimattakaan kyennyt ottamaan tuoreinta merkintää mukaan. Voi myös hyvin olla, että tuloksista puuttuu edelleen jotakin olennaista, mitä en vain hoksaa. Pintapuolisesti katsottuna tekoäly tiivisti kunnanhallituksen ja hyvinvointialueen hallituksen esityslistat kertaheitolla melko hyvin. STT:n tiedotehausta se ei poiminut tuoreinta, vaan kolmanneksi tuoreimman, mutta tämä saattoi johtua antamastani kehotteesta, jossa pyysin tekoälyä arvioimaan uutisarvoa (tuoreemmat tiedotteet liittyivät Voice of Finland -ohjelmaan, johon osallistuu Varkaudesta kotoisin oleva kilpailija, mitä tekoäly ei tässä ehkä tulkinnut uutisarvoiseksi – mitä se paikallislehdelle kuitenkin varmasti olisi). Myös julkisten hankintojen merkintä meni tekoälyltä kerralla oikein.

Normaali
Yleisön ymmärtäminen & analytiikka

Tämä harjoitus vei tekoälyagentilta 4 minuuttia – kolusi itse viiden median otsikot, laski merkkimäärät, analysoi sisältöä ja teki taulukon

Termiä tekoälyagentti käytetään nykyään melko hövelisti, mutta alun perin sillä on viitattu tekoälyn kykyyn hoitaa peräkkäisiä tehtäviä automaattisesti.

Tässä kirjoituksessa käsittelemäni esimerkki on tehty lontoolaisen startupin Convergence AI:n Proxy-työkalulla, jolle antamani komento oli seuraava:

Käy läpi suomalaismedioiden Ilta-Sanomat, Iltalehti, Yle, Helsingin Sanomat ja Keskisuomalainen verkkosivujen osa, joka kertoo luetuimmat jutut sillä hetkellä. Tämän jälkeen laadi taulukko, joka sisältää kunkin median nimen, viisi luetuinta otsikkoa, niiden keskimääräisen merkkimäärän (ilman välilyöntejä) sekä kolme pointtia, mitkä seikat yhdistävät kunkin tiedotusvälineen luetuimpia juttuja.

”Normaali” keskusteleva tekoälytyökalu ei kykenisi tekemään tämänkaltaista moniosaista tehtävää, mutta Proxyllä tässä kesti noin viisi minuuttia, eikä se tarvinnut täsmentäviä ohjeita, mitä se joskus kysyy. Proxyn tekoäly siis käytännössä käy promptissa mainituilla sivustoilla ja etsii niiden luetuimmat-osiot. Muutaman kohdalla tekoäly meni niille googlaamalla ensin ”Iltalehti luetuimmat”, osan kohdalla menemällä suoraan palvelun etusivulle ja etsimällä sieltä luetuimmat-osion. Proxy tarvitsi tehtävän toteuttamiseen 17 vaihetta, joista viimeinen oli pyytämäni taulukko. Kauneusvirhe oli se, että Proxy ei kyennyt tekemään taulukkoa täydellisenä Markdown-versiona keskustelunäkymään, eikä liitetiedostona, vaan tiedot oli itse kopioitava käsin tässä tapauksessa Google Sheetsiin:

Proxyn työstönäkymä näytti tältä:

Huono asia perinteisen median kannalta on ainakin se, että Proxy näyttäisi ohittavan sivustojen blokkausyritykset tekoälyille mm. ottamalla sivustoilta kuvakaappauksia. Median vinkkelistä tekoälyagenteille on helppo nähdä myös mahdollisuuksia, vaikkapa tutkivien toimittajien omiin seuranta-alueisiin erikoistuneiden tekoälyapureiden rakentamiseen. Kävin tätä puolta hieman enemmän läpi aiemmassa blogikirjoituksessani.

Normaali
Strategia ja liiketoiminta

Näin helposti (ja ilmaiseksi) syntyi tekoälyagentti, joka pyörii puolestani netissä sukututkimusharrastustani varten

Tekoälyagenttien yleistymisen vaikutukset media-alaan ja esimerkiksi tutkivien journalistien tekoälytyökaluihin ovat tämänkin kokeilun perusteella ilmeiset. Riskitkin on helppo nähdä.

Tekoälybotit on suunniteltu pääasiassa vuorovaikutukseen ihmisten kanssa, kun taas tekoälyagentit pystyvät suorittamaan monimutkaisia ja peräkkäisiä tehtäviä itsenäisesti – käytännössä esimerkiksi käymään erilaisissa tietokannoissa puolestasi ja parhaimmillaan lähettämään tulokset ajastettuna sähköpostiisi vaikka maanantaiaamuisin kello 9.

En ole itse teknologian syväosaaja, vaan pikemminkin teknologiaan kriittis-innostuneesti suhtautuva umpihumanisti, joten päätin kirjata kokeiluni talteen myös tänne blogiin.

Kokeilin tekoälyagentin luomiseen ensin Zapier AI -nimistä palvelua, mutta se oli omaan makuuni hieman liian monimutkainen. Hollannin yleisradion strategiajohtajan Ezra Eemanin Wayfinder-uutiskirjeestä bongasin brittiläisen startupin Convergence AI:n Proxy-nimisen uuden palvelun, joka osoittautui käytettävyydeltään niin helpoksi, että se hakkasi Zapierin mennen tullen. Proxyä voi toistaiseksi käyttää useamman kerran päivässä ilmaiseksi.

Maksullisista tekoälytyökaluista käytän itse tällä hetkellä päivittäin Perplexityä (noin 20e/kk), mutta siinä ei vielä tällaista agentinluomismahdollisuutta ole – tosin veikkaan, että pian on, sillä alusta päivittää mm. kielimallejaan ja ominaisuuksiaan koko ajan, viimeisimpänä Deep Researchillä, joka leipoo aiheesta kuin aiheesta pelottavan hyviä akateemisen tason analyysejä lähdeviitteineen.

Convergence AI:n Proxy toimii pelkistettynä näin:

  1. Mene osoitteeseen Convergence.ai.
  2. Luo tunnus ja salasana, kirjaudu.
  3. Kuvaile chat-ikkunassa, mitä haluat tehdä. Lähtöteksti on englanniksi, mutta voit keskustella normaalisti suomeksi. Valittavana on myös oletustehtäviä, kuten erilaiset uutistiivistelmät.
  4. Voit täsmentää ohjeita matkan varrella.
  5. Harrastan sukututkimusta, joten kokeilin siihen liittyvällä esimerkillä. Pyysin Proxyä hakemaan tietoa Kansalliskirjaston vanhojen lehtien digitoidusta tietokannasta siten, että saisin tiivistelmän aina tuoreimmista lisäyksistä, joissa sukunimeni mainitaan. Näin keskusteluni eteni:

“Mene osoitteeseen digi.kansalliskirjasto.fi, etsi tietoa nimellä “Pirhonen”, jäsennä tulokset muotoon “viimeksi lisätyt” ja kerro tuoreimmat 3 tulosta bullet pointeina niin, että mainitset lehden nimen, lehden julkaisupäivämäärän sekä lyhyesti kontekstin, jossa nimi Pirhonen esiintyy.”

Tällä komennolla sain ensin englanninkielisen tuloksen, joten täsmensin:

“Voisitko antaa tulokset suomen kielellä”.

Tämän jälkeen sain tuloksen, joka ei kuitenkaan ole aivan sitä mitä tarkoitin eli viimeksi lisätyt eivät ole ensin:

Täsmensin komentoa lisää:

“Muuta hakuasetuksia oikeasta yläkulmasta muotoon ’Viimeksi’ lisätyt, jolloin hakutuloksissa näkyy viimeksi lisätty tulos.

Tämän jälkeen sain tuloksen, joka oli muuten ok, mutta halusin konteksti-kohdasta vielä hieman selkeämmän:

“Kerro kontekstista hieman tarkemmin niin, että asiayhteyden ymmärtää paremmin.”

Tämän jälkeen Proxy antoi juuri oikeanlaisen ja kaipaamani tuloksen:

Halutessani voisin pyytää Proxyä tekemään saman haun vaikkapa joka maanantai ja lähettämään tulokset sähköpostiini. Tämä toiminto ei kuitenkaan näytä käytännössä toimivan ainakaan vielä täydellisesti, vaikka joihinkin oletustehtäviin Proxy sitä jo tarjoaa. Tuloksen Proxy kyllä lähettää sähköpostiin, mutta ei ajastettuna, vaan pienellä viiveellä kunkin haun jälkeen.

Uhkia ja mahdollisuuksia

Joka tapauksessa on helppo nähdä, millaisia sekä mahdollisuuksia että uhkia tekoälyagentit tuovat media-alalle. Tulevaisuudessa agenttimaisten sisällönkuluttajien osuus epäilemättä kasvaa – mistä tiedät, onko taustalla oikea ihminen vai ei, suoraan tai välillisesti? Agentit myös käyttävät surutta medioiden tekijänoikeudellista sisältöä, mikä taitaa valitettavasti olla tuulimyllyjä vastaan taistelemista. Kyyninen voisi myös sanoa, että joissain medioissa tekoälyn tekemää sisältöä kuluttaa pian – tekoäly. Mihin jäi ihminen.

Riskinä on myös tietoturva. Jotta agentit pystyvät toimimaan, niille on annettava pääsy niihin järjestelmiin joissa haluat niiden toimivan, kuten vaikkapa kalenteriisi. Tässä kohtaa huomaan itse, että raja tulee vastaan, kun käytän kaupallisia ei-suljetussa järjestelmässä olevia työkaluja: en mielelläni anna niille pääsyä mihinkään, mihin ei ole pakko, koska en luota niihin tarpeeksi.

Mitä tulee mediaan ja etenkin journalismiin, agenteissa on helppo nähdä isoja mahdollisuuksia esimerkiksi tutkivien toimittajien työkaluihin: voit rakentaa helposti esimerkiksi agentin, joka kahlaa puolestasi tietoa haluamaltasi seuranta-alueelta. Tähän suuntaan jotkut mediat ovatkin jo omia tekoälytyökalujaan vieneet. Mahdollisuuksia on myös esimerkiksi personoitujen uutiskirjeiden tuunaamisessa – sellainen kun on helppo rakentaa jo nyt itse täysin haluamakseen, kuten tämäkin kokeilu osoitti.

Lue myös: Dagens Media listasi ruotsalaismedian TOP15 tekoälytyökalut – tässä esimerkit linkkeineen.

Normaali