Termiä tekoälyagentti käytetään nykyään melko hövelisti, mutta alun perin sillä on viitattu tekoälyn kykyyn hoitaa peräkkäisiä tehtäviä automaattisesti.
Tässä kirjoituksessa käsittelemäni esimerkki on tehty lontoolaisen startupin Convergence AI:n Proxy-työkalulla, jolle antamani komento oli seuraava:
Käy läpi suomalaismedioiden Ilta-Sanomat, Iltalehti, Yle, Helsingin Sanomat ja Keskisuomalainen verkkosivujen osa, joka kertoo luetuimmat jutut sillä hetkellä. Tämän jälkeen laadi taulukko, joka sisältää kunkin median nimen, viisi luetuinta otsikkoa, niiden keskimääräisen merkkimäärän (ilman välilyöntejä) sekä kolme pointtia, mitkä seikat yhdistävät kunkin tiedotusvälineen luetuimpia juttuja.
”Normaali” keskusteleva tekoälytyökalu ei kykenisi tekemään tämänkaltaista moniosaista tehtävää, mutta Proxyllä tässä kesti noin viisi minuuttia, eikä se tarvinnut täsmentäviä ohjeita, mitä se joskus kysyy. Proxyn tekoäly siis käytännössä käy promptissa mainituilla sivustoilla ja etsii niiden luetuimmat-osiot. Muutaman kohdalla tekoäly meni niille googlaamalla ensin ”Iltalehti luetuimmat”, osan kohdalla menemällä suoraan palvelun etusivulle ja etsimällä sieltä luetuimmat-osion. Proxy tarvitsi tehtävän toteuttamiseen 17 vaihetta, joista viimeinen oli pyytämäni taulukko. Kauneusvirhe oli se, että Proxy ei kyennyt tekemään taulukkoa täydellisenä Markdown-versiona keskustelunäkymään, eikä liitetiedostona, vaan tiedot oli itse kopioitava käsin tässä tapauksessa Google Sheetsiin:
Proxyn työstönäkymä näytti tältä:
Huono asia perinteisen median kannalta on ainakin se, että Proxy näyttäisi ohittavan sivustojen blokkausyritykset tekoälyille mm. ottamalla sivustoilta kuvakaappauksia. Median vinkkelistä tekoälyagenteille on helppo nähdä myös mahdollisuuksia, vaikkapa tutkivien toimittajien omiin seuranta-alueisiin erikoistuneiden tekoälyapureiden rakentamiseen. Kävin tätä puolta hieman enemmän läpi aiemmassa blogikirjoituksessani.
Tekoälyagenttien yleistymisen vaikutukset media-alaan ja esimerkiksi tutkivien journalistien tekoälytyökaluihin ovat tämänkin kokeilun perusteella ilmeiset. Riskitkin on helppo nähdä.
Tekoälybotit on suunniteltu pääasiassa vuorovaikutukseen ihmisten kanssa, kun taas tekoälyagentit pystyvät suorittamaan monimutkaisia ja peräkkäisiä tehtäviä itsenäisesti – käytännössä esimerkiksi käymään erilaisissa tietokannoissa puolestasi ja parhaimmillaan lähettämään tulokset ajastettuna sähköpostiisi vaikka maanantaiaamuisin kello 9.
En ole itse teknologian syväosaaja, vaan pikemminkin teknologiaan kriittis-innostuneesti suhtautuva umpihumanisti, joten päätin kirjata kokeiluni talteen myös tänne blogiin.
Kokeilin tekoälyagentin luomiseen ensin Zapier AI -nimistä palvelua, mutta se oli omaan makuuni hieman liian monimutkainen. Hollannin yleisradion strategiajohtajan Ezra Eemanin Wayfinder-uutiskirjeestä bongasin brittiläisen startupin Convergence AI:n Proxy-nimisen uuden palvelun, joka osoittautui käytettävyydeltään niin helpoksi, että se hakkasi Zapierin mennen tullen. Proxyä voi toistaiseksi käyttää useamman kerran päivässä ilmaiseksi.
Maksullisista tekoälytyökaluista käytän itse tällä hetkellä päivittäin Perplexityä (noin 20e/kk), mutta siinä ei vielä tällaista agentinluomismahdollisuutta ole – tosin veikkaan, että pian on, sillä alusta päivittää mm. kielimallejaan ja ominaisuuksiaan koko ajan, viimeisimpänä Deep Researchillä, joka leipoo aiheesta kuin aiheesta pelottavan hyviä akateemisen tason analyysejä lähdeviitteineen.
Kuvaile chat-ikkunassa, mitä haluat tehdä. Lähtöteksti on englanniksi, mutta voit keskustella normaalisti suomeksi. Valittavana on myös oletustehtäviä, kuten erilaiset uutistiivistelmät.
Voit täsmentää ohjeita matkan varrella.
Harrastan sukututkimusta, joten kokeilin siihen liittyvällä esimerkillä. Pyysin Proxyä hakemaan tietoa Kansalliskirjaston vanhojen lehtien digitoidusta tietokannasta siten, että saisin tiivistelmän aina tuoreimmista lisäyksistä, joissa sukunimeni mainitaan. Näin keskusteluni eteni:
“Mene osoitteeseen digi.kansalliskirjasto.fi, etsi tietoa nimellä “Pirhonen”, jäsennä tulokset muotoon “viimeksi lisätyt” ja kerro tuoreimmat 3 tulosta bullet pointeina niin, että mainitset lehden nimen, lehden julkaisupäivämäärän sekä lyhyesti kontekstin, jossa nimi Pirhonen esiintyy.”
Tällä komennolla sain ensin englanninkielisen tuloksen, joten täsmensin:
“Voisitko antaa tulokset suomen kielellä”.
Tämän jälkeen sain tuloksen, joka ei kuitenkaan ole aivan sitä mitä tarkoitin eli viimeksi lisätyt eivät ole ensin:
Täsmensin komentoa lisää:
“Muuta hakuasetuksia oikeasta yläkulmasta muotoon ’Viimeksi’ lisätyt, jolloin hakutuloksissa näkyy viimeksi lisätty tulos.”
Tämän jälkeen sain tuloksen, joka oli muuten ok, mutta halusin konteksti-kohdasta vielä hieman selkeämmän:
“Kerro kontekstista hieman tarkemmin niin, että asiayhteyden ymmärtää paremmin.”
Tämän jälkeen Proxy antoi juuri oikeanlaisen ja kaipaamani tuloksen:
Halutessani voisin pyytää Proxyä tekemään saman haun vaikkapa joka maanantai ja lähettämään tulokset sähköpostiini. Tämä toiminto ei kuitenkaan näytä käytännössä toimivan ainakaan vielä täydellisesti, vaikka joihinkin oletustehtäviin Proxy sitä jo tarjoaa. Tuloksen Proxy kyllä lähettää sähköpostiin, mutta ei ajastettuna, vaan pienellä viiveellä kunkin haun jälkeen.
Uhkia ja mahdollisuuksia
Joka tapauksessa on helppo nähdä, millaisia sekä mahdollisuuksia että uhkia tekoälyagentit tuovat media-alalle. Tulevaisuudessa agenttimaisten sisällönkuluttajien osuus epäilemättä kasvaa – mistä tiedät, onko taustalla oikea ihminen vai ei, suoraan tai välillisesti? Agentit myös käyttävät surutta medioiden tekijänoikeudellista sisältöä, mikä taitaa valitettavasti olla tuulimyllyjä vastaan taistelemista. Kyyninen voisi myös sanoa, että joissain medioissa tekoälyn tekemää sisältöä kuluttaa pian – tekoäly. Mihin jäi ihminen.
Riskinä on myös tietoturva. Jotta agentit pystyvät toimimaan, niille on annettava pääsy niihin järjestelmiin joissa haluat niiden toimivan, kuten vaikkapa kalenteriisi. Tässä kohtaa huomaan itse, että raja tulee vastaan, kun käytän kaupallisia ei-suljetussa järjestelmässä olevia työkaluja: en mielelläni anna niille pääsyä mihinkään, mihin ei ole pakko, koska en luota niihin tarpeeksi.
Mitä tulee mediaan ja etenkin journalismiin, agenteissa on helppo nähdä isoja mahdollisuuksia esimerkiksi tutkivien toimittajien työkaluihin: voit rakentaa helposti esimerkiksi agentin, joka kahlaa puolestasi tietoa haluamaltasi seuranta-alueelta. Tähän suuntaan jotkut mediat ovatkin jo omia tekoälytyökalujaan vieneet. Mahdollisuuksia on myös esimerkiksi personoitujen uutiskirjeiden tuunaamisessa – sellainen kun on helppo rakentaa jo nyt itse täysin haluamakseen, kuten tämäkin kokeilu osoitti.
Dagens Media: 15 esimerkkiä toimitusten tekoälyapureista tai asiakkaille näkyvistä tekoälyhankkeista
Käännökset ja tiivistelmät on tehty tekoälyllä. Oikeellisuuden tarkasti ihminen eli minä. Alkuperäinen juttu löytyy täältä. Olen mahdollisuuksien mukaan linkannut kunkin median työkalua käsittelevään juttuun tai itse työkaluun, mikäli kyse on asiakkaille tarkoitetusta sellaisesta, eikä toimituksen sisäisestä työkalusta.
Talargranskningen (Helsingborgs Dagblad): Työkalu puhdistaa ja jäsentää kuntien päätäntäelinten kokousten vaikeaselkoiset lokitiedostot helposti analysoitavaan muotoon. Tekoäly muuntaa tekniset tiedostot luettavaksi dataksi, tunnistaen ja erotellen puheenvuorot, puhujat ja aiheet. Tämä mahdollistaa esimerkiksi tilastojen luomisen puheajan jakautumisesta eri puolueiden tai henkilöiden kesken. Työkalun avulla HD teki artikkelisarjan poliitikkojen aktiivisuudesta ja julkaisi koko materiaalin tietokantana lukijoiden tutkittavaksi.
Mitt i bruset AI (Dagens Industri/Di Digital): Työkalu vastaa käyttäjien kysymyksiin erityyppisten elinkeinoelämän johtajien haastattelujen pohjalta. Järjestelmä on koulutettu Dagens Industrin tekemien haastattelujen sisällöllä. Käyttäjät voivat esittää kysymyksiä esimerkiksi johtamisesta tai siitä, miten menestyä. Tekoäly etsii ja yhdistelee olennaista tietoa haastatteluista muodostaakseen vastauksen. Tämä mahdollistaa vuorovaikutuksellisen tavan tutustua haastattelujen sisältöön ja saada käytännön vinkkejä yritysjohtajilta.
Valkompisen (Aftonbladet): Työkalu vastaa EU-vaaleihin liittyviin kysymyksiin Aftonbladetin toimittajien kokoaman tietokannan perusteella. Käyttäjät voivat kysyä esimerkiksi puolueiden kannoista tai EU:n toiminnasta, ja tekoäly muodostaa vastaukset. Valkompisen vastasi yli 150 000 kysymykseen EU-vaalien 2024 yhteydessä.
Chef GPT (Tidningen Chef): Työkalu luo käyttäjille johtamiseen liittyviä artikkeleita Chef-lehden 10 vuoden juttuarkistosta. Se käyttää RAG-tekniikkaa (Retrieval Augmented Generation), joka yhdistää tiedonhaun ja tekstin generoinnin. Käyttäjä voi kysyä esimerkiksi ”Miten pidän tehokkaan kehityskeskustelun?”, ja työkalu etsii olennaista tietoa arkistosta ja muodostaa sen pohjalta uuden artikkelin otsikoineen, ingresseineen ja AI-generoituine kuvineen. Käyttäjä voi esimerkiksi etsiä ratkaisuja tietyntyyppiseen johtamistilanteeseen, johon tekoäly tekee ratkaisuksi uuden artikkelin arkistomateriaalin pohjalta.
Aftonbladet Podcast Studio (Aftonbladet): Työkalu tuottaa automaattisesti uutispodcasteja toimittajien valitsemista aiheista. Järjestelmä tiivistää valitut uutisartikkelit, luo käsikirjoituksen ja tuottaa valmiin podcast-jakson käyttäen tekoälyääntä. Toimittajat valvovat prosessia ja varmistavat journalistisen laadun. Koko tuotanto tapahtuu alle 15 minuutissa. Tämä on mahdollistanut ”Update”-nimisen päivittäisen uutispodcastin tuotannon, joka on kerännyt noin miljoona kuuntelukertaa syyskuusta 2024 lähtien.
Aftonbladet Daily Arabic (Aftonbladet ja Alkompis): Työkalu kääntää Aftonbladetin suositun Daily-podcastin arabiaksi. Tekoäly kääntää ensin podcastin tekstin, minkä jälkeen toimittajat tarkistavat ja korjaavat käännöksen. Lopuksi teksti muunnetaan puheeksi tekoälyäänen avulla. Tämä mahdollistaa nopean ja kustannustehokkaan tavan tuottaa arabiankielistä uutissisältöä viikoittain. Podcastin avulla Aftonbladet tavoittaa arabiankielistä yleisöä, joka muuten jäisi kielimuurin takia tavoittamatta.
Lyssna på Hippson (Hippson/Everysport): Työkalu muuntaa Hippson-lehden artikkelit äänimuotoon AI-generoidulla äänellä (esimerkki). Järjestelmä on koulutettu lehden päätoimittajan äänellä. Se analysoi artikkelin tekstin, optimoi sen puhuttavaan muotoon ja luo äänitiedoston, joka kuulostaa päätoimittajan lukemalta.
Lyssna på toppnyheter (NTM Media): Työkalu koostaa ja lukee ääneen UNT.se-sivuston (Upsala Nya Tidning) viisi luetuinta uutista tunnin välein. Se kerää suosituimmat uutiset, tiivistää ne sopivaan muotoon ja luo niistä äänitetyn uutislähetyksen tekoälyäänen avulla. Järjestelmä tuottaa lähetyksen automaattisesti joka tunti klo 7-23, sisältäen intron ja outron. Toimitus tarkistaa jokaisen lähetyksen ennen julkaisua. Tämä mahdollistaa jatkuvan, ajantasaisen uutisvirran kuuntelijoille ja vie mediataloa lähemmäs ”fluid content”-ajattelua, jossa sama sisältö mukautuu eri formaatteihin.
Nyhetskollen (HD-Sydsvenskan): Työkalu tiivistää yön ja aamun uutiset podcastia varten. Se analysoi useita uutisartikkeleita, tunnistaa tärkeimmät tiedot ja muodostaa niistä tiivistelmän, joka sopii ääneen luettavaksi podcastissa. Työkalu muotoilee tekstin puhekielisemmäksi ja varmistaa, että kaikki numerot ja lyhenteet on kirjoitettu auki oikeaa ääntämistä varten. Tämä säästää toimittajien aikaa kiireisessä aamutyössä ja mahdollistaa nopean uutiskatsauksen tuottamisen.
AI-kompisen (NTM Media): Työkalu generoi otsikoita ja nostoja artikkeleihin. Järjestelmä on integroitu NTM:n toimitusjärjestelmään. Se analysoi artikkelin sisällön ja luo ehdotuksia pääotsikolle, alaotsikolle sekä printtijulkaisun nostoille. Toimittajat voivat käyttää ehdotuksia lähtökohtana ja muokata niitä tarpeen mukaan.
Automatiserad verifiering av spelare (Eliteprospects): Työkalu tarkistaa pelaajien henkilöllisyyden automaattisesti. Se vertaa käyttäjien lähettämiä henkilötietoja ja dokumentteja Eliteprospects-sivuston tietokantaan. Jos tiedot täsmäävät, profiili voidaan verifioida automaattisesti. Epäselvissä tapauksissa tai huipputason pelaajien kohdalla järjestelmä ohjaa tapauksen manuaaliseen käsittelyyn. Tämä on säästänyt huomattavasti asiakaspalvelun aikaa.
SEO-contentgenerator (Everysport Media Group): Työkalu luo hakukoneoptimoitua sisältöä urheiluaiheista Eliteprospects-sivustolle. Se yhdistää SEO-analyysin ja tekstin luomisen. Ensin se tunnistaa avainsanoja, joilla sivusto voisi parantaa hakukonenäkyvyyttään. Sitten se luo näihin avainsanoihin perustuvaa sisältöä, kuten otteluraportteja tai pelaajaesittelyjä. Sisältö optimoidaan automaattisesti hakukoneita varten. Tavoitteena on lisätä sivuston orgaanista liikennettä ja parantaa sen sijoituksia hakutuloksissa.
Notisgenerator (Tidningar i Norr): Työkalu kirjoittaa uutisia poliisin ja ilmatieteen laitoksen tiedotteista. Järjestelmä seuraa reaaliajassa poliisin RSS-syötteitä ja SMHI:n säävaroituksia API:n kautta. Kun uusi tiedote ilmestyy, tekoäly muotoilee siitä uutismuotoisen tekstin. Työkalu on räätälöity huomioimaan paikalliset alueet ja tapahtumien tyypit. Luodut uutiset lähetetään toimitukselle tarkistettavaksi ennen julkaisua. Tämä mahdollistaa pienille paikallistoimituksille (2-5 henkilöä) nopean reagoinnin paikallisiin tapahtumiin ja laajemman uutistarjonnan.
Quizmakaren (Tidningar i Norr): Työkalu luo tietovisoja julkaistujen artikkelien pohjalta (esimerkki). Se analysoi Tidningar i Norr -konsernin julkaisemia artikkeleita ja luo niiden pohjalta monivalintakysymyksiä. Se voi keskittyä esimerkiksi viikon luetuimpiin artikkeleihin tai tiettyyn aihealueeseen, kuten urheiluun tai lemmikkeihin. Tekoäly luo useita kysymysvaihtoehtoja, joista toimitus valitsee sopivimmat julkaistavaan visaan. Tämä mahdollistaa interaktiivisen sisällön tuottamisen pienillä resursseilla ja lukijoiden sitouttamisen uudella tavalla.
Nyhetsaggregator (Everysport): Työkalu kerää, luokittelee ja arvioi uutisia eri lähteistä. Se seuraa määriteltyjä RSS-syötteitä ja verkkosivuja, analysoi uutisten otsikoita, tiivistelmiä ja metatietoja tekoälyn avulla, luokitellen uutiset aihepiireittäin ja arvioiden niiden tärkeyden. Järjestelmä myös ryhmittelee samaa aihetta käsittelevät uutiset yhteen, mikä helpottaa kokonaiskuvan muodostamista ajankohtaisista aiheista. Työkalu on vielä testivaiheessa.
Iso kuva: Thomson Reuters -säätiön raportti tekoälytyökalujen käytöstä journalisteilla – kolme nostoa
EDIT: lisäys 7.2.2025. Alma Median journalisteille tarkoitetuista työkaluista kerrottiin 5.2. järjestetyssä tapahtumassa laajalti. Niistä voit lukea enemmän Linkedin-postauksestani.
Muistikirjan ja tekoälysovelluksen yhdistelmäksikin kutsuttu Googlen NotebookLM-työkalu on erinomaisen hyödyllinen yhteenvetojen tekemiseen uusilla tavoilla, jollaisiin perusbotti ei kykene. Gemini-tekoälymallia hyödyntävälle NotebookLM:lle voi syöttää lähdemateriaaliksi esimerkiksi pdf-dokumentin, Youtube-videon, äänitiedoston tai nettisivun, tai vain tekstiä.
Käyn tässä blogikirjoituksessa esimerkin kautta läpi, miten NotebookLM jäsensi mediayhtiöiden Sanoma ja Alma Media vuoden 2024 puolivuotiskatsauksia (34 ja 28 sivua, pdf-muodossa). Listaan lopuksi myös työkalun plussat ja miinukset tämän kokeilun pohjalta.
Jos käytät Googlen palveluita, voit käyttää NotebookLM-työkalua ilmaiseksi menemällä kirjautuneena osoitteeseen notebooklm.google ja klikkaamalla painiketta “Kokeile NotebookLM:ää”. Tämän jälkeen työkalu pyytää sinua luomaan “työkirjan”. Tämän jälkeen avautuu näkymä, johon kirjoitetaan, liitetään tai linkitetään haluamasi lähdemateriaalit.
Kun lähdemateriaalit on lisätty, aukeaa näkymä, joka antaa valmiin yhteenvedon ja joukon ehdotettuja kysymyksiä, joita klikkaamalla voit chättäillä lähdemateriaalista (joka näkyy vasemmassa reunassa, kuva alhaalla). Voit toki kirjoittaa myös omia kysymyksiä. Julkisuudessa ehkä eniten keskustelua herättänyt ominaisuus on kahden puhujan audioyhteenveto napinpainalluksella (oikea yläkulma), mutta suomeksi tätä ei vielä ole saatavissa:
Tässä esimerkkejä, millaisiin muotoihin NotebookLM taivutti Alman ja Sanoman puolivuotiskatsauksia joko esiasetettujen kysymysten tai itse esittämieni toiveiden pohjalta:
1) Alma Median strategiset riskit -tiivistys. NotebookLM:n erinomainen ominaisuus on lähdepallukoiden (kuvassa harmaalla) tuominen vastauksen yhteyteen. Kun viet kursorin pallon päälle, näet kohdan, johon tiivistys perustuu:
2) Lähdemateriaalin saa halutessaan vierelle isommin juoksemaan, kuten tässä esimerkissä Sanoman listaamista toimintaympäristön muutoksista:
3) Tässä tiivistyksessä on käyty läpi Sanoman tunnistamia strategisia riskejä. Kysymys (ylänurkassa) oli jo valmiina odottamassa, kun latasin materiaalit, joten riitti vain, kun klikkasin sitä ja sain vastauksen:
4) Tässä NotebookLM jäsensi Sanoman katsauksen aikajanaksi, jossa tosin oli hieman virheitä (Sanoma hankki Starkin elokuussa 2022 eikä elokuussa 2023). Alussa todetaankin, että lähdemateriaali on aikajanan luomiseksi hankala, mutta toiminto on parhaimmillaan erittäin kätevä:
5) Tällaisen käsikirjoituksen NotebookLM tekisi Sanoman puolivuotiskatsauksesta, jos juontajia olisi kaksi (kokeilin myös erikseen ladata lähteeksi audiotiedoston ja ohjeistin käyttämään samankaltaista jutustelevaa äänensävyä kuin tiedostossa, mutta tämä onnistui vaihtelevasti):
6) Tässä esimerkissä NotebookLM on automaattisesti luonut liitetyistä tiedostoista kysymyksiä ja vastannut niihin. ”Usein kysyttyä” on yhtenä oletuspainikkeena lähtönäkymässä. Jostain syystä tämä toimi minulla toistuvasti niin, että tähän yhteyteen työkalu ei tuonutkaan lähdeviittauksia, kuten yleensä – näitä tietoja en ole tarkastanut:
NotebookLM-työkalun plussia ja miinuksia
Plussat:
Lähteytyksen laatu: klikkaamalla pääsee heti tarkistamaan tiedon.
Lähteytysmahdollisuuksien monipuolisuus.
Hallusinointia oli yllättävän vähän.
Työkalun erilaisuus ja freesiys verrattuna perus-tekoälybotteihin.
Miinukset:
Tiedot täytyy edelleen tarkistaa myös erikseen – kuten työkalussakin todetaan: “NotebookLM voi edelleen antaa epätarkkoja vastauksia, joten sinun kannattaa ehkä tarkistaa faktat erikseen”. Etenkin jos lähdemateriaalissa on ääntä ja videota tekstin lisäksi, tarkistaminen on aikaaviepää.
Säätäminen. Lähdemateriaalien, asetusten ja komentojen kanssa kikkailemisessa menee lopulta aikaa, mikä on syytä huomioida. Vastaukset täytyy myös muistaa erikseen tallentaa muistiinpanoiksi, muuten ne eivät säily tallessa.
Pidemmittä johdannoitta listaan tähän lähdelinkkeineen esimerkkejä tekoälytyökaluista, joita mediataloissa käytetään toimituksellisen työn apuna. Lista perustuu julkisesti löydettävissä oleviin lähteisiin, jotka olen linkannut asiayhteyteen. Lista on uutistoimituspainotteinen, vaikka työkaluja käytetään muuhunkin.
SUOMI
Alma Media – mm. “vastaväittelijä”-toiminto, tekstin muuttaminen puheeksi koneäänen avulla, tekstien tiivistäminen, kuvatekstien automaattinen luominen, kääntäminen…
Alma Median vuoden 2024 puolivuotiskatsauksessa todetaan, että uusi AI-tiimi aloitti työnsä “ja ensimmäiset toimituksellista työtä avustavat työkalut otettiin käyttöön”.
Sanoma – tiivistäminen, ennakoiva otsikkoanalytiikka ja ehdotukset toimittajille…
Helsingin Sanomien ja Ilta-Sanomien yhteinen tekoälytiimi aloitti työnsä alkuvuonna 2024. Sen tehtävänä on “testata, ideoida ja myös kriittisesti arvioida omaan työhön vaikuttavia työkaluja”. Työkaluista ei ole kovin paljoa julkisesti saatavilla olevaa tietoa. Joitain esimerkkejä on mainittu Sanoman toimitusjohtajan Rob Kolkmanin esityksessä vuodelta 2024 (sivu 13).
Washington Post – “Neulaa-heinäsuovasta-etsijä” laajojen tietomassojen käsittelyyn
Washington Post julkaisi 18. elokuuta ensimmäisen jutun, joka perustuu uuden Haystacker-nimisen tekoälytyökalun käyttöön. Työkalu mahdollistaa suurten tietomäärien seulomisen ja niistä erilaisten ilmiöiden ja trendien havaitsemisen. WP:n teknologiajohtajan mukaan kaupalliset yleiskäyttöiset työkalut eivät pysty vastaavaan. Toistaiseksi työkalua käyttävät visuaalisen journalismin tekijät ja datajournalistit.
Ensimmäinen Haystackerilla tehty juttu käsitteli 700:aa maahanmuuttoa käsittelevää vaalimainosta ja sitä, miten kuvia tai tekstiä oli manipuloitu harhaanjohtavien väitteiden luomiseksi. Haystacker mm. otti automaattisesti stillejä mainosvideoista.
WP:n mukaan Haystackeria voidaan käyttää missä tahansa suuressa tietoaineistossa, joka on käytettävissä joko julkisen rajapinnan kautta tai toimitukselle suoraan annettuna.
+ bonus: aihetarjonnan monipuolisuusmittari eliamerikkalaisten yliopistotutkijoiden kehittämä Media Bias Detector
Nimestään huolimatta tämä työkalu ei ota kantaa uutisjuttujen puolueettomuuteen, vaan mittaa käytännössä juttuaiheiden tarjonnan monipuolisuutta: sitä, montako juttuartikkelia mistäkin aihepiiristä on tietyllä ajanjaksolla kussakin mediassa ollut. Tekoälyn rooli työkalussa on tehdä sellaista sisältöanalyysiä, jota vielä muutama vuosi sitten teki ihminen. Esimerkkikuva alla.
Generatiiviset tekoälyt alkavat olla jo erittäin hyviä tiivistämään, kääntämään ja versioimaan. Kielellinen laatu on niin korkeatasoista, että vaarana on unohtaa mallien yhä hallusinoivan, eli tietojen tarkistaminen on toistaiseksi yhtä tärkeää kuin ennenkin.
Latasin kolmelle tekoälylle pdf-tiedoston, joka sisältää Oxfordin yliopiston Reuters-instituutin Digital News Report -raportit vuosilta 2014 ja 2023, yhteensä 256 sivua.
“Tämä pdf-tiedosto sisältää kaksi media-alaan liittyvää tutkimusraporttia Oxfordin yliopiston Reuters-instituutilta. Toinen on Digital News Report vuodelta 2023 (sivut 1–160) ja toinen Digital News Report vuodelta 2014 (sivulta 161 eteenpäin). Olet mediatoimialaa seuraava analyytikko. Tehtävänäsi on tiivistää kumpikin englanninkielinen tutkimusraportti mahdollisimman selkeälle suomen kielelle niin, että nostat kummastakin raportista 5 keskeistä havaintoa. Tee yksi lyhyt lause per havainto. Tekemäsi tiivistelmän kohderyhmänä ovat henkilöt, jotka eivät tunne media-alaa hyvin, joten tee tekstistä mahdollisimman ymmärrettävää. Kun olet listannut kummankin vuoden raportista keskeiset havainnot, vertaile sen jälkeen kumpiakin raportteja kokonaisuudessaan toisiinsa ja kerro 5 keskeistä asiaa, jotka ovat yhdeksässä vuodessa muuttuneet.”
Kielellisesti kaikki tekoälyt tekivät mielestäni hyvää jälkeä, vaikka paikoin vielä huomaa, että aivan täydellistä ei ole. Mutta muutos esimerkiksi vuoden takaiseen tasoon on merkittävä. Pienellä jatkopromptailulla kieltä ja tiettyä aikamuotojen horjuntaa olisi vielä saanut parannettua. Eniten itseäni häiritsee otsikoiden tavuviiva, kun pitäisi olla ajatusviiva, heh. Substanssin osalta en heti huomannut suuria virheitä. Painotukset hieman vaihtelevat.
Tulokset löytyvät rinnakkain pääkuvasta. Tässä slideshow’na:
Digital News Report on maailman suurin uutistutkimus, jonka osana julkaistaan vuosittain myös Suomen-maaraportti Uutismedia verkossa. Digital News Report 2024 & Uutismedia verkossa 2024 julkaistaan tänä vuonna 17. kesäkuuta. Tiivistän tulokset blogiin. Aiempia kirjoituksiani DNR:stä löydät täältä.