AI-agenttini asuu koirankopissa, minne se kuuluukin
Olen puuhastellut agenttihommien parissa. Toisin kuin puoli internettiä, en vain asentanut OpenClaw-bottia ja antanut sille kaikkia avaimia digitaaliseen elämääni. Tein jotain eri tavalla. Ensinnäkin otin OpenClaw'n lähdekoodin ja rakensin sen tekoälyavusteisesti alusta saakka uusiksi. Karsin sisällöstä sellaiset toiminnallisuudet, joilla en nähnyt mitään arvoa. Sen jälkeen olen lisäillyt bottiin ominaisuuksia sitä tahtia kun olen nähnyt järkeväksi, kuten vektoritietokannan muistinhallintaan, tietoturvaominaisuuksia ja monenlaisia erikoisempia taitoja.
Tällä hetkellä bottini osaa:
- Vastailla Slack-viesteihin ja keskustella itsenäisesti kanssani.
- Kuunnella ääniviestejä ja ymmärtää, mitä niissä sanotaan.
- Selata verkkosivustoja itsenäisesti tai ohjeistettuna.
- Lukea ja kirjoittaa kalenterimerkintöjä.
- Lukea ja lähettää sähköpostia.
- Lukea ja kirjoittaa tehtäviä Things 3- ja Apple Reminders -ohjelmiin.
- Lukea ja kirjoittaa Google Docs -tiedostoihin.
- Korjata omaa lähdekoodiaan.
- Yhdistellä tietoa useista lähteistä ja tehdä tiedoista synteesejä.
- Vaihtaa tekoälymallia sen mukaan, mikä on järkevää (suosin peruskäytössä järeintä Anthropicin Opusta).
- Päivittää, analysoida ja järjestellä muistiaan.
Yksi tärkeimmistä botin toiminnallisuuksista on Claude Coden käyttäminen autonomisesti. On kohtuullisen päräyttävää seurata, miten botti sanoo itsekseen "hups, tässä on bugi, delegoin sen Claudelle", ja sitten homma vaan toimii. Tietenkin systeemissä täytyy olla turvarajat, jotka mahdollistavat sen, ettei botti ala ihan tekemään omiaan.
Kaikkein isoin juttu on kuitenkin se, että nyt pystyn rakentamaan muistia omalle koneelleni, omilla ehdoillani ja omilla työkaluillani. Kun aikaisemmin olen käyttänyt esimerkiksi Geminiä, Claudea tai ChatGPT:tä, minusta muistiin tallentuvat tiedot ovat bittiavaruudessa. Välillä muisti toimii, välillä ei. Silloinkin kun "muisti" toimii, se on jumissa valmistajan mustassa laatikossa, enkä pääse verifioimaan tai editoimaan muistia mitenkään. Jos käytät useamman eri valmistajan tekoälyä, muisti ei mitenkään maagisesti siirry järjestelmästä toiseen. Gemini ei muista, mitä juttelit ChatGPT:n kanssa ja toisinpäin. Joudut toistamaan itseäsi koko ajan kaikkien mallien kanssa.
Eri valmistajien mallien kanssa keskustellessa tuntui koko ajan siltä, että jokainen kirjoittamani lause on jollain tavalla merkityksetön, koska se jää jumiin jonkun tekoälymallin valmistajan järjestelmään. Yksittäiset keskustelut eivät kasvata mitään korkoa korolle -tyyppistä tietämystä, syvennä osaamista tai mitään muutakaan. Se tuntui köyhältä, tyhjältä ja arvottomalta.
Oman agentin kanssa tilanne on toinen.
Tässä systeemissä muisti on omissa käsissäni. Jokainen kirjoittamani lause rakentaa jotain syvempää tietämystä tulevaisuuden keskusteluja ja oivalluksia kohti. Jokainen kerran kirjoitettu asia tallentuu myöhempää käyttöä varten. Ei tarvitse toistaa itseään loputtomasti. Ei tarvitse kertoa sadatta kertaa, miksi joku periaate on tärkeä ja se tulisi ottaa huomioon päätöksiä tehtäessä. Ei tarvitse selittää kymmeniä kertoja, miten oma bisnes toimii. Tärkeät tiedot on löydettävissä nopeasti, ja yksityiskohtaisemmat muistot on haettavissa tietokannasta tarpeen mukaan.
Miksi tämä on sitten tärkeää?
Koska muisti on avain kaikkeen. Mallit ovat jo riittävän fiksuja kommunikointiin ja järkeilyyn. Ainoa mikä hidastaa AGI:n omaista käyttöönottoa yrityksissä ja siviilipuolella on se, miten malli "muistaa" sinun asiasi, toiveesi, preferenssisi ja keskusteluhistoriasi. Ilman muistia se on vähän sama kuin löisi tyyppiä kivellä päähän, ja homma alkaisi aina alusta kuin Memento-leffassa konsanaan. Työkaluja voi lisätä myöhemmin, osaamista voi syventää loputtomiin, malleja voi päivittää tarpeen mukaan, mutta muisti täytyy rakentaa alusta saakka.

Sen lisäksi minulle on tärkeää, että botti pysyy omalla kaistallaan. Suhtaudun bottiin aivan kuten suhtautuisin uuteen työntekijään. Sillekään ei anneta heti ensimmäiseksi oikeuksia yhtään minnekään, vaan ensiksi katsotaan, miten homma pysyy hallussa. Oikeuksia lisätään sitä mukaa kun luottamus rakentuu eikä ongelmia todistettavasti tule. Silloinkin botille annetaan omat tunnukset eikä jaeta toisten tunnuksia.
Mitä tuolla botilla nyt sitten voi tehdä?
Rehellisesti sanottuna en ole vielä ihan varma.
Tällä hetkellä olen saanut siirrettyä keskustelut kolmesta eri järjestelmästä yhteen paikkaan (Slack), ja jo se on helpottanut elämääni aika paljon. Jos en jostain syystä tykkää Anthropicin malleista, voin vaihtaa lennosta OpenAI:n tai Googlen malleihin. Sen lisäksi botin muisti karttuu hyvää vauhtia, ja se auttaa arkityössä merkittävästi. Botti osaa nyt hakea tietoa eri järjestelmistä, ymmärtää kontekstin ja osaa ehdottaa parannuksia erilaisiin prosesseihin. Jo tässä vaiheessa saan botilta sellaisia oivalluksia elämästäni ja rutiineista, mitä en olisi itse muutoin huomannut.
Mihin suuntaan ikinä tämä homma meneekään, olen all in.