Marjamasiina- hankeen tekniset työt polkaistiin käyntiin edellisenä vuonna meidän harjoittelijoiden loikkiessa pitkin metsiä kuvaillen ja laskien koealoja. Säät olivat suotuisia ja ilmapiiri positiivinen, ja saimmekin syksyyn mennessä paljon materiaalia, noin 10000 kuvaa ja satoja laskettuja koealoja käsiteltäväksi Marjamasiinaa varten.
Vuoden 2021 kesällä marjojen kuvaukseen käytettiin useita kameroita; järjestelmäkameraa sekä high- ja low-end kamerapuhelimia. Kuvia otettiin koealojen päältä ja lähikuvia marjamättäistä annotointia varten. Hankitun kuvamateriaalin avulla tekoäly opetettiin tunnistamaan kuvasta eri lajin marjoja, kypsinä, raakoina ja kukintoina.
Lumien sulaessa ja kevään ollessa jo ovella, vuosi kehitystyötä alkoi olla jo täynnä. Projektin edetessä sen tavoitteet ja tarpeet koneoppimisen kannalta alkoivat selkeytyä, ja tärkeimmät kehityskohteet otettiin suurennuslasin alle.
Tiheyslaskennan tarkennus
Tekoäly määrittelee marjojen tiheyden kuvissa näkyvien marjojen avulla. Tässä hyödynnetään lineaarista regressiokäyrää, joka on muodostettu kerätyn kuva- ja marjalaskentamateriaalin pohjalta. Käytännössä tämä tarkoittaa sitä, että kuvassa näkyvät marjat kerrotaan keskihajonnasta saatavalla käyrän kertoimella, joka vaihtelee kuvattavan marjatyypin mukaan.

Marjamasiina osoittautui eteväksi marjojen tunnistajaksi puolukan ja kypsän mustikan osalta, mutta haasteeksi osoittautuivat mustikan kukka ja raa’at mustikat. Tekoälyllä on havaintojemme mukaan vaikeuksia erottaa niitä taustasta etenkin kuvien heilahtaessa tai ylivalottuessa, jolloin niitä on vaikea etsiä kuvista edes ihmissilmällä. Lisäksi heittoa aiheuttaa kasvupaikka; rehevimmillä paikoilla lehtien peitteisyys ja varjoisuus vaikeuttavat erityisesti raakojen mustikoiden havainnointia. Yllämainitut seikat vaikeuttavat mahdollisimman korreloiva kertoimen luomista tiheyslaskentaan.
Apuna heikommin tunnistettavien marjatyyppien tiheyslaskennan tutkimiseen on kuten voisi olettaa, on suurempi ja tehostetumpi aineisto, jota keräämme kuluvana kesänä. Muutoksena edelliseltä kesältä, kuvaamme lisäksi pienempiä alueita koeruutujen sisältä, joka toivon mukaan parantaa algoritmiä tiheyslaskennan osalta. Lähempää otetuista kuvista marjojen havaitseminen on mahdollisesti helpompaa.
Kuvausta varten valmistimme 50cm*50cm kehikot, joita käytämme koeruutujen laskennan ja kuvaamisen yhteydessä.
¼ Kehikot asetetaan 100cm*100cm koealojen sisäkulmaan ja niiden marjamäärät lasketaan erikseen ja kummatkin kuvataan ylhäältä ja joka kulmasta. Pienten kehikoiden data yhdistetään isojen kehikoiden dataan, jonka avulla voidaan verrata kuinka lähempää kuvaus vaikuttaa marjatiheyteen.

Kuvien pinta-ala
Kuvien pinta-ala on määritetty tähän asti marjojen koon perusteella. Ohjelma laskee täten kuvan pinta-alan suhteessa kuvan marjojen pikselimääräiseen kokoon. Tällä menetelmällä kuvien mittasuhteissa voi olla huomattavaakin heittoa, sillä marjojen koko vaihtelee kasvupaikan mukaan.
Marjamasiinalla otettujen kuvien pinta-alan määrittämisen siirryttiin käyttämään AR- pohjaista ohjelmistoa, joka perustuu tasotunnistukseen. Tasotunnistuksessa tekoäly päättelee kuvan kulmissa esiintyvän neljän pisteen etäisyyden, ja kykenee niiden avulla laskemaan kuvan pinta-alan. Tarkemmalla pinta-alan laskennalla pyritään edistämään tiheyslaskennan tarkuutta. Sovellus toimii kohtuullisesti toimistoympäristössä, mutta pääsemme toivon mukaan testaamaan sitä maasto-olosuhteissa kesän edetessä.
Annotointi
Lisäsimme annotointeja 200 kuvan setillä, joka pitää sisällään pääasiassa mustikan kukkia sekä raakoja mustikoita, niiden tunnistamisen tarkentamiseksi. Poikkeuksena viime vuodesta, puolukan annotoinnissa on siirrytty ainoastaan ryppäiden merkintään, sillä yksittäisten marjojen erottaminen kuvista oli haastavaa.

Marjamasiinan väki toivoo, että teilhyvää marjakesää, joka metsässä saatujen havaintojen perusteella vaikutti olevan vallan mainio!