Datorer ser på världen
av Caj Södergård Forum 1981-14, sida 30-31, 23.09.1981
Ö Den datoriserade bildbehandlingen baserar sig på två innovationer som har stor inverkan på vår vardag. Den ena är TV-kameran som fångar upp den bild som överförd visas i våra televisioner. Den andra innovationen är datorn som är tillgänglig i allt mindre format, allt billigare och med allt större beräkningskapacitet. En TV-kamera kan idag fås för under 10 000 mk och en lämplig dator kostar kanske det dubbla. Detta formliga prisras på komponenterna är den drivande kraften i spridningen av bildbehandlingstekniken.
De första försöken att sätta datorer att arbeta på bilder gjordes i början av 60-talet. Rymdfarkoster tog TV-bilder och överförde dem till markstationerna. Vid överföringen uppkom ordentligt med störningar som måste filtreras bort.
Här tog man till hjälp datorer som vid den tiden var skrymmande och fyllde hela rum, Vid samma tider började den militära upprustningen fordra allt sinnrikare apparatur för snabb identifiering av militärt intressanta objekt i flygbilder samt automatisk registrering av rörliga föremål i radarbilder.
De första mönsterigenkänningssystemen såg dagens ljus. Sedan dess har applikationerna bokstavligt talat ryckt närmare jorden och kommit att tjäna också mera humana syften, tex inom medicinen.
Bilden förvandlas till siffror
Utgångspunkten för bildbehandlingen är en sönderbrytning av bilden i punkter av olika gråhetsgrad. (Fotografierna t ex i detta nummer av Forum är uppbyggda av rasterpunkter enligt samma princip).
Vill man ha en färgbild används flera ”svart-vita” kameror som fångar in bildföremålet genom olika färgade filter. Då kommer tex de röda partierna i bilden att ge sig till känna som vita för den kamera som tittar igenom det röda filtret.
Kameran kan göras känslig inte bara för synligt ljus, utan även för infrarött (värmestrålning) och ultraviolett.
Intresserar innandömet i bildföremålet kan man genomstråla det med röntgenstrålar, radiovågor eller t o m elektroner och låta kameran registrera skuggorna.
När en bild väl har tagits, oberoende av sättet, fås den ut från kameran i elektrisk form, d vs varje bildpunkt representeras av en elspänning, vars storlek är proportionell mot punktens ljushet. En vit punkt kan t ex generera spänningen 5 V medan en helsvart punkt ger O V.
Innan bilden kan överföras till datorn måste el-spänningarna anges som siffror (digitaliseras), eftersom siffror är det enda som datorer begriper. Efter sifferomvandlingen lagras bilden såsom en siffertabell i datorminnet. Om en vanlig svart-vit TV-bild analyseras, innebär detta att en tabeli av dimensionen 600—462 30
Datorer ser på världen
Mikroskopet, teleskopet och fotografiet är uppfinningar som utsträckt den mänskliga synförmågan till det mycket lilla, till det mycket avlägsna och till det förgångna. På senare år har ett nytt hjälpmedel för våra ögon tillkommit, när man satt datorer att behandla och analysera elektroniskt fotograferade bilder. Denna teknik har tillämpningar inom så skilda områden som medicin, telekommunikation, administration och industriell produktion. För en bredare allmännhet torde röntgentomografin, som belönades med 1979 års Nobelpris i medicin, vara den mest kända tillämpningen.
innehållande 375 000 siffror lagras. Siffrorna är i minnet uttryckta i det binära talsystemet, d vs som en följd av nollor och ettor (tex ljusnivån anges som 1001).
Den elektroniska kameran kan ge en bild med flera hundra ljusnivåer. I detta hänseende överträffar den människoögat som får nöja sig med att särskilja mellan 30—60 gråtoner. Ett sätt att artificiellt utsträcka ögats gråskala är att tilldela de elektroniskt uppmätta ljusnivåerna färger (s k pseudofärger).
Ögat är nämligen mycket känsligt för färgnyanser (vi uppfattar flera tusen färgnyanser). Hur många ljusnivåer som används i bildanalysen beror av tillämpningen — en större upplösning fordrar större datorkraft.
Själva bildbehandlingen består i en serie aritmetiska och logiska operationer som utförs på de i datorminnet lagrade bildpunkterna. Operationerna sker i tur och ordning enligt de instruktioner, som finns nedskrivna i datorns program, också det lagrat i datorminnet.
Själva bildbehandlingen består i en serie aritmetiska och logiska operationer som utförs på de i datorminnet lagrade bildpunkterna. Operationerna sker i tur och ordning enligt de instruktioner, som finns nedskrivna i datorns program, också det lagrat i datorminnet.
Programmet är datorns ”själ”, via vilken programmeraren bestämmer hur bilden skall manipuleras. Manipuleringen har två huvudsyften: en framställning som lättare kan uppfattas och förstås av människan eller alternativt en automatisk tolkning av bilderna, vilket är betydligt mera ambitiöst.
Datorn förädlar bilder
Det finns många skäl till att försöka ”förbättra” en bild och göra den förståeligare. Ett skäl är uppenbart för alla TV-tittare — atmosfäriskt bru förvanskar bilden och måste avlägsnas innan bilden presenteras. En liknande situation föreligger vid röntgenfotografering av människokroppen. Vävnader, som omger det intressanta området, bildar störningar på röntgenbilden,
Ifall datorn kan sila bort detta brus klarar man sig med lägre röntgendoser, vilket är mycket välkommet för patienter som genomgår långa röntgenundersökningar. På Malmö allmänna sjukhus provas som bäst ett bildfilter, som möjliggör en sänkning av dosen ända ner till en tiondedel av den normala. Man låter datorn multiplicera bilden med sig själv tusentals gånger varvid bruse byggs bort. Datorn kan också skapa en tredimensionell — framställning — (längd bredd, höjd) av ett föremål genom att summera ihop bilder som tagits från olika vinklar. Detta är principen bakom röntgentomografin, som gav sina uppfinnare 1979 års Nobelpris i medicin. Tomografin ger läkaren möjlighet att detaljstudera inre organ i olika perspektiv. Priset på anläggningarna är högt — det rör sig om flera miljoner mark.
Till det mänskliga ögats begränsningar hör att det kan varsebli endast ett smalt område i det elektromagnetiska vågspektret — våglängderna 0,4—0,7 miljondels meter. På samma sätt som när det gällde ljusnivåer kan elektroniken töja på begränsningarna. Värmestrålningen tex från människor avfotograferas med kameror känsliga för det långvågiga infraröda ljuset. Dessa värmebilder databehandlas i normal ordning och färgsätts på bildskärmen med pseudofärger för att särskilja på regioner med olika temperatur. Om känsligheten är tillräckligt god kan tom medicinska diagnoser göras från värmebilder av människokroppen (t ex cancertumörer har spårats på detta sätt).
I en annan medicinsk tillämpning sker
FORUM 14/81
System för elektrooptisk analys av sågvaror under utveckling på Oy Decon Ab i Esbo, I förgrunden syns TV-kameran som skickar en beskrivning av brädan till datorn i bakgrunden. På bildskärmen kan sedan den datorbehandlade bilden studeras.
det motsatta. Ett fluorescerande ämne injiceras i patientens blodsystem, varefter snabba bildsviter tas i ultraviolett ljus på en svartvit film, som datorn sedan färglägger för att avslöja tex cirkulationsrubbningar.
En bild säger mer än tusen ord
Förutom att datorbehandling kan tydliggöra bilder, kan den också användas till att förtydliga fakta, trender och beroendeförhållanden av ekonomisk, samhällelig och politisk art.
Siffertabeller och resonemang översätts på bildskärmen till mångfärgade staplar, kakdiagram, kurvor o s v. Slagkraften i den grafiska presentationen ligger i att människor som planerare, beslutsfattare och processövervakare mycket snabbt kan skaffa sig en överblick över väsentligheter i aktuella situationer och komplexa beroendeförhållanden.
Uppståndelsen runt Romklubbens ”domedagsrapport” illustrerar på sätt och vis betydelsen — men också risken — i en sådan visualisering. Rapporten komprimerade världens utveckling i ett fåtal lättfattliga grafiska figurer istället för att bjuda ett myller av siffror — och effekten var omedelbar!
Talesättet ”en bild säger mera än tusen ord” träffar på en biologisk sanning. Hjärnan består sig nämligen med två slag av uppfattningssätt — symbolisk följdbehandling och grafisk parallellbehandling. Det förstnämnda är förknippat med vårt muntliga och skriftliga språk, med vårt matematiska och logiska tänkande, medan det andra uppfattningsättet står för förmågan att blixtsnabbt uppfatta rumsliga relationer och mönster. Hjärnans visuella kapacitet är enorm — ögonens 2 miljoner receptorer ger en bild, som analyseras på 1/24 sekund. Hjärnans
FORUM 14/8 visuella funktionsätt är i själva verket av betydligt äldre datum än det symboliska — språket kom in på ett relativt sent stadium i evolutionen.
Den grafiska presentationen är ännu användbarare om systemet är interaktivt dvs användaren ringar tex med en ljuspenna in partier på bildskärmen för uppförstoring eller annan detaljundersökning. Från detta är inte steget långt till den datorstödda konstruktionen (CAD), där planeraren/konstruktören skisserar ett antal lösningar, kanske en maskin, en byggnad eller en hel stadsplan och därefter låter datorn vrida och vända på de pseudo-tredimensionella skisserna. Det finns de facto system, där man framför en bildskärm kan åka omkring i en stad som endast finns som modell i datorns minne.
Den verkliga utmaningen
Det har hittills endast talats om förädling och generering ay bilder för en bättre förståelse. Den verkliga utmaningen inom den datoriserade bildbehandlingen ligger emmellertid annorstädes — inom automatklassificeringen. Här ska inte människan utan datorn förstå bilden. Det kan förefalla enkelt att automatiskt känna igen handskrivna siffror och bokstäver, men i själva verket har man inte trots stora satsningar i snart 20 års tid idag nått längre än till ca 80 procents träffsäkerhet. Vår egen nationella postnummersorterare i Fredriksberg i Helsingfors vågar sig inte tack och lov på handskrivna siffror, endast på maskinskrivna.
Identifieringen av tryckbokstäver däremot har på senare tid får en strålande tillämpning i en automat som omvandlar tryckt text till blindskrift.
En del identifieringsproblem är ännu svårare, tex bilder tagna av naturlig omgivningar.
Inom medicinen har man försökt automatiskt tolka röntgenbilder i snart 15 års tid. Lungtumörer och hjärtfel har stått i centrum för klassificeringen. Eftersom kraven på säkerhet är mycket höga är principen den att datorn endast ger tilläggsinformation, läkaren ställer som tidigare den slutliga diagnosen. Bildanalysen används också inom cancerforskningen. Man hoppas kunna avslöja tidig cancer i t ex lungvävnaden. Här försöker man alltså nå fram till förändringar innan de hunnit bli synliga för ögat.
Samma strävan att avslöja utvecklingar i deras linda återfinns inom flera områden. Flerfärgsfoton från flygplan analyseras för att utröna om insektangrepp, skorstensutsläpp eller mera långsiktiga temperaturförändringar inverkat menligt på vegetationen.
Likaså har man försökt analysera fram när träd är avverkningsmogna, storleken på skördar och mineralfyndigheter. Från vågbilder har man t o m försökt sluta sig till hur mycket energi ett vågkraftverk kunde leverera.
Seende verkstadsmaskiner
Den datoriserade bildbehandlingen håller på att göra sitt intåg också i fabrikssalarna. Här tjänar den främst till att förse robotar med syn (om än en mycket begränsad sådan) samt till att sörja för kvalitetsövervakning och -sortering.
På ett modernt större sågverk, för att ta ett exempel, passerar en bräda per två sekunder förbi kvalitetssorterarens ögon. På denna tid ska sorteraren hinna fastställa brädans kvistighet, vankanter och andra defekter och summera dessa faktorer till en total kvalitetsbedömning samt därtill bestämma var brädan ska kapas.
Automatiska trävirkessorteringssystem är under utveckling på olika håll i världen — bl a också i Finland. Ett annat inhemskt avsyningssystem har gjorts för sortering av malm inom gruvindustrin. I utlandet finns anläggningar för kontroll av elektronikkomponenter, tyger, cellulosafibrer och en rad andra produkter.
Någonting för Finland?
Den datoriserade bildbehandlingen är exempel på ett område, där det i första hand behövs hjärnor och inte investeringar i stora maskinparker. Som sådant tycker man att den skulle göra sig i ett kapitalfattigt land som Finland. Marknaden för bildbehandlingen expanderar snabbt, i USA väntas den tiodubblas inom de närmaste 5 åren.
Eftersom tekniken är ny, finns det ännu sprickor i marknadsbilden, som finländska företag kunde slå in en kil i.
Caj Södergår 31