Artikel från Umeå universitet

Den här artikeln bygger på ett pressmeddelande. Läs om hur redaktionen jobbar.

Föreställ dig datorer som kan förstå målningar eller måla abstrakta bilder på nästan samma sätt som människor. Bo Li har i sitt avhandlingsarbete utvecklat ett banbrytande koncept inom datorseende, interest curves, som baserar sig på kurvor och linjer och breddar området för datorers uppfattning av bilddetaljer.

Med vår mänskliga perception kan vi känna igen föremål genom bilddetaljer så som former och kurvor. Vi kan till exempel identifiera ansikten, djur, bilar och andra vardagsobjekt i enkla skissbilder men för datorer är denna uppgift väldigt utmanande.

Datorseende är ett område som arbetar med att bygga ”seende datorer”, vilka automatiskt bearbetar och ”förstår” innehållet i digitala bilder. Forskningsområdet är i snabb utveckling och noggrann modellering av bilddetaljer är mycket viktigt inom ett brett spektrum av tillämpningar, till exempel bildregistrering, 3D-rekonstruktion och objektdetektering. I framtida teknik såsom Google Car, virtuell verklighet (VR), eller inom artificiell intelligens (AI), kommer bilddetaljer fortfarande vara grundläggande komponenter. Trots att hundratals lösningar för detektering av bilddetaljer redan existerar, har ett stabilt koncept hittills saknats.

Robusta kurvor och linjer
Bo Li har utvecklat ett koncept som innebär ett genombrott inom fältet datorseende: så kallade interest curves.

– Med denna metod kan en dator rita bilder med penseldrag. Interest curves kan också användas av datorn för att känna igen föremål på ett mer exakt sätt, säger Bo Li.

Konceptet ger helt nya möjligheter för förståelse av bilddetaljer, inklusive punkter, regioner, linjer och kurvor. Det gör också att alla dessa funktioner kan rymmas inom samma teoretiska ramverk. Resultatet innebär inte enbart ett teoretiskt framsteg för framtida forskning kring bilddetaljer, det ger också praktisk vägledning till området.

Den viktigaste komponenten för att hitta bilddetaljer är stabilitet, enligt Bo Li. Hans resultat visar att den nya metoden gör de kurvor och linjer som skall detekterasstabila trots bildtransformationer och störningar i bilderna.

Förut har kurvor och linjer inom datorseende inte varit lika populära att använda som punkter och regioner, eftersom de saknar tillräckligt med robusthet. Bo Lis nya teori och algoritmer ändrar nu på detta.

– Kurvor och linjer är naturligt mer användbara än punkter, eftersom människor använder dessa former för att beskriva världen, förklarar Bo Li.

Hans avhandlingsarbete visar på många fördelar med att använda kurvfunktioner för tillämpningar inom datorseende.

Avhandlingen: Interest curves: Concept, Evalutation, Implementation, and Application. På svenska: Interest curves – Koncept, utvärdering, genomförande och applikationer.

Kontaktinformation:
Bo Li, Institutionen för tillämpad fysik och elektronik, Telefon: 076-025 82 01, 090-786 68 24, E-post: bo.li@umu.se

Nyhetsbrev med aktuell forskning

Visste du att robotar som ser en i ögonen är lättare att snacka med? Missa ingen ny forskning, prenumerera på vårt nyhetsbrev!

Jag vill prenumerera