27 Eylül 2009 Pazar

Mitsubishi - Computer Vision for Computer Graphics - 1

İnternette bilgisayarlı görü ile ilgili dolaşırken Mitsubishi'nin 1999 yılında !!! yazılmış bir makalesine denk geldim. Teknik detaydan çok yaklaşımları konu alan makalenin bir özetini paylaşmak istedim.


Bu makalede daha çok, bilgisayarlı görünün insan-bilgisayar arasında bir iletişim arabirimi olarak hangi aşamalarda olabileceği irdelenmiş. Şöyle ki:


Bilgisayara bağlı bir kamera ile görü, insan ve bilgisayar etkileşimini geliştirecek potansiyeli yüksek bir tekniktir.Çeşitli algoritmalarla nesnelerin takibi yapılabilir, nesneler tanımlanabilir ve bu imkanlar üzerine birçok ilginç uygulama bina edilebilr. Örneğin ben en yakında duyduğum uygulama, masa üzerinde org tuşları çizilmiş bir kağıda parmak hareketleri ile dokunarak bilgisayardan org çalmaktı. (bkz: http://www.hamdikavak.com/projeler/ -- Hamdi Kavak' ı tebrik ediyoruz güzel bir olay. Ellerine sağlık ).

Ayrıca bu potansiyeli farklı nesneleri kontrol etmek için de kullanabiliriz. Örneğin televizyon kumandası, el hareketleri ile ilerleyen mini robotlar, fare kullanmak zorunda kalmayan grafikerler, hastalar ve askeri uygulamalar vs...

Yukarıda bahsi geçen uygulamalar genelde gerçek zamanlı sistemler olduğundan dolayı programların hem güvenilir hem de hızlı tepki verir olmaları gerekir. Binlerce insan, akedemik ve özel sektör olarak bu tür uygulamalar için algoritmalar geliştirmektedirler. Bazı durumda ön işlemci olarak donanım bu tür uygulamalar için arada görev kapabiliyor. Çeşitli yapay retinalar resmin hazırlanmasında ve işlenmesinde görev üstlenebiliyor. Performans kıstası çok önemli olduğundan donanım ve yazılım aralarında paslaşmalar yapıyor.

Bu tür bilgisayarlı görü uygulamalarının önündeki klasik ve büyük engelden birisi ise, yapılmak istenen görevin 30-40 tl arasındaki oyun aletleri ile yapılabiliyor olmasıdır. Bu durumda uygulamaların maliyeti azaltılmalı ve kullanımı cazip olmalıdır. Fakat ucuz web-camlarla dahi çalışabileceğinden bu pek sorun gibi durmuyor.

Bir diğer sorun ise daha teknik bir durum. Üretilen uygulama, her farklı insanda, belirli komutlar için aynı sonucu üretmesini gerekir. Farklı arkaplan ortamlarında, farklı el tiplerinde vs... birçok değişken mevcut. Bu durumda görüntü işleme kısmında basitleştirme ön plana çıkıyor. Bu kısımda ise bir takım kolaylıklar mevcut. Bu tür programlar genelde iyice tanımlanmış bir problem üzerine inşa edilir. Örneğin bir trafik takip sistemi varsa araçları gökyüzünde veya asfalt olmayan dağlık bölgelerde aramaması gerektiği söylenebilir. Bu durumda problem alanı kısıtlanmış olur.

Diğer bir kolaylık ise insanın bilgisayarın anlayacağı dili rahatça kavrayabilmesidir. Eğer bir denemede sonuç alamadıysa ona yakın farklı şekillerde deneyip doğru sonucu elde etme yollarını öğrenecektir.

Diğer seride görüşmek üzere...

İyi çalışmalar...

0 yorum:

Yorum Gönder