in ,

Kamera İle Nesne Sayma (Bölüm 1)

GÖRÜNTÜ İŞLEME 

İnsan beyninin algıladığı, işlediği ve yorumladığı en önemli bilgi türü görsel verilerdir. “İletişimin %93’ü sözel olmayan verilerden sağlanmaktadır ve beyin görsel verileri yazılı verilere göre 60.000 kat daha hızlı işleyebilmektedir”. Okumak, doğduktan sonra öğrenmemiz gereken bir beceri olsa da; görüntü işleme hepimizin doğuştan sahip olduğu bir beceridir ve görüntülerin dili evrenseldir. 

Günümüzde insanların dikkat süreleri yaklaşık 8 saniyeye kadar düşmüştür. Bu yüzden görsel verilerin pazarlamada kullanımı yaygınlaşmıştır. Görsel verilerin insan faktörünün olduğu her alanda etkili olması, gelişen teknoloji ile birlikte görsellerin oluşturulmasının ve yayılmasının kolaylaşması gibi faktörler milyonlarca görsel veriye anında ulaşmamızı sağlamaktadır. Bu görsel veriler aynı zamanda yeni nesil teknolojiler için iyi bir veri tabanı sağlamaktadır. Yapay zekanın ortaya çıkışıyla, görsel verilerin içerdiği bilgiler sadece insanların algısına etki eden bir reklam aracı olmaktan çıkarak çevremizde kullandığımız çoğu makine görüşü sistemine kaynak olmaktadır. 

Görüntü işlemenin nasıl yapıldığına dalmadan önce görüntü işlemenin tam olarak ne olduğunu bilmek önemlidir. Görüntü işleme en yaygın olarak “Dijital Görüntü İşleme” olarak adlandırılır ve sıklıkla kullanıldığı alan “Bilgisayarla Görme” dir. Daha önceki yazılarımızda “Bilgisayarla Görme (Makine Görmesi)” kavramından bahsetmiştik. Hem görüntü işleme algoritmaları hem de Makine Görmesi algoritmaları girdi olarak bir görüntü alır. Fakat görüntü işlemede çıktı bir görüntü iken makine görmesinde çıktı görüntü hakkındaki bazı bilgilerdir. 

1. Görüntü İşleme Nedir? 

Görüntü işleme, gelişmiş bir görüntü elde etme veya ondan bazı yararlı bilgiler çıkarmak için bir görüntü üzerinde bazı işlemleri gerçekleştirme yöntemidir. Girdinin bir görüntü olduğu ve çıktının bu görüntüyle ilişkili görüntü veya özellikler olabileceği bir sinyal işleme türüdür. Günümüzde görüntü işleme, hızla büyüyen teknolojiler arasındadır. Mühendislik ve bilgisayar bilimlerinde temel araştırma alanını oluşturmaktadır. Görüntü işleme ile görünmeyen nesneler gözlemlenebilir, daha iyi bir görüntü oluşturulabilir, istenilen görüntü aranabilir, görüntüdeki çeşitli nesneler ölçülebilir, bir görüntüdeki nesneler ayırt edilebilir. 

Günümüzde görüntü işleme; tıbbi görselleştirme, otonom araçlar, oyun, kalite kontrol vb. alanlarda yaygın olarak kullanılmaktadır. 

Görüntü işleme teknikleri mevcut resimlerin analizi ile çeşitli bilgiler edinmeye yarayan sistemlerdir. Görüntü işleme teknikleri kullanım yerlerine göre, en basit algoritmalardan en karmaşık algoritmalara kadar farklı matematiksel ifadeler üzerinden çalışmaktadır. 

Şekil 1.1. Görüntünün yakalanması ve sayısallaştırılması 

Analog görüntü işleme ve dijital görüntü işleme olmak üzere iki adet görüntü işleme yöntemi bulunmaktadır: 

Analog Görüntü İşleme: Analog sinyallere uygulanır ve yalnızca iki boyutlu sinyalleri işlemektedir. Fiziksel görüntüleri, çıktıları ve görüntülerin kopyalarını işlemek için kullanılır. Örnek olarak; televizyon görüntüleri, fotoğraflar, fotokopi ve tıbbi görüntüler verilebilir. Analog görüntü işleme yavaş ve maliyetli bir süreçtir. Analog görüntü işlemede giriş ve çıkış her zaman bir görüntüdür. 

Dijital Görüntü İşleme: Bilgisayar algoritmaları yardımıyla dijital görüntüleri işlemek için kullanılmaktadır. Dijital görüntü işlemenin amacı; istenmeyen bozulmaları önlemek ve bazı önemli görüntü özelliklerinin iyileştirilmesini sağlayarak görüntü verilerini iyileştirmektir. Böylece Yapay Zeka veya Makine Görüşü sistemlerimize faydalı veriler çıkarır. Örnek olarak renk işleme, görüntü tanıma, video işleme verilebilir. Dijital görüntü işleme, ucuz ve hızlı bir süreçtir. Dijital görüntü işlemede giriş bir görüntü iken çıkış bir görüntü veya bilgi olabilmektedir. Bilgi olarak çıktı özellikleri, sınırlayıcı kutular, maskelenmiş görüntüler verilebilir. 

2. Temel Görüntü İşleme Adımları 

2.1. Görüntü Elde Etme 

Görüntü işlemede görüntüler, donanım kaynaklı cihazlardan elde edilmektedir. Görüntü işleme tekniklerinde görüntü alma ilk adımdır. Çünkü görüntü elde etmeden görüntü işleme yapılamamaktadır. 

2.2. Görüntü Ön İşleme 

Dijital kameralardan elde edilen görüntülerde, görüntü yakalama sistemlerinin ve aydınlatma koşulları nedeniyle kontrast ve parlaklık hataları meydana gelebilmektedir. Ayrıca görüntüler farklı gürültülere de sahip olmaktadır. Görüntü önişleme ile piksellerin geometrisi ve parlaklık değerleri ile ilgili hatalar teorik matematik modeller kullanılarak düzeltilebilmektedir. 

5 farklı görüntü ön işleme tekniği vardır: 

2.2.1. Görüntülerin Renk Derinliğinin Belirlenmesi 

Görüntülerin renk derinliğini belirlemeye geçmeden önce piksel ve çözünürlük kavramlarını bilmemiz gerekmektedir. Piksel, dijital görüntü üzerinde temsil edilebilen en küçük birimdir. Çözünürlük ise, bir görüntünün inç başına kaç piksel düştüğünü ifade eden bir değerdir. 

Dijital olarak ifade edilen görüntüdeki inç başına düşen piksel sayısı ne kadar fazla olursa o kadar gerçeğe yakın netlikte bir görüntü oluşmaktadır. Ayrıca görüntüyü oluşturan her bir noktanın (pikselin) alabileceği renk aralığı ne kadar fazla ise o piksel de renk havuzundan gerçeğe daha yakın bir renk alacaktır. Buna renk derinliği denir ve bit ile ifade edilir. Görüntülerin temelde 8 bitlik bir aralık olan 0-255 arasında sayılarla dolu matrisler olduğunu anlamamız gerekmektedir. Bu değerler, her bir pikselin parlaklık seviyesine karşılık gelir ve üzerinde bulundukları bit aralığına bağlıdır. Bu bit aralıkları 8 bit ila 30 bit arasında değişmektedir. 24 bitlik aralık genellikle gerçek renk (RGB) olarak adlandırılır. RGB’de her kanal 8 bitlik aralık içerir. 

Örneğin; 

  • 1 bit renk derinliğine sahip bir piksel 21 = 2 adet renk alabilir. (Siyah ve Beyaz (Binary)) 
  • 2 bit renk derinliğine sahip bir piksel 22 = 4 adet renk alabilir. 
  • 16 bit renk derinliğine sahip bir piksel 216 = 65.536 adet renk alabilir. 
  • 24 bit renk derinliğine sahip bir piksel 224 = 16.777.216 adet renk alabilir. (RGB) 
  • 32 bit renk derinliğine sahip bir piksel yaklaşık 16.7 milyon renk alabilir. (İstisna) 

2.2.1.1. Gri Formatlı Görüntü 

Gri görüntü 8 bittir ve 256 farklı renk alabilir. Bu formatta 0 Siyah, 255 beyaz, 127 ise gri anlamına gelir.Bilgisayar düzleminde gri bir görüntü iki boyutlu bir matristen oluşmaktadır. x’in yatay, y’nin dikey olduğu f(x,y) matematiksel fonksiyonu ile tanımlanır. Yatay ve dikey doğruların oluşturduğu düzlemdeki noktalara karşılık gelen her bir nokta görselin piksel değerini temsil etmektedir. 

2.2.1.2. RGB Formatlı Görüntü 

RGB görüntü 24 bittir ve yaklaşık 16.7 milyon renk alabilmektedir. 24 bitlik renk formatı kırmızı, yeşil ve mavi olmak üzere üç ek formata bölünmüştür. 

Şekil 2.4. RGB renk formatı 

Gerçek renk 32 bit ile ifade edilmektedir. Her bir pikselde yaklaşık 4.3 milyar değil; 16.7 milyon farklı renk bulunabilmektedir. 

İlk 8 bit kırmızı, ikinci 8 bit yeşil, üçüncü 8 bit mavi için ayrılmıştır. Son bit ise piksellerin saydamlık bilgisinin tutulduğu alfa kanalı olarak adlandırılır. Bu son bitin renk ile alakası olmadığı için yaklaşık 16.7 milyon renk elde edilir. 

Gerçek renk 32 bit ile ifade edilirken yüksek renk 16 bitlik yer kaplar. Kırmızı için 5 bit, yeşil için 6 bit ve mavi için 5 bit kullanılır. 

AxB ile gösterilen çözünürlük; yatay olarak A tane, düşey olarak B tane piksel anlamına gelmektedir. Örneğin; 720×480 çözünürlük için bir renkli görüntüde 3x720x480=1.036.800 piksel bulunmaktadır. 

2.2.1.3. HSV Formatlı Görüntü 

HSV, RGB ana renklerini insanların anlaması daha kolay boyutlara dönüştüren silindirik bir renk modelidir. Hue (Ton), Saturation (Doygunluk) ve Value (Değer) parametrelerine ayrılır. 

Şekil 2.8. HSV renk formatı 

Hue, RGB renk çemberindeki rengin açısını belirtir. 0⁰ renk tonu kırmızı, 120⁰ renk tonu yeşil, 240⁰ mavi renk değerini alır. 

Saturation, kullanılan renk miktarını kontrol eder. %100 doygunluğa sahip bir renk mümkün olan en saf renk olurken, %0 doygunluğa sahip bir renk gri tonlama verir. 

Value, rengin parlaklığını kontrol eder. %0 parlaklığa sahip bir renk saf siyahtır, %100 parlaklığa sahip bir renk ise siyah içermez. 

Ne düşünüyorsunuz?

Barış ULUSOY, Elektronik Mühendisi tarafından yazıldı.

T3 Otomasyon bilgi ve tecrübelerini endüstri ile paylaşmak ve hizmet vermek maksadıyla Fatih ALTINTAŞ tarafından 2006 yılında Sakarya’da kuruldu, 2011 yılında limited olarak kurumsallaşmanın temellerini atmış oldu. Taahütlerini yerine getiren, sorumlu, güvenilir, insana önem veren, yenilikçi ve müşteri odaklı iş anlayışı ile yüksek standartlarda hizmet veren, mutlu çalışanlara sahip bir şirket olmak. Müşteri odaklı iş anlayışıyla otomasyon çözümleri üreterek, hızlı, kaliteli ve ekonomik çözümler sunmaktır.

Yorumlar

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Yükleniyor...

0

Makine Görüşü Üzerine Bölüm 8 (Son Bölüm)

Kamera İle Nesne Sayma (Bölüm 2)