Image recognition yapıcam. Bana gereken verilen fotoğrafta verilen X objesinin olup olmadığının söylenmesi, başka bir şeye ihtiyacım yok.

Bunu eğitmek için nasıl bir dataset hazırlamam gerekiyor?

Mesela tespit etmem gereken objelerden bir tanesi laptop. 1000 tane laptop fotoğrafı verip geçsem yeter mi? Yoksa mesela 1000 tane çalışma masası üstünde duran laptop, 1000 tane üzerinde laptop olmayan çalışma masası, 1000 tane de dağda bayırda duran laptop fotoğrafı mı vermeliyim daha iyi bir sonuç elde etmek için? Çünkü düşünüyorum, mesela hep masanın üstünde duran laptop fotoğrafı versem, masa ile laptop'ı nasıl ayırt edecek alet, değil mi?

Kafamda CNN yapmak var, ama daha iyi bir yöntem öneriyorsanız ona da açığım.

 

Eğer laptop ise COCO, ImageNet gibi datasetlerden yararlanabilirsin. Ben daha geçen gün bir sunum için YOLO'yu eğitip kullandım. Mesela datasetim 1500 fotoğraftı. 6000 batch her biri 64 fotoğraftan 5-6 saat sürdü eğitmesi Colab'ta. Validation dataseti ile test edemedim ama zor fotoğraflarda sıkıntı yaşasa da genel olarak yeterli performansı gösterdi benim için.

reactionic

@reactionic, teşekkür ederim hocam. Performanstan kastım süreden ziyade accuracy aslında. Training için cloud kullanacağım her türlü çünkü macbook kullanıyorum :D

plutongezegendegilmi

Burdan güncel benchmark sonuçlarına bakabilirsin. paperswithcode.com
Bir de mesela (en azından YOLO için konuşabilirim ama hepsi yapıyordur muhtemelen) verilen dataseti data augmentation teknikleriyle çoğaltılıyor diyebiliriz. Yani fotoğrafı kesiyor, döndürüyor, renk değerlerini kaydırıyor training sırasında.

reactionic
1

mobil görünümden çık