ekşi duyuru

Machine learning - model için ne kadar veriye ihtiyacım var?

Image recognition yapıcam. Bana gereken verilen fotoğrafta verilen X objesinin olup olmadığının söylenmesi, başka bir şeye ihtiyacım yok.

Bunu eğitmek için nasıl bir dataset hazırlamam gerekiyor?

Mesela tespit etmem gereken objelerden bir tanesi laptop. 1000 tane laptop fotoğrafı verip geçsem yeter mi? Yoksa mesela 1000 tane çalışma masası üstünde duran laptop, 1000 tane üzerinde laptop olmayan çalışma masası, 1000 tane de dağda bayırda duran laptop fotoğrafı mı vermeliyim daha iyi bir sonuç elde etmek için? Çünkü düşünüyorum, mesela hep masanın üstünde duran laptop fotoğrafı versem, masa ile laptop'ı nasıl ayırt edecek alet, değil mi?

Kafamda CNN yapmak var, ama daha iyi bir yöntem öneriyorsanız ona da açığım.

plutongezegendegilmi #1464058

Eğer laptop ise COCO, ImageNet gibi datasetlerden yararlanabilirsin. Ben daha geçen gün bir sunum için YOLO'yu eğitip kullandım. Mesela datasetim 1500 fotoğraftı. 6000 batch her biri 64 fotoğraftan 5-6 saat sürdü eğitmesi Colab'ta. Validation dataseti ile test edemedim ama zor fotoğraflarda sıkıntı yaşasa da genel olarak yeterli performansı gösterdi benim için.

reactionic (24.01.21 22:06:05)

@reactionic, teşekkür ederim hocam. Performanstan kastım süreden ziyade accuracy aslında. Training için cloud kullanacağım her türlü çünkü macbook kullanıyorum :D

plutongezegendegilmi (24.01.21 22:10:30)

Burdan güncel benchmark sonuçlarına bakabilirsin. paperswithcode.com
Bir de mesela (en azından YOLO için konuşabilirim ama hepsi yapıyordur muhtemelen) verilen dataseti data augmentation teknikleriyle çoğaltılıyor diyebiliriz. Yani fotoğrafı kesiyor, döndürüyor, renk değerlerini kaydırıyor training sırasında.

reactionic (24.01.21 22:48:00)

buraya yazılanların hakları Sir Anthony Hopkins'e aittir.
yazan eden compumaster, ilgilenen eden fader
modere edenler angelus, Artibir, aychovsky, baba jo, basond, compumaster, deckard, duyulmasi gerektigi kadar, fader, fraise, groove salad, kahvegibi, kaymaktutmayansicaksut, kibritsuyu, monstro, pandispanya, robin, ron dennis
bu sitede yazılanların hiçbiri doğru değildir. site içeriği küçükler için sakıncalı olabilir. yazılardan yazarları sorumludur. kaynak göstermeden alıntılanamaz. devlet tarafından atanmış bir kurumun internet üzerinde kimin hangi bilgiye ulaşıp ulaşamayacağına karar vermesi insan haklarına aykırıdır. web siteleri kullanıcıların istekleri doğrultusunda bağlandıkları yerlerdir. kullanıcılar isterlerse bir web sitesine bağlanmayabilirler. bu güçleri ve imkanları mevcuttur. bir kullanıcı bir siteye bağlanmak istiyorsa bu onun tercihi ve hakkıdır. bağlanmak istemiyorsa bu yine onun tercihi ve hakkıdır. halkın kendisine hizmet etmesi için görevlendirdiği kurumlar hadlerini aşıp halka neye ulaşıp ulaşmayacağını bilmeyen cahil cühela muamelesi edemezler. ebeveynlerin çocuklarını sakıncalı içeriklerden koruması için çok sayıda bedava ve ücretli yazılım mevcuttur. bu yazılımlar bir web tarayıcısını kullanmaktan daha karmaşık teknik bilgi gerektirmemektedir. devletin milletini küçük düşürmesi ve ebleh yerine koyması yasaktır. Skimlinks ile linkler üzerinden yönlendirme payı alınmaktadır.

Lütfen Javascript desteği bulunan bir tarayıcı kullanın. Bir hata olduğunu düşünüyorsanız tarayıcınızın veya (varsa) antivirüs yazılımınızın ayarlarını kontrol edin.

Machine learning - model için ne kadar veriye ihtiyacım var?