Görsel Arama Motorunuz için Görselleri Kazıma

Yayınlanan: 2016-09-29
İçindekiler gösterisi
Görüntüleri kazıma
Oturumu kapatmadan önce

Geçen gün yeni bir cep telefonu almak için internetten alışveriş yapıyordum. Birden fazla siteye baktığımda, atıfta bulunduğum tek şeyin fiyat olduğunu gördüm (elbette!). Ama sürekli aradığım başka bir yön daha vardı ve bu da istediğim telefonun görüntüsüydü. Daha sonra, açıklamanın görselle uyuşmadığı her yerde, o satıcıyla devam etmem için güven faktörünün çok düşük olduğunu fark ettim. Ve yakınlaştırıp birden çok açıdan bakabileceğim yüksek çözünürlüklü görüntüler bulabildiğim site, en uzun süre kaldığım siteydi. Alışveriş veya göz atma davranışınız da görsellere önem veriyorsa, görsel arama dünyasına hoş geldiniz.

Görsel Arama Motorunuz için Görselleri Kazıma

Aslında, bu eğilim çevrimiçi ekosistemde o kadar baskın ki, arama motoru devi Google, normal metin sorgusu aramasına ek olarak bir resim araması da yapıyor. Bize inanmıyor musun? Ardından, ne demek istediğimi anlamak için normal arama sorgunuzdan aldığınız resimlerden birini arama dizesine sürüklemeyi deneyin.

Görsel Arama Motorunuz için Görselleri Kazıma

Metin arama kutusunun solundaki resmi görüyor musunuz? Bu, Google'dan aramasını istediğim görüntüydü ve sonuçlar oldukça doğruydu (bu Asus ZenFone 3 – satın almayı araştırdığım birçok telefondan biri).

Görsel Arama Motorları

Bu yeni içerik alma biçimi, bir görsel arama motorunun yardımıyla mümkün hale geldi. Bilgi bulmak için yalnızca metin sorgusuna bağlı olmanız gerekmez. Arama motoruna sağladığınız kaynak görsele göre benzer görselleri de arayabilirsiniz. Bu, bir görsel arama motorunun tam USP'sidir. Görüntülerin görsel gösterimi ile bir görüntünün girişine dayalı bilgi bulmak için tasarlanmış bir arama motoru olarak tanımlanır. Teknik, çoğunlukla e-ticaret alıcıları ve satıcıları tarafından ve bilinmeyen bir nesnenin görüntüsü hakkında daha fazla bilgi aramak veya rakiplerin belirli bir ürünü nasıl konumlandırdıkları hakkında önemli bilgiler elde etmek için kullanılır.

Arama motorunun yalnızca ilgili ve eşleşen görüntüleri döndürmesini sağlamak için arka planda hangi harika algoritmanın veya makine öğreniminin çalıştığını merak ediyor olabilirsiniz. Eh, çoğu zaman basittir; resim adı arar ve bu ad toplanır ve önem açısından sorgu resmiyle eşleşirse arama sonucu olarak görüntülenir. Bu eski moda yöntem, görüntüleri kazımanın temel yoludur. Web kazıma yaparken , araç dosya adının arama sorgusunu içeren dosya adının tamamının mı yoksa bir kısmının mı olduğunu kontrol edecek ve bu görüntüyü döndürecektir.

Çoğu geliştirici, tasarımcı ve dijital pazarlamacı, orijinal dosya adını (IMG_10092015.jpg gibi) anlamlı ve sonuç veren bir şeyle (Earl_Grey_Teabag_1332.jpg gibi) yeniden adlandırma kuralına uyar. Bu, sıralama sinyallerini iyileştirmenin anahtarlarından biri olarak bir görüntü dosyasına mantıklı bir ad sağlama Google algoritmasına bağlı kalmak içindir. Ve görsel arama motorunun doğru arama sonuçları sağlamak için arayacağı şey budur.

Elbette bu, bir görsel arama motorunu kullanarak görsel bulmanın yollarından sadece bir tanesidir. Bilginin çevrimiçi olarak aranmasının iki temel yolu:

  1. Meta Veri Arama – Yukarıdaki bölümde özetlendiği gibi, görsel arama, görselin meta verilerine bakılarak yürütülür. Bu meta veriler, bir veya daha fazla anahtar kelime, resim yazısı, alt+metin veya resim adını içerebilir.
  2. İçerik tabanlı erişim – Bu tür aramada, kaynak görüntünün çeşitli özellikleri kullanılır ve ilgili sonuçları döndürmek için bilgisayar programları ve özel yazılımlar aracılığıyla çalıştırılır. Bu tür arama, meta veriler yerine, arama için görüntünün içeriğini kullanır. Bu tür bilgi aramanın aşağıdaki gibi birçok temel tekniği vardır:
    1. Sorgu yaklaşımı – Kullanıcı bir kaynak görüntü sağlar, program şekil, renk ve boyut gibi özelliklere bakacaktır.
    2. Anlamsal erişim – Kullanıcı, bir görüntü bulmak için sorguyu tanımlayacaktır. Bu, arama sorgusunda verilen açıklama ile resmi eşleştirmede bariz zorluklar nedeniyle daha az kullanılan bir seçenektir.
    3. Makine öğrenimi – Makine öğrenimini kullanan görsel arama, sinir ağları ve derin öğrenme yardımıyla artırılabilir.
    4. Üçüncü taraf uygulamaları – Bir görüntü sorgusu için arama sonuçları sunarken görüntü doğruluğunu artırma konusunda bazı ilginç çalışmalar yapılıyor. Buna bir örnek, 2006 yılında Neven Vision'ın Google tarafından satın alınmasıdır.

Görüntü kazıma, çeşitli kaynaklardan veri ve görüntü elde etmeye ve ardından meta verilerini ve görüntüsünü yapılandırılmış bir şekilde geçirmeye yardımcı olur. Yaygın dışa aktarma kanallarından bazıları Excel, arka uç veritabanları, CSV veya XML'dir. Web'i görüntüler için kazımak, web geliştiricileri, tasarımcılar, içerik yöneticileri, gazeteciler, pazarlama yöneticileri veya blog yazarları dahil olmak üzere birden fazla yararlanıcıya yardımcı olur.

Görüntüleri taramak için bir örümcek kullanırken , program dört temel şey arayacaktır.

  1. Sayfanın başlığı
  2. yayın tarihi
  3. gerçek görüntü
  4. sitenin URL'si

Daha sonra ne olacağını bilmek ister misiniz? Sonra okumaya devam edin.

Görsel aramanın analizi

Program bir görüntüyü kazıdıktan ve meta verilere ve görüntüyle ilişkili içeriğe baktıktan sonra, işin çoğu yapılır. Ancak, hala görüntü dosyasının içeriğini doğrulamanın önemli bir göstergesi var. Diyelim ki Superman'i bulursanız , çeşitli kombinasyonlar elde edeceksiniz –

  1. çizgi romanlarda süpermen
  2. filmlerde süpermen
  3. Christopher Reeves Süpermen olarak
  4. Henry Cavill Süpermen olarak
  5. film afişlerinde süpermen
  6. Süpermen ve hayranları

…ve benzeri

Bu, görüntü arama işleminin sınıflandırma aşamasıdır. Motor temel soruları atacak -

  1. Resmin yüzü var mı?
  2. Ön profil mi?
  3. Mevcut arka plan rengi nedir?
  4. Mevcut ön plan rengi nedir ve sıklığı/yoğunluğu nedir?
  5. Ücretsiz mi yoksa lisanslı bir resim mi?
  6. Dosya boyutu nedir?
  7. Görüntü çözünürlüğü nedir?

Google gibi bazı görsel arama motorları bir adım daha ileri giderek kullanıcıların bulmak için kendi görsellerini yüklemelerine izin verir.

Görsel arama motorunun gösterdiği sonucun başarı derecesini ve doğruluğunu belirlemek için çeşitli kriterler vardır. Aşağıdakilerden herhangi biri varsa, doğru sonuçları döndürme şansı önemli ölçüde azalır:

  1. Arka planda çok fazla gürültü
  2. Ön planda veya arka planda çok fazla renk
  3. Çok az detaylandırma veya
  4. Giriş görüntüsünün daha düşük çözünürlüğü

Şimdi başka bir sınıflandırma yöntemine bakıyoruz, yani kümeleme. Bu, benzer içeriğe sahip tüm resimleri tek bir grupta bir araya getirmeye çalışır. Yukarıdaki örneği ileriye taşıyacak olursak, kümeleme tüm bu Süpermen kombinasyonlarını bir araya getirecek ve hatta Superman vs. Batman veya Superman çizgi filmleri gibi ilgili öğeleri içerecektir . Yine bu, yalnızca görüntüdeki parazit daha az ve çözünürlüğün yüksek olması durumunda doğru sonuçlar verecektir.

Görüntüleri kazıma

Bir görsel arama motoru oluşturmak için çok sayıda görsele sahip olmak çok önemlidir. Büyük miktarda veri elde etmek, ölçeklenebilir bir web kazıma çözümü gerektirir. Web kazıma, yapılandırılmış veriler, URL'ler veya resimler olsun, web'den veri almanın en uygun yoludur. Görsel arama motorunuz için görüntüleri kazımak için bir web kazıma servis sağlayıcısına güvenmek daha iyidir.

Oturumu kapatmadan önce

Görüldüğü gibi, bir görsel arama motorunun sağladığı değer, doğruluğun çok ötesine geçer. Alışveriş yapanların bilinçli bir satın alma kararı vermelerine ve web kullanıcı deneyimlerinden en iyi şekilde yararlanmalarına yardımcı olur. E-ticaret sahipleri için, rakiplerin mağazalarındaki ürün çeşitleri hakkında önemli bilgiler toplamalarına yardımcı olur ve belirli bir ürünle ilgili çeşitli veriler hakkında onları güncel tutar. Bu nedenle, mağaza sahiplerinin çoğu iPhone 6'ları yaklaşık 825 $ aralığında perakende satıyorsa, e-ticaret portalınızdaki web trafiği dönüşümüne yardımcı olmak için mağazanızın da bu fiyata uyması gerektiğini bilirsiniz. Bu şekilde görsel arama, fiyatlandırma istihbaratına da yardımcı olur.

Web'den veri almayı mı planlıyorsunuz? Yardım etmek için buradayız. Gereksinimleriniz hakkında bize bilgi verin.