Raschiare le immagini per il tuo motore di ricerca di immagini

Pubblicato: 2016-09-29
Mostra il sommario
Raschiare le immagini
Prima di firmare

L'altro giorno stavo facendo acquisti online per comprare un nuovo cellulare. Guardando più siti, ho scoperto che l'unica cosa a cui continuavo a fare riferimento era il prezzo (ovviamente!). Ma c'era un altro aspetto che continuavo a cercare, ed era l'immagine del telefono che volevo. In seguito mi sono reso conto che ovunque la descrizione non corrispondesse all'immagine, il fattore di fiducia era molto basso per me per andare avanti con quel venditore. E il sito in cui ho potuto trovare immagini ad alta risoluzione che ho potuto ingrandire e guardare da più angolazioni, è stato il sito su cui sono rimasto più a lungo. Se anche il tuo comportamento di acquisto o di navigazione dà risalto alle immagini, allora benvenuto nel mondo della ricerca di immagini.

Raschiare le immagini per il tuo motore di ricerca di immagini

In effetti, questa tendenza è così dominante nell'ecosistema online che Google, il colosso dei motori di ricerca, ha attivato anche una ricerca di immagini, oltre alla normale ricerca di query di testo. Non ci credi? Quindi prova a trascinare una delle immagini che ottieni attraverso la tua normale query di ricerca nella stringa di ricerca per vedere cosa intendo.

Raschiare le immagini per il tuo motore di ricerca di immagini

Vedi l'immagine a sinistra della casella di ricerca del testo? Questa è l'immagine che ho chiesto a Google di cercare e i risultati sono stati piuttosto accurati (ovvero l'Asus ZenFone 3, uno dei tanti telefoni che stavo cercando di acquistare).

Motori di ricerca per immagini

Questa nuova forma di recupero dei contenuti è resa possibile grazie all'aiuto di un motore di ricerca di immagini. Non è necessario dipendere solo dalla query di testo per trovare informazioni. Puoi anche cercare immagini simili in base all'immagine di origine che fornisci al motore di ricerca. Questo è l'esatto USP di un motore di ricerca di immagini. È definito come un motore di ricerca progettato per trovare informazioni basate sull'input di un'immagine con una visualizzazione visiva delle immagini. La tecnica è utilizzata principalmente da acquirenti e venditori di e-commerce e per cercare maggiori informazioni sull'immagine di un oggetto sconosciuto o per ottenere informazioni cruciali su come i concorrenti stanno posizionando un determinato prodotto.

Potresti chiederti quale algoritmo interessante o apprendimento automatico viene eseguito in background per consentire al motore di ricerca di restituire solo le immagini pertinenti e corrispondenti. Bene, la maggior parte delle volte è semplice; l'immagine cerca il nome ed è questo nome che viene raccolto e visualizzato come risultato della ricerca se corrisponde all'immagine della query per importanza. Questo metodo vecchio stile è il modo base per raschiare le immagini. Quando si esegue il web scraping, lo strumento verificherà se il nome del file contiene tutto o parte del nome del file contenente la query di ricerca e restituirà quell'immagine.

La maggior parte degli sviluppatori, designer e marketer digitali seguono la convenzione di rinominare il nome del file originale (qualcosa come IMG_10092015.jpg) in qualcosa di significativo e di conseguenza (qualcosa come Earl_Grey_Teabag_1332.jpg). Questo per aderire al mandato dell'algoritmo di Google di fornire un nome ragionevole a un file immagine come una delle chiavi per migliorare i segnali di ranking. E questo è ciò che il motore di ricerca di immagini cercherà per fornire risultati di ricerca accurati.

Naturalmente, questo è solo uno dei modi per trovare immagini utilizzando un motore di ricerca di immagini. I due modi principali in cui le informazioni vengono ricercate online sono:

  1. Ricerca dei metadati – Come indicato nella sezione precedente, la ricerca dell'immagine viene eseguita cercando i metadati dell'immagine. Questi metadati possono includere una o più parole chiave, didascalia, alt+testo o nome dell'immagine.
  2. Recupero basato sul contenuto: in questo tipo di ricerca, le varie caratteristiche dell'immagine di origine vengono utilizzate ed eseguite tramite programmi per computer e software specializzati per restituire risultati pertinenti. Invece dei metadati, questo tipo di ricerca utilizza il contenuto dell'immagine per la ricerca. Questo tipo di ricerca di informazioni ha molte tecniche sottostanti come di seguito:
    1. Approccio di query: l'utente fornisce un'immagine di origine, il programma esaminerà caratteristiche come forma, colore e dimensione.
    2. Recupero semantico: l'utente descriverà la query per trovare un'immagine. Questa è un'opzione meno utilizzata a causa delle ovvie difficoltà nell'abbinare l'immagine alla descrizione fornita nella query di ricerca.
    3. Apprendimento automatico: la ricerca di immagini tramite l'apprendimento automatico può essere potenziata con l'aiuto delle reti neurali e del deep learning.
    4. Applicazioni di terze parti: è in corso un lavoro interessante per migliorare la precisione dell'immagine durante la consegna dei risultati di ricerca per una query di immagine. Un esempio calzante è l' acquisizione nel 2006 di Never Vision da parte di Google.

Lo scraping delle immagini aiuta a ottenere dati e immagini da varie fonti e quindi a migrarne i metadati e l'immagine in modo strutturato. Alcuni dei canali di esportazione comuni includono Excel, database back-end, CSV o XML. Raschiare il Web per le immagini aiuta più beneficiari, inclusi sviluppatori Web, designer, gestori di contenuti, giornalisti, dirigenti di marketing o blogger.

Quando si utilizza un ragno per eseguire la scansione delle immagini , il programma cercherà quattro elementi chiave

  1. Titolo della pagina
  2. Data di pubblicazione
  3. L'immagine reale
  4. L'URL del sito

Interessato a sapere cosa succede dopo? Quindi continua a leggere.

Analisi della ricerca di immagini

Una volta che il programma ha raschiato un'immagine e esaminato i metadati e il contenuto associato all'immagine, la maggior parte del lavoro è terminata. Tuttavia, rimane ancora l'importante indicazione di verificare il contenuto del file immagine. Quindi supponiamo che se trovi Superman , otterrai varie combinazioni -

  1. Superman nei fumetti
  2. Superman nei film
  3. Christopher Reeves nel ruolo di Superman
  4. Henry Cavill nel ruolo di Superman
  5. Superman nelle locandine dei film
  6. Superman e fan

…e così via

Questa è la fase di classificazione dell'elaborazione della ricerca di immagini. Il motore lancerà domande di base -

  1. L'immagine ha una faccia?
  2. È il profilo anteriore?
  3. Qual è il colore di sfondo presente?
  4. Qual è il colore di primo piano presente e qual è la sua frequenza/intensità?
  5. È un'immagine gratuita o con licenza?
  6. Qual è la dimensione del file?
  7. Qual è la risoluzione dell'immagine?

Alcuni motori di ricerca di immagini come Google fanno un ulteriore passo avanti e consentono agli utenti di caricare la propria immagine da trovare.

Esistono vari criteri per determinare il grado di successo e l'accuratezza del risultato mostrato dal motore di ricerca di immagini. Se sono presenti uno dei seguenti, le possibilità di ottenere risultati accurati diminuiscono significativamente:

  1. Troppo rumore in sottofondo
  2. Troppi colori in primo piano o sullo sfondo
  3. Troppo pochi dettagli, o
  4. Risoluzione inferiore dell'immagine in ingresso

Ora esaminiamo un altro metodo di classificazione, ad esempio il clustering. Questo prova a mettere insieme tutte le immagini con contenuti simili in un gruppo. Quindi, portando avanti l'esempio sopra, il raggruppamento metterà insieme tutte queste combinazioni di Superman e includerà anche elementi correlati come Superman vs Batman o i cartoni animati di Superman . Anche in questo caso, ciò fornirà risultati accurati solo se il rumore nell'immagine è inferiore e la risoluzione è elevata.

Raschiare le immagini

Ottenere un gran numero di immagini è fondamentale per costruire un motore di ricerca di immagini. L'acquisizione di enormi quantità di dati richiede una soluzione di scraping web scalabile. Il web scraping è il modo più conveniente per acquisire dati dal web, siano essi dati strutturati, URL o immagini. È meglio affidarsi a un fornitore di servizi di scraping web per lo scraping di immagini per il tuo motore di ricerca di immagini.

Prima di firmare

Come è evidente, il valore fornito da un motore di ricerca di immagini va ben oltre l'accuratezza. Aiuta gli acquirenti a prendere una decisione di acquisto informata e a ottenere il massimo dalla loro esperienza utente web. Per i proprietari di e-commerce, li aiuta a raccogliere informazioni cruciali sull'assortimento di prodotti nei negozi dei rivali e li tiene aggiornati sui vari dati relativi a un prodotto specifico. Quindi, se la maggior parte dei proprietari di negozi ha l'iPhone 6s al dettaglio di circa $ 825, sapresti che anche il tuo negozio dovrebbe corrispondere a questo prezzo per aiutare nella conversione del traffico web sul tuo portale di e-commerce. In questo modo la ricerca di immagini aiuta anche nell'intelligence sui prezzi.

Stai pianificando di acquisire dati dal web? Siamo qui per aiutare. Facci sapere le tue esigenze.