Gratter des images pour votre moteur de recherche d'images
Publié: 2016-09-29L'autre jour, je faisais des achats en ligne pour acheter un nouveau téléphone portable. En regardant plusieurs sites, j'ai trouvé que la seule chose à laquelle je me référais sans cesse était le prix (bien sûr !). Mais il y avait un autre aspect que je cherchais sans cesse, et c'était une image du téléphone que je voulais. J'ai réalisé plus tard que partout où la description ne correspondait pas à l'image, le facteur de confiance était très faible pour moi d'aller de l'avant avec ce vendeur. Et le site où je pouvais trouver des images haute résolution que je pouvais zoomer et regarder sous plusieurs angles, c'est le site sur lequel je suis resté le plus longtemps. Si votre comportement d'achat ou de navigation met également en avant les images, alors bienvenue dans le monde de la recherche d'images.

En fait, cette tendance domine tellement l'écosystème en ligne que Google, le géant des moteurs de recherche, a également mis en place une recherche d'images, en plus de la recherche de requête textuelle habituelle. Vous ne nous croyez pas ? Ensuite, essayez de faire glisser l'une des images que vous obtenez via votre requête de recherche habituelle dans la chaîne de recherche pour voir ce que je veux dire.

Vous voyez l'image à gauche du champ de recherche de texte ? C'est l'image que j'ai demandé à Google de rechercher, et les résultats étaient assez précis (c'est-à-dire l'Asus ZenFone 3 - l'un des nombreux téléphones que je cherchais à acheter).
Moteurs de recherche d'images
Cette nouvelle forme de récupération de contenu est rendue possible grâce à un moteur de recherche d'images. Vous n'avez pas besoin de dépendre uniquement de la requête textuelle pour trouver des informations. Vous pouvez également rechercher des images similaires en fonction de l'image source que vous fournissez au moteur de recherche. C'est l'USP exacte d'un moteur de recherche d'images. Il est défini comme un moteur de recherche conçu pour trouver des informations basées sur la saisie d'une image avec un affichage visuel des images. La technique est principalement utilisée par les acheteurs et les vendeurs de commerce électronique et pour rechercher plus d'informations sur l'image d'un objet inconnu ou pour obtenir des informations cruciales sur la façon dont les concurrents positionnent un produit donné.
Vous vous demandez peut-être quel algorithme sympa ou apprentissage automatique s'exécute en arrière-plan pour permettre au moteur de recherche de ne renvoyer que les images pertinentes et correspondantes. Eh bien, la plupart du temps, c'est simple; l'image recherche le nom et c'est ce nom qui est collecté et affiché en tant que résultat de la recherche s'il correspond à l'image de requête pour l'importance. Cette méthode à l'ancienne est la méthode de base pour gratter des images. Lors du grattage Web, l'outil vérifiera si le nom de fichier contient tout ou partie de son nom de fichier contenant la requête de recherche et renverra cette image.
La plupart des développeurs, concepteurs et spécialistes du marketing numérique suivent la convention consistant à renommer le nom de fichier d'origine (quelque chose comme IMG_10092015.jpg) en quelque chose de significatif et de conséquence (quelque chose comme Earl_Grey_Teabag_1332.jpg). Il s'agit de respecter le mandat de l'algorithme de Google consistant à fournir un nom sensé à un fichier image comme l'une des clés de l'amélioration des signaux de classement. Et c'est ce que le moteur de recherche d'images recherchera pour fournir des résultats de recherche précis.
Bien sûr, ce n'est qu'un des moyens de trouver des images à l'aide d'un moteur de recherche d'images. Les deux principaux moyens par lesquels les informations sont recherchées en ligne sont -
- Recherche de métadonnées - Comme indiqué dans la section ci-dessus, la recherche d'images est exécutée en recherchant les métadonnées de l'image. Ces métadonnées peuvent inclure un ou plusieurs mots-clés, légende, alt+texte ou nom d'image.
- Récupération basée sur le contenu - Dans ce type de recherche, les différentes caractéristiques de l'image source sont utilisées et exécutées via des programmes informatiques et des logiciels spécialisés pour renvoyer des résultats pertinents. Au lieu des métadonnées, ce type de recherche utilise le contenu de l'image pour la recherche. Ce type de recherche d'informations a de nombreuses techniques sous-jacentes comme ci-dessous -
- Approche de requête - L'utilisateur fournit une image source, le programme examinera des caractéristiques telles que la forme, la couleur et la taille.
- Récupération sémantique - L'utilisateur décrira la requête pour trouver une image. Il s'agit d'une option moins utilisée en raison de difficultés évidentes à faire correspondre l'image avec la description donnée dans la requête de recherche.
- Apprentissage automatique - La recherche d'images à l'aide de l'apprentissage automatique peut être stimulée à l'aide de réseaux de neurones et d'apprentissage en profondeur.
- Applications tierces - Des travaux intéressants sont en cours pour améliorer la précision de l'image lors de la fourniture de résultats de recherche pour une requête d'image. Un bon exemple est l' acquisition en 2006 de Neven Vision par Google.
Le grattage d'images aide à obtenir des données et des images à partir de sources variées, puis à migrer ses métadonnées et son image de manière structurée. Certains des canaux d'exportation courants incluent Excel, les bases de données principales, CSV ou XML. Gratter le Web pour les images aide de nombreux bénéficiaires, y compris les développeurs Web, les concepteurs, les gestionnaires de contenu, les journalistes, les responsables marketing ou les blogueurs.

Lors de l'utilisation d'une araignée pour explorer des images , le programme recherchera quatre éléments clés
- Titre de la page
- Date de publication
- L'image réelle
- L'url du site
Intéressé de savoir ce qui se passera ensuite ? Alors lisez la suite.
Analyse de la recherche d'images
Une fois que le programme a récupéré une image et examiné les métadonnées et le contenu associé à l'image, la majeure partie du travail est terminée. Cependant, il reste toujours le pointeur important de la vérification du contenu du fichier image. Supposons donc que si vous trouvez pour Superman , vous obtiendrez diverses combinaisons -
- Superman dans les bandes dessinées
- Superman au cinéma
- Christopher Reeves comme Superman
- Henry Cavill comme Superman
- Superman dans les affiches de films
- Superman et ses fans
…etc
C'est l'étape de classification du traitement de recherche d'images. Le moteur lancera des questions de base -
- L'image a-t-elle un visage ?
- Est-ce le profil avant ?
- Quelle est la couleur de fond présente ?
- Quelle est la couleur de premier plan présente et quelle est sa fréquence/intensité ?
- Est-ce une image gratuite ou sous licence ?
- Quelle est la taille du fichier ?
- Quelle est la résolution de l'image ?
Certains moteurs de recherche d'images comme Google vont encore plus loin et permettent aux utilisateurs de télécharger leur propre image pour la trouver.
Il existe différents critères pour déterminer le degré de réussite et la précision du résultat affiché par le moteur de recherche d'images. S'il existe l'un des éléments ci-dessous, les chances de renvoyer des résultats précis diminuent considérablement :
- Trop de bruit en arrière-plan
- Trop de couleurs au premier plan ou à l'arrière-plan
- Trop peu de détails ou
- Résolution inférieure de l'image d'entrée
Examinons maintenant une autre méthode de classification, à savoir le regroupement. Cela essaie de rassembler toutes les images avec un contenu similaire dans un groupe. Donc, poursuivant l'exemple ci-dessus, le regroupement rassemblera toutes ces combinaisons de Superman et inclura même des éléments connexes comme Superman contre Batman ou les dessins animés de Superman . Encore une fois, cela ne fournira des résultats précis que si le bruit dans l'image est moindre et que la résolution est élevée.
Gratter les images
Obtenir un grand nombre d'images est crucial pour construire un moteur de recherche d'images. L'acquisition d'énormes quantités de données nécessite une solution de grattage Web évolutive. Le scraping Web est le moyen le plus pratique d'acquérir des données sur le Web, qu'il s'agisse de données structurées, d'URL ou d'images. Il est préférable de s'appuyer sur un fournisseur de services de grattage Web pour gratter des images pour votre moteur de recherche d'images.
Avant de signer
Comme on le voit, la valeur fournie par un moteur de recherche d'images va bien au-delà de la précision. Il aide les acheteurs à prendre une décision d'achat éclairée et à tirer le meilleur parti de leur expérience d'utilisateur Web. Pour les propriétaires de commerce électronique, cela les aide à recueillir des informations cruciales sur l'assortiment de produits dans les magasins des rivaux et les tient au courant des différentes données concernant un produit spécifique. Donc, si la plupart des propriétaires de magasins vendent l'iPhone 6s aux alentours de 825 $, vous saurez que votre magasin devra également correspondre à ce prix afin de faciliter la conversion du trafic Web sur votre portail de commerce électronique. De cette façon, la recherche d'images contribue également à l'intelligence des prix.
Vous envisagez d'acquérir des données sur le Web ? Nous sommes là pour vous aider. Faites-nous part de vos besoins.
