Skrobanie obrazów w wyszukiwarce obrazów

Opublikowany: 2016-09-29
Spis treści pokaż
Skrobanie obrazów
Przed wylogowaniem

Pewnego dnia robiłem zakupy online, aby kupić nowy telefon komórkowy. Przeglądając wiele witryn, zauważyłem, że jedyną rzeczą, o której wspominałem, była cena (oczywiście!). Ale był jeszcze jeden aspekt, którego szukałem, a był to obraz telefonu, którego szukałem. Później zdałem sobie sprawę, że wszędzie tam, gdzie opis nie pasuje do obrazu, współczynnik zaufania był bardzo niski, abym mógł kontynuować współpracę z tym sprzedawcą. A strona, na której mogłem znaleźć obrazy w wysokiej rozdzielczości, które mogłem powiększać i patrzeć pod różnymi kątami, była stroną, na której przebywałem najdłużej. Jeśli Twoje zakupy lub zachowanie podczas przeglądania również kładzie nacisk na obrazy, witaj w świecie wyszukiwania obrazów.

Skrobanie obrazów w wyszukiwarce obrazów

W rzeczywistości ten trend jest tak dominujący w ekosystemie online, że Google, gigant wyszukiwarek, ma również wyszukiwanie grafiki, oprócz zwykłego wyszukiwania tekstowego. Nie wierzysz nam? Następnie spróbuj przeciągnąć jeden z obrazów, które otrzymujesz za pomocą zwykłego zapytania wyszukiwania, do ciągu wyszukiwania, aby zobaczyć, co mam na myśli.

Skrobanie obrazów w wyszukiwarce obrazów

Widzisz obraz po lewej stronie pola wyszukiwania tekstowego? To jest obraz, który poprosiłem Google o przeszukanie, a wyniki były dość dokładne (to Asus ZenFone 3 – jeden z wielu telefonów, które szukałem, aby kupić).

Wyszukiwarki obrazów

Ta nowa forma wyszukiwania treści jest możliwa dzięki wyszukiwarce obrazów. Nie musisz polegać tylko na zapytaniu tekstowym, aby znaleźć informacje. Możesz także wyszukać podobne obrazy na podstawie obrazu źródłowego, który dostarczysz wyszukiwarce. To jest dokładna USP wyszukiwarki grafiki. Jest zdefiniowany jako wyszukiwarka zaprojektowana do wyszukiwania informacji na podstawie wprowadzonego obrazu z wizualnym wyświetlaniem obrazów. Technika ta jest najczęściej wykorzystywana przez kupujących i sprzedających w e-commerce, aby wyszukać więcej informacji na temat wizerunku nieznanego obiektu lub uzyskać kluczowe informacje o tym, jak konkurencja pozycjonuje dany produkt.

Być może zastanawiasz się, jaki fajny algorytm lub uczenie maszynowe działa w tle, aby umożliwić wyszukiwarce zwracanie tylko odpowiednich i pasujących obrazów. Cóż, w większości przypadków jest to proste; obraz wyszukuje nazwę i to właśnie ta nazwa jest zbierana i wyświetlana jako wynik wyszukiwania, jeśli pasuje do obrazu zapytania pod względem ważności. Ta staromodna metoda jest podstawowym sposobem na zdrapywanie obrazów. Podczas skrobania sieci narzędzie sprawdzi, czy nazwa pliku zawiera pełną lub część nazwy pliku zawierającą zapytanie wyszukiwania i zwróci ten obraz.

Większość programistów, projektantów i sprzedawców cyfrowych stosuje konwencję zmiany nazwy oryginalnej nazwy pliku (coś jak IMG_10092015.jpg) na coś znaczącego i istotnego (coś jak Earl_Grey_Teabag_1332.jpg). Ma to na celu przestrzeganie nakazu algorytmu Google polegającego na nadaniu rozsądnej nazwy plikowi graficznemu jako jednego z kluczy do poprawy sygnałów rankingowych. I właśnie tego będzie szukała wyszukiwarka obrazów, aby zapewnić dokładne wyniki wyszukiwania.

Oczywiście jest to tylko jeden ze sposobów znajdowania obrazów za pomocą wyszukiwarki obrazów. Dwa kluczowe sposoby wyszukiwania informacji w Internecie to:

  1. Wyszukiwanie metadanych - Jak opisano w powyższej sekcji, wyszukiwanie obrazu jest wykonywane przez wyszukiwanie metadanych obrazu. Te metadane mogą zawierać jedno lub więcej słów kluczowych, podpis, alt+tekst lub nazwę obrazu.
  2. Pobieranie na podstawie treści — w ramach tego typu wyszukiwania różne cechy obrazu źródłowego są wykorzystywane i uruchamiane przez programy komputerowe i specjalistyczne oprogramowanie w celu zwrócenia odpowiednich wyników. Zamiast metadanych ten typ wyszukiwania wykorzystuje do wyszukiwania zawartość obrazu. Ten rodzaj wyszukiwania informacji ma wiele podstawowych technik, jak poniżej –
    1. Podejście do zapytania – użytkownik dostarcza obraz źródłowy, program przyjrzy się cechom takim jak kształt, kolor i rozmiar.
    2. Wyszukiwanie semantyczne — użytkownik opisze zapytanie, aby znaleźć obraz. Jest to rzadziej używana opcja ze względu na oczywiste trudności w dopasowaniu obrazu do opisu podanego w zapytaniu.
    3. Uczenie maszynowe — wyszukiwanie obrazów z wykorzystaniem uczenia maszynowego można usprawnić za pomocą sieci neuronowych i głębokiego uczenia.
    4. Aplikacje innych firm — prowadzone są interesujące prace związane ze zwiększaniem dokładności obrazu podczas dostarczania wyników wyszukiwania zapytania dotyczącego obrazu. Przykładem jest przejęcie w 2006 roku Neven Vision przez Google.

Image scraping pomaga w pozyskiwaniu danych i obrazu z różnych źródeł, a następnie migrowaniu jego metadanych i obrazu w ustrukturyzowany sposób. Niektóre z popularnych kanałów eksportu to Excel, wewnętrzne bazy danych, CSV lub XML. Przeszukiwanie sieci w poszukiwaniu obrazów pomaga wielu beneficjentom, w tym twórcom stron internetowych, projektantom, menedżerom treści, dziennikarzom, dyrektorom ds. marketingu lub blogerom.

Używając pająka do indeksowania obrazów , program będzie szukał czterech kluczowych rzeczy

  1. Tytuł strony
  2. Data publikacji
  3. Rzeczywisty obraz
  4. Adres URL witryny

Chcesz wiedzieć, co będzie dalej? Następnie czytaj dalej.

Analiza wyszukiwania obrazu

Po zeskrobaniu obrazu przez program i spojrzeniu na metadane i powiązaną z nim zawartość, większość pracy jest wykonywana. Jednak nadal pozostaje ważny wskaźnik weryfikacji zawartości pliku obrazu. Załóżmy więc, że jeśli znajdziesz dla Supermana , otrzymasz różne kombinacje –

  1. Superman w komiksie
  2. Superman w filmach
  3. Christopher Reeves jako Superman
  4. Henry Cavill jako Superman
  5. Superman w plakatach filmowych
  6. Superman i fani

…i tak dalej

Jest to etap klasyfikacji przetwarzania wyszukiwania obrazów. Silnik wyrzuci podstawowe pytania –

  1. Czy obraz ma twarz?
  2. Czy to przedni profil?
  3. Jaki jest obecny kolor tła?
  4. Jaki jest kolor pierwszego planu i jaka jest jego częstotliwość/intensywność?
  5. Czy jest to obraz darmowy czy licencjonowany?
  6. Jaki jest rozmiar pliku?
  7. Jaka jest rozdzielczość obrazu?

Niektóre wyszukiwarki obrazów, takie jak Google, idą o krok dalej i umożliwiają użytkownikom przesłanie własnego obrazu w celu znalezienia.

Istnieją różne kryteria określania stopnia sukcesu i dokładności wyniku wyświetlanego przez wyszukiwarkę grafiki. Jeśli jest którekolwiek z poniższych, szanse na zwrócenie dokładnych wyników znacznie spadają:

  1. Za dużo hałasu w tle
  2. Za dużo kolorów na pierwszym planie lub w tle
  3. Za mało szczegółów lub
  4. Niższa rozdzielczość obrazu wejściowego

Teraz przyjrzymy się innej metodzie klasyfikacji, czyli grupowaniu. To próbuje zebrać wszystkie obrazy o podobnej treści w jednej grupie. Zatem kontynuując powyższy przykład, grupowanie połączy wszystkie te kombinacje Supermana, a nawet uwzględni powiązane elementy, takie jak Superman vs. Batman lub kreskówki Supermana . Ponownie, zapewni to dokładne wyniki tylko wtedy, gdy szum na obrazie jest mniejszy, a rozdzielczość wysoka.

Skrobanie obrazów

Zdobycie dużej liczby obrazów ma kluczowe znaczenie dla zbudowania wyszukiwarki obrazów. Pozyskiwanie ogromnych ilości danych wymaga skalowalnego rozwiązania web scrapingu. Web scraping to najwygodniejszy sposób pozyskiwania danych z sieci, niezależnie od tego, czy są to dane strukturalne, adresy URL czy obrazy. Lepiej jest polegać na dostawcy usług internetowych, jeśli chodzi o zbieranie obrazów w wyszukiwarce obrazów.

Przed wylogowaniem

Jak widać, wartość dostarczana przez wyszukiwarkę obrazów wykracza daleko poza dokładność. Pomaga kupującym w podjęciu świadomej decyzji o zakupie i jak najlepszym korzystaniu z jej doświadczenia w sieci. Właścicielom e-commerce pomaga im gromadzić kluczowe informacje na temat asortymentu produktów w sklepach konkurencji i na bieżąco informować o różnych danych dotyczących konkretnego produktu. Więc jeśli większość właścicieli sklepów ma iPhone'a 6s w cenie około 825 USD, wiedziałbyś, że Twój sklep również musiałby odpowiadać tej cenie, aby pomóc w konwersji ruchu internetowego na Twoim portalu e-commerce. W ten sposób wyszukiwanie obrazów pomaga również w analizie cen.

Planujesz pozyskiwać dane z sieci? Jesteśmy tutaj, aby pomóc. Daj nam znać o swoich wymaganiach.