Singurul ghid de care aveți nevoie pentru a înțelege Screen Scraping

Publicat: 2021-05-18
Cuprins arată
Care este diferența dintre Screen Scraping și Data Scraping?
Marea întrebare: Screen Scraping este legal?
Cum se efectuează în esență Screen Scraping?
Dar riscurile?
Cum combatem aceste probleme?

Screen scraping este cel mai nou cuvânt la modă din lumea super dinamică a tehnologiei. Din păcate, este aproape adesea interpretat greșit ca scraping de date. Dar este unul dintre acele cazuri clasice de „toate degetele mari sunt degete, dar nu toate degetele sunt degete mari”. Screen scraping este o modalitate de a extrage toate datele de pe un afișaj digital utilizat în diferite scopuri. Cu alți termeni, screen scraping ajută la accesarea cu crawlere a datelor reale de afișare dintr-o anumită interfață de utilizator sau fișier.

Care este diferența dintre Screen Scraping și Data Scraping?

Scopul este același: să accesați cu crawlere și să extrageți date. Sursa datelor este ușor diferită. Acesta este schimbarea jocului. Data scraping folosește un spectru mai larg. Extrage și extrage date de oriunde de pe World Wide Web. Pe de altă parte, screen scraping este utilizat în mod special pentru extragerea de informații de pe un anumit afișaj digital . Bine, pentru ce avem nevoie de screen scraping?

Aplicațiile screen scraping sunt extrem de largi și versatile. Poate fi aplicat la o întreagă varietate de aplicații în care trebuie să copiați date în diverse scopuri. În industria serviciilor financiare, unele dintre aceste aplicații sunt:

  • Agregarea datelor și utilizarea detaliilor personale ale tranzacțiilor pentru a alimenta învățarea automată. Acest lucru ar putea ajuta la prezicerea morților și la evitarea datoriilor neperformante.
  • Furnizarea de aplicații terță parte cu acces la aceste date pentru a construi călătoria comportamentală a consumatorilor și cartografierea digitală.

Marea întrebare: Screen Scraping este legal?

Unele instituții financiare mari și-au exprimat îngrijorările de bază cu privire la faptul că consumatorii lor împărtășesc acreditările personale de finanțare cu screen scrapers, chiar dacă autoritățile de reglementare nu se opun acestei practici. Cu alte cuvinte, nu este ilegal.

Serviciile de screen scraping includ în mod activ clienții care partajează acreditările bancare pentru a permite algoritmilor de screen scraping să-și citească contul bancar și istoricul tranzacțiilor pentru a alimenta întreaga industrie bancară și financiară. Aceasta este o sabie cu două tăișuri. Trebuie să vă asigurați de două ori că serviciul de răzuire a ecranului respectă regulile și regulamentele de securitate. Astfel, vă puteți asigura că confidențialitatea dvs. nu este deturnată de companiile care doresc să vă vândă datele agenților de marketing. Serviciile de scraping trebuie să efectueze audituri de due diligence trimestrial și să aplice criptarea acreditărilor.

Cum se efectuează în esență Screen Scraping?

Screen scraping este, în esență, o utilizare automată a unei anumite pagini a unui site web sau a unui document, care acționează ca un browser web, pentru a extrage date personalizate care se fac de obicei manual. Este folosit pe web pentru a permite altor aplicații multiple să interacționeze cu algoritmi terți.

Pentru a detalia acest lucru pentru mai multă claritate, un serviciu numit Furnizor de servicii de plată terță parte (TPP) întreabă un client cu care bancă, cunoscută altfel sub numele de Furnizor de servicii de plată pentru servicii de conturi (ASPSP), este conectată. Apoi înregistrează acreditările lor de conectare. Serviciile folosesc aceste detalii pentru a se conecta la portalul bancar al clientului și pentru a extrage datele pe care le caută. Întregul istoric al utilizatorilor, extrasul de cont, tranzacțiile recente. Totul este la dispozitia lor. A ajutat cu adevărat să alimenteze industria FinTech așa cum o cunoaștem. I-a ajutat cu puncte de date pentru modele de regresie, cartografierea comportamentului consumatorilor, creând un sistem mai robust pentru a înțelege economia la nivel granular. Pentru a numi câteva, desigur. Screen scraping este cel mai recent și mai curat mod de a face incursiuni și de a obține acces la datele financiare ale utilizatorilor.

Dar riscurile?

Deși screen scraping a fost acceptat pe scară largă ca fiind procesul numărul unu pentru răzuirea datelor financiare, are propria sa parte de limitări:

1) Există necesitatea de a stoca datele private puse la dispoziție pentru screen scrapers

2) Razuitorul de ecran nu doar se târăște și preia date; se uzurpează identitatea utilizatorului conectându-se și reproducând și urmărind activitățile. Așa sunt colectate aceste date. Acest lucru ar putea fi considerat o încălcare a confidențialității la multe niveluri. Scraperul trebuie să introducă numele de utilizator, parola și o bucată de date memorabile în același mod în care ar face un utilizator. Mimica este perfectă. Și pentru a facilita acest lucru, parola a încetat să mai fie accesibilă într-un format necriptat. Există un pericol uriaș ca aceste acreditări să poată fi divulgate oricărei terțe părți vigilente. Chiar dacă nu există cazuri înregistrate în prezent, ar putea exista o mulțime de cazuri neraportate. Ar fi nevoie de ani pentru a remedia acest daune. Să nu uităm că clienții folosesc o parolă similară, dacă nu aceeași, pe platformele criptate. Prejudiciul ar fi de netrecut.

Cum combatem aceste probleme?

O mare parte a acestui lucru ar implica educarea utilizatorilor de internet pentru a căuta semne de credibilitate și criptare. De exemplu, ar putea implica să le spună să caute simbolul lacătului, care indică o conexiune sigură, sau ar putea implica verificarea adresei URL pe care o văd în bara de adrese ca fiind cea pe care intenționau să navigheze în primul rând.

Acest lucru crește importanța de a învăța pe toată lumea despre securitatea online și de a înțelege diferența foarte fină dintre un site web care phishing, spre deosebire de un screen scraper care accesează date pentru un bine.

În ciuda acestor probleme minore, mai avem nevoie de screen scraping? Răspunsul este un da răsunător! Ritmul cu care tehnologia avansează are un dezavantaj serios despre care oamenii vorbesc rar. Tehnologia devine învechită la fel de repede! Software-ul și aplicațiile devin dificil de întreținut după un timp.

Ceea ce pare o problemă minoră este o afacere foarte costisitoare! Companiile de pe continente cheltuiesc miliarde de dolari pe IT. Pentru a ilustra mai bine acest lucru, în 2017, companiile au cheltuit peste 3,5 trilioane de dolari pe IT. O mare parte din aceasta este de obicei alocată pentru a menține lucrurile operaționale. Menținerea întreprinderilor existente consumă cea mai mare parte a bugetului.

Dar acum, pentru a contracara întreținerea, companiile își migrează aplicațiile către serviciile cloud. Aceste sisteme vechi pot deveni o cauză majoră de îngrijorare din mai multe motive. Integrarea unei arhitecturi intrinsec veche cu aplicații noi este o sarcină dificilă. Din fericire, screen scraping permite exact asta: integrarea perfectă a vechiului și a noului, cu o dependență redusă de bugete mari pentru a ține cont de costurile operaționale. Ei bine, în ciuda tuturor, screen scraping este cel mai recent cuvânt la modă pentru un motiv. Tot ce ai nevoie este un serviciu premium de speriere a ecranului care să te ajute să navighezi în toate aspectele legale.