ขูดข้อมูลโรงแรมโดยใช้ Python
เผยแพร่แล้ว: 2018-08-21ก่อตั้งขึ้นในปี 2000 เว็บไซต์ท่องเที่ยวในบอสตันเป็นหนึ่งในพอร์ทัลการเดินทางที่ใช้มากที่สุดทั่วโลก แต่ด้วยจำนวนผู้ใช้ โรงแรม การจอง และรีวิวจำนวนมาก คุณสามารถเข้าใจขนาดของข้อมูลการเดินทางที่สร้างขึ้นได้ มาดูกันว่าจะทำอย่างไรกับข้อมูลนั้น และวิธี ขูด ข้อมูลโรงแรมโดย ใช้ python
คุณจะได้รับประโยชน์จากการ ขูดข้อมูลโรงแรม ได้อย่างไร
เราได้เรียนรู้ข้อเท็จจริงที่สำคัญบางประการเกี่ยวกับอุตสาหกรรมการจองของการท่องเที่ยวระดับโลก สิ่งที่สำคัญคือคุณจะได้รับประโยชน์จากการรวบรวมข้อมูลและการขูดได้อย่างไร ไม่เหมือนเว็บไซต์ คุณอาจจะจัดเลี้ยงเฉพาะกับคนในประเทศใดประเทศหนึ่ง หรือแม้แต่เมืองหรือท้องถิ่น การทำแผนที่ที่พักและโรงแรมทุกแห่งอาจเป็นเรื่องยาก โดยเฉพาะอย่างยิ่งหากคุณเพิ่งสร้างธุรกิจขึ้นมา หากคุณรวบรวมข้อมูลจากเว็บไซต์นี้ คุณจะได้รับรายละเอียดต่างๆ ของแต่ละโรงแรม เช่น:
- ชื่อเต็ม
- ภาพตัวแทน
- อยู่ที่สมบูรณ์
- ช่วงราคาห้องพัก
- คะแนน
- ความคิดเห็น
ด้วยข้อมูลจำนวนมาก คุณสามารถตรวจสอบราคาของคู่แข่งได้อย่างง่ายดาย และเข้าใจสิ่งที่ผู้ใช้พูดถึงคุณสมบัติต่างๆ ผ่านการรีวิว ด้านล่างนี้คือแอปพลิเคชันที่สำคัญของข้อมูลการกำหนดราคาและบทวิจารณ์ของลูกค้า:
- ข้อมูลการกำหนดราคาและการกำหนดราคาที่แข่งขันได้จากข้อมูลราคา
- ตรวจสอบให้แน่ใจว่า OTA เป็นไปตามการกำหนดราคาและความสอดคล้องของแบรนด์ของคุณ
- ทำความเข้าใจการเคลื่อนไหวของสินค้าคงคลังตามฤดูกาลและที่ตั้ง
- การตรวจสอบแบรนด์สำหรับการจัดการชื่อเสียงออนไลน์
- เข้าใจความชอบของผู้บริโภค
วันนี้เราจะแสดงวิธีการรวบรวมข้อมูลข้อมูลทั้งหมดที่กล่าวถึงข้างต้นในรูปแบบ JSON สำหรับโรงแรมแห่งใดแห่งหนึ่งโดยที่คุณมี URL
เมื่อคุณมีข้อมูลในรูปแบบ JSON แล้ว คุณสามารถจัดเก็บไว้ในฐานข้อมูล NoSQL ของคุณเอง และใช้งานได้เมื่อจำเป็น หากคุณต้องการราคา คุณสามารถเข้าถึงได้เฉพาะราคา เมื่อคุณต้องแสดงภาพตัวแทน คุณก็สามารถทำได้เช่นกัน เป็นต้น คุณสามารถขูดและเพิ่มลงในฐานข้อมูลของคุณต่อไปได้ ในขณะที่คุณสร้างระบบเพื่ออัปเดตข้อมูลที่ผ่านมาโดยเก็บรายการ URL โรงแรมที่คัดลอกมาก่อนหน้านี้ ระบบดังกล่าวในขนาดใหญ่สามารถสร้างขึ้นได้ด้วยความช่วยเหลือจากผู้ให้บริการโซลูชันการขูดเว็บที่มีประสบการณ์ เช่น PromptCloud
เริ่มจากพื้นฐานกันก่อน
1. การตั้งค่า Source Cod e Editor
ในการคัดลอกและแก้ไขข้อมูลโค้ดที่ให้ในภายหลัง คุณจะต้องมีโปรแกรมแก้ไขโค้ดหรือ IDE ข้อแตกต่างพื้นฐานระหว่างทั้งสองคือ โปรแกรมแก้ไขโค้ดจะให้คุณแก้ไขโค้ดของภาษาการเขียนโปรแกรมใดๆ ก็ได้ และคุณสามารถเรียกใช้โค้ดจากพรอมต์คำสั่ง หลังจากแก้ไขและบันทึกโค้ดแล้ว อย่างไรก็ตาม ใน IDE (Integrated Development Environment) เช่น PyCharm คุณจะมีตัวเลือกต่างๆ เช่น ตัวแก้ไขซอร์สโค้ด เครื่องมืออัตโนมัติสำหรับบิลด์ และดีบักเกอร์ มีตัวเลือกฟรีมากมายสำหรับทั้ง IDE และโปรแกรมแก้ไขโค้ด เช่น Pycharm, Sublime และ Atom การเริ่มต้นใช้งาน Atom นั้นง่ายกว่า เนื่องจากช่วยให้มีฟังก์ชันเพิ่มเติมที่พบใน IDE ผ่านการติดตั้งแพ็กเกจเสริมสำหรับภาษาโปรแกรมต่างๆ นี่คือลิงค์สำหรับ atom- https://atom.io/

เมื่อเยี่ยมชมเว็บไซต์ คุณจะเห็นว่าพวกเขาตรวจพบระบบปฏิบัติการของคุณแล้ว เช่นเดียวกับความเข้ากันได้ (32 บิตหรือ 64 บิต) ทั้งนี้ขึ้นอยู่กับว่าพวกเขาจะจัดหาตัวแก้ไขเวอร์ชันล่าสุดให้กับคุณ เพียงคลิกที่ปุ่มดาวน์โหลด
หลายคนใช้ Git ซึ่งเป็นซอฟต์แวร์การกำหนดเวอร์ชันยอดนิยมเพื่อติดตามโค้ดของตน ในกรณีที่คุณใช้งานด้วย atom ให้การผสานรวมกับ GitHub ได้อย่างน่าทึ่ง
ไฟล์การติดตั้งอะตอมจะอยู่ที่ประมาณ 150MB และเมื่อดาวน์โหลดแล้ว คุณสามารถคลิกเพื่อดูป๊อปอัปที่ระบุด้านล่าง โดยจะยังคงอยู่ในขณะที่ทำการติดตั้ง ดังนั้นคุณอาจต้องรอสักหนึ่งหรือสองนาที

2. โปรแกรมติดตั้ง Atom
เมื่อติดตั้ง Atom แล้ว คุณยังสามารถติดตั้งแพ็คเกจต่างๆ ได้ดังที่เราได้กล่าวไว้ก่อนหน้านี้ ซึ่งจะให้ฟังก์ชันการทำงานบางอย่างของ IDE วิธีนี้จะทำให้คุณเขียนโค้ดได้ง่ายขึ้นด้วยคุณลักษณะต่างๆ เช่น การเติมข้อความอัตโนมัติและการดีบักที่ง่ายดาย กดปุ่ม CTRL+ เครื่องหมายจุลภาค (กดปุ่มควบคุมและปุ่มเครื่องหมายจุลภาคพร้อมกัน) หรือคุณสามารถไปไกลและเลือก File >> Settings >> Install . ที่นี่คุณสามารถพิมพ์ Python ในแถบค้นหาและรับแพ็คเกจต่างๆ สำหรับตัวคุณเอง เช่น autocomplete-python ที่จะช่วยคุณให้คำแนะนำขณะพิมพ์ เพื่อเติมโค้ดของคุณโดยอัตโนมัติ

หากคุณมีไฟล์โค้ดใดๆ ในคอมพิวเตอร์ของคุณ (เช่น ไฟล์จาวาหรือไฟล์ ruby) คุณสามารถโหลดไฟล์เหล่านี้ใน atom และดูว่าไฟล์ทั้งหมดมีลักษณะอย่างไร มีคุณลักษณะอื่นๆ อีกมากมายใน Atom เช่น การเปลี่ยนธีม แต่ส่วนการสำรวจจะเหลือให้คุณ ซึ่งสามารถทำได้ด้วยความช่วยเหลือเล็กน้อยจาก Google
3. การติดตั้ง Python
ขอแนะนำให้ใช้ประสบการณ์การเขียนโปรแกรมพื้นฐานในภาษาการเขียนโปรแกรมเชิงวัตถุทุกประเภท อย่างไรก็ตาม บทช่วยสอน DIY นี้จะช่วยให้คุณใช้งานเครื่องขูดและรับข้อมูลของคุณ เพื่อให้คุณดึงข้อมูลเพื่อทำความเข้าใจพื้นฐาน เราจะครอบคลุมทุกอย่างตั้งแต่การติดตั้งไปจนถึงการดู JSON
ก่อนอื่นคุณต้องไปที่ลิงก์ต่อไปนี้ – https://www.python.org/downloads

คลิกที่ปุ่ม Download Python 3.7.0 เวอร์ชันที่แสดงอาจเป็นเวอร์ชันที่สูงกว่า ขึ้นอยู่กับว่าคุณกำลังตรวจสอบเว็บไซต์กี่วันนับจากนี้ นอกจากนี้ ขึ้นอยู่กับระบบปฏิบัติการ Linux, Mac หรือ Windows เวอร์ชันของ Python อาจแตกต่างกัน
เมื่อดาวน์โหลดไฟล์การติดตั้งแล้ว ให้คลิกที่ไฟล์นั้น แล้วเลือกติดตั้ง ทำตามคำแนะนำและเลือกตำแหน่งที่คุณต้องการติดตั้ง Python นี่คือภาพหน้าจอของไฟล์การติดตั้งสำหรับ Python 3.7.0 เวอร์ชัน 32 บิต ตรวจสอบให้แน่ใจว่าคุณได้ทำเครื่องหมายในช่องทั้งสองช่องก่อนที่จะคลิก Install Now ในกรณีที่คุณต้องการปรับแต่ง เช่น เปลี่ยนไดเร็กทอรีที่คุณต้องการให้ติดตั้ง Python คุณยังสามารถคลิกที่ปุ่ม Customize Installation
เมื่อการติดตั้งเสร็จสิ้น คุณสามารถเรียกใช้โปรแกรม python เพื่อดูว่าทุกอย่างทำงานได้ดีหรือไม่ คุณไม่จำเป็นต้องมีความรู้ Unix ใด ๆ ในการรันโปรแกรม python จากพรอมต์คำสั่ง สิ่งที่คุณต้องทำคือพิมพ์ python ตามด้วยชื่อไฟล์ที่คุณพยายามเรียกใช้ จากนั้นกด Enter อย่าลืมบันทึกไฟล์ทั้งหมดของคุณด้วยนามสกุล . .py เนื่องจากนามสกุล . .py ระบุว่าไฟล์นั้นเป็นไฟล์ Python ตอนนี้ ให้เราลองใช้โปรแกรม python ง่ายๆ ที่ให้ผลรวมของตัวเลขสองตัว เราจะสร้างไฟล์ในไดเร็กทอรีปัจจุบันด้วยชื่อ addition.py และพิมพ์รหัสต่อไปนี้ในนั้น-
[รหัสภาษา =”หลาม”]
x = 5
y = 2
def เพิ่ม (a,b):
print(“ผลรวมของ “+str(a)+” และ “+str(b)+” คือ “+str(a+b))
บวก (x,y)
[/รหัส]
จากนั้นเราจะดำเนินการจากพรอมต์คำสั่งโดยใช้ -
[รหัสภาษา=”python”]python added.py[/code]
การดำเนินการนี้จะเรียกใช้โปรแกรมและแสดงผลรวมของตัวเลขทั้งสอง คุณสามารถเขียนฟังก์ชันที่คล้ายกันสำหรับการลบ การหาร และอื่นๆ และทำความเข้าใจกับ Python

ใน python หลายคนได้สร้างฟังก์ชันที่สามารถนำมาใช้ซ้ำได้ สิ่งเหล่านี้เรียกว่า Python libraries คุณสามารถใช้สิ่งเหล่านี้โดยการนำเข้าในโปรแกรมของคุณ แต่ก่อนที่คุณจะทำเช่นนั้น คุณต้องแน่ใจว่าคุณได้ติดตั้งแพ็คเกจเหล่านั้นโดยใช้ pip Pip เป็นตัวจัดการแพ็คเกจบรรทัดคำสั่งที่มาพร้อมกับ python

สำหรับบทช่วยสอนนี้ เราจะใช้ BS4 หรือที่รู้จักกันดีในชื่อ Beautiful Soup เป็น Python library สำหรับดึงข้อมูลจากไฟล์ HTML และ XML มันทำงานร่วมกับ parser ใดๆ (หรือ parser lxml โดยค่าเริ่มต้น) เพื่อให้วิธีการนำทาง ค้นหา และแก้ไขแผนผังการแยกวิเคราะห์ ซึ่งจะช่วยดึงข้อมูลจาก html ที่คัดลอกมาโดยใช้โค้ดบรรทัดเดียว การทำเช่นนี้อาจใช้เวลาหลายชั่วโมงถ้าไม่ใช่วัน
หน้าเอกสารสำหรับข้อมูลเพิ่มเติมเกี่ยวกับซุปที่สวยงามมีอยู่ที่นี่ – ซุปที่สวยงาม (bs4)
หากมีการติดตั้งไว้แล้วในระบบของคุณ (ในกรณีที่มีคนใช้ python ในระบบก่อนหน้านี้) คุณจะเห็นข้อความนี้ในบรรทัดคำสั่งของคุณ –
“ข้อความที่ตอบสนองความต้องการแล้ว”
วิธีรวบรวมข้อมูลเว็บ
เมื่อสภาพแวดล้อมและตัวแก้ไขข้อความได้รับการตั้งค่าแล้ว เราก็สามารถลงมือปฏิบัติจริงได้ คุณจะเข้าใจว่าสามารถดึงข้อมูลออกจากหน้าเว็บของโรงแรมหนึ่งๆ ได้อย่างไร
เมื่อคุณรันโค้ด คุณจะได้รับแจ้งให้ระบุ URL คุณสามารถระบุ URL ของหน้าโรงแรมใดก็ได้ เราจะทำสิ่งต่อไปนี้ -
https://www..in/Hotel_Review-g1162480-d478012-Reviews-Radisson_BLU_Resort_Temple_Bay_Mamallapuram-Mahabalipuram_Kanchipuram_District_Tamil_N.html
รหัสเพื่อรวบรวมข้อมูลหน้าเว็บได้รับด้านล่าง ป้อน URL ที่กล่าวถึงข้างต้นเมื่อได้รับแจ้ง หลังจากเรียกใช้โปรแกรมนี้ ลิงค์สำหรับรหัสในกรณีที่มีปัญหาใด ๆ –
(https://drive.google.com/open?id=19xBkg4rKTxk7Vk6-TfxnNLa9GTcVvq3a)
[รหัสภาษา =”หลาม”]
นำเข้า urllib.request, urllib.parse, urllib.error
จาก bs4 นำเข้า BeautifulSoup
นำเข้า ssl
นำเข้า json
นำเข้าอีกครั้ง
นำเข้าsys
นำเข้าคำเตือนถ้าไม่ใช่ sys.warnoptions:
Warnings.simplefilter(“ละเว้น”)#สำหรับการละเว้นข้อผิดพลาดของใบรับรอง SSL
ctx = ssl.create_default_context()
ctx.check_hostname = เท็จ
ctx.verify_mode = ssl.CERT_NONE# url = input('ป้อน url – ' )
url=input("ป้อน Hotel Url – “)
html = urllib.request.urlopen(url, บริบท = ctx).read()
ซุป = BeautifulSoup (html, 'html.parser')
html = soup.prettify (“utf-8”)
hotel_json = {}
สำหรับบรรทัดใน soup.find_all('script',attrs={“type” : “application/ld+json”}):
รายละเอียด = line.text.strip()
รายละเอียด = json.loads (รายละเอียด)
hotel_json["name"] = รายละเอียด["name"]
hotel_json[“url”] = “https://www.<domainname>.in”+details[“url”]
hotel_json["image"] = รายละเอียด["image"]
รายละเอียด[“priceRange”] = รายละเอียด[“priceRange”].replace(“₹ “”อาร์เอส “)
รายละเอียด[“priceRange”] = รายละเอียด[“priceRange”].replace(“₹””อาร์เอส “)
hotel_json["priceRange"] = รายละเอียด["priceRange"]
hotel_json[“aggregateRating”]={}
hotel_json[“aggregateRating”][“ratingValue”]=รายละเอียด[“aggregateRating”][“ratingValue”]
hotel_json[“aggregateRating”][“reviewCount”]=details[“aggregateRating”][“reviewCount”]
hotel_json[“ที่อยู่”]={}
hotel_json["address"]["Street"]=รายละเอียด["address"]["streetAddress"]
hotel_json["address"]["Locality"]=รายละเอียด["address"]["addressLocality"]
hotel_json["ที่อยู่"]["ภูมิภาค"]=รายละเอียด["ที่อยู่"]["ที่อยู่ภูมิภาค"]
hotel_json["ที่อยู่"]["รหัสไปรษณีย์"]=รายละเอียด["ที่อยู่"]["รหัสไปรษณีย์"]
hotel_json["ที่อยู่"]["ประเทศ"]=รายละเอียด["ที่อยู่"]["ที่อยู่ประเทศ"]["ชื่อ"]
หยุดพัก
hotel_json[“บทวิจารณ์”]=[]
สำหรับบรรทัดใน soup.find_all('p',attrs={“class” : “partial_entry”}):
ทบทวน = line.text.strip()
ถ้ารีวิว != “”:
ทบทวน = line.text.strip()
ถ้า review.endswith( “เพิ่มเติม” ):
ทบทวน = ทบทวน[:-4]
ถ้า review.startswith("เรียน"):
ดำเนินต่อ
รีวิว = review.replace('r', ' ').replace('n', ' ')
รีวิว = ' '.join(review.split())
hotel_json[“รีวิว”].append(รีวิว)
ด้วย open(hotel_json[“name”] + “.html”, “wb”) เป็นไฟล์:
ไฟล์.write(html)
ด้วย open(hotel_json[“name”] + “.json”, 'w') เป็นไฟล์ outfile:
json.dump(hotel_json, outfile, เยื้อง=4)
[/รหัส]
เมื่อคุณเรียกใช้โปรแกรมและให้ html ที่ให้มา คุณจะได้รับไฟล์ json ซึ่งมีชื่อเหมือนกับชื่อโรงแรม (Radisson BLU Resort Temple Bay Mamallapuram.json) และจะมีลักษณะดังที่แสดงด้านล่าง ลิงก์ไปยัง json เพื่อการใช้งานง่าย –
(https://drive.google.com/open?id=1DQxkTLVUm8UAu7ByKh7NrqK3iBjME6MQ)
[รหัสภาษา =”หลาม”]
{
“ชื่อ”: “Radisson BLU Resort Temple Bay Mamallapuram”,
“url”: “https://www.<domainname>.in/Hotel_Review-g1162480-d478012-Reviews-Radisson_BLU_Resort_Temple_Bay_Mamallapuram-Mahabalipuram_Kanchipuram_District_Tamil_N.html”,
“image”: “https://media-cdn.<domainname>.com/media/photo-s/03/e5/92/9b/radisson-blu-resort-temple.jpg”,
“priceRange”: “Rs 8,356 – Rs 36,027 (อิงจากราคาเฉลี่ยสำหรับห้องสแตนดาร์ด)”,
“คะแนนรวม”: {
“ค่าเรตติ้ง”: “4.0”,
“reviewCount”: “2407”
},
"ที่อยู่": {
“ถนน”: “57 ถนนโคฟลอง”,
“ท้องที่”: “มหาพลีปุรัม”,
“ภูมิภาค”: “ทมิฬนาฑู”,
“ซิป”: “603104”,
“ประเทศ”: “อินเดีย”
},
“ความคิดเห็น”: [
“รีสอร์ทที่กว้างขวางและได้รับการดูแลอย่างดีบนชายหาด มีสระว่ายน้ำที่ใหญ่ที่สุดแห่งหนึ่ง สนามหญ้าเอเคอร์ กิจกรรมมากมายสำหรับเด็ก ห้องตกแต่งอย่างดี เล่นคริกเก็ต วอลเล่ย์บอล พนักงานที่เป็นมิตร และวิววัดฝั่งบนชายหาด อาหารก็ธรรมดา….”,
“ที่นี่สุดยอดมาก เรามีห้องที่หันหน้าเข้าหาสระว่ายน้ำ รถบักกี้พาเราไปรอบๆ สนามหญ้าเขียวชอุ่ม ดอกไม้ และต้นมะพร้าว สถานที่ที่ได้รับการดูแลอย่างดี สระว่ายน้ำน่าจะเป็นส่วนที่ดีที่สุดของรีสอร์ท ชายหาด พื้นที่ดาดฟ้าก็น่ารัก บริการดี เราว่ารีสอร์ทนั้น…”,
“ฉันมีประสบการณ์ที่ดีกับเรดิสัน บลู รีสอร์ท เทมเปิล เบย์ มามาลาปุรัม อยู่ที่นั่นเป็นเวลาหนึ่งวันกับทีมของฉัน ฉันชอบที่นี่และชายหาดที่อยู่ติดกับรีสอร์ท อาหารอร่อย &amp; เครื่องดื่มต้อนรับ.",
“ฉันอยู่ที่นั่น 1 วันพร้อมทั้งครอบครัว เราจองห้องไว้ 6 ห้องและคุณภาพของห้องดีมากจนสมาชิกทุกคนในครอบครัวมีความสุข บริการดี อาหารอร่อย สระว่ายน้ำดี พนักงานดี โดยรวมแล้วเป็นการพักที่ดีมาก”
]
}
[/รหัส]
ข้อมูลที่ดึงออกมา
คุณสามารถดูฟิลด์ต่างๆ ได้หลายฟิลด์ใน JSON ให้เราอธิบายให้คุณฟังเพื่อการบริโภคที่ง่ายขึ้น ฟิลด์ชื่อมีความชัดเจน และตามด้วย URL รูปภาพและช่วงราคา URL เป็น URL เดียวกับที่คุณให้โปรแกรมเมื่อขอ -

รวมอยู่ใน JSON ในกรณีที่คุณต้องการในภายหลัง URL รูปภาพจะให้ภาพตัวแทนของโรงแรม และช่วงราคาจะช่วยให้คุณทราบราคาขั้นต่ำที่คุณจะได้ห้องมาตรฐานและค่าใช้จ่ายสูงสุดของห้องสวีทที่ดีที่สุด ฟิลด์ที่อยู่แบ่งออกเป็นหลายฟิลด์ย่อยเพื่อให้กรองได้ง่ายขึ้น ขึ้นอยู่กับกรณีการใช้งาน ถนน ท้องที่ ภูมิภาค รหัสไปรษณีย์ และประเทศ ทั้งหมดนี้มอบให้คุณ คุณสามารถรวมและใช้เป็นหนึ่งเดียว หรือใช้สำหรับการกรองตามรหัสไปรษณีย์ ประเทศ หรือภูมิภาค และอื่นๆ
ฟิลด์การให้คะแนนรวมมีคะแนนจากห้าคะแนนและจำนวนผู้ที่รีวิวโรงแรมจริงๆ ทำไมทั้งสองจึงมีความสำคัญ? สมมติว่าโรงแรมหนึ่งได้รับคะแนน 4.9/5 ดาว แต่มีเพียง 10 คนเท่านั้นที่ได้รีวิว ในขณะที่อีกโรงแรมหนึ่งได้รับคะแนน 4.5/5 ดาว แต่ได้รับการวิจารณ์โดย 2,500 คน อันไหนที่ลูกค้าจะจอง?
ถัดไป คุณจะเจอฟิลด์บทวิจารณ์ ซึ่งประกอบด้วยบทวิจารณ์ยอดนิยมในหน้าหลักของโรงแรม คุณจะเห็นได้ว่าบทวิจารณ์บางรายการยาวเกินไปและถูกตัดออกในรูปของ “…” โดยทางโปรแกรมสามารถขยายเพื่อเปิดเผยบทวิจารณ์ทั้งหมดได้เช่นกัน คุณสามารถใช้ข้อมูลนี้กับข้อมูลและเรียกใช้เทคนิคการทำเหมืองข้อความเพื่อทำความเข้าใจความเห็นจากลูกค้าเกี่ยวกับโรงแรม ข้อดีและข้อเสียของโรงแรม
ข้อมูลทั้งหมดนี้สามารถถูกทำลายได้และรูปแบบสามารถเปลี่ยนแปลงได้ และสามารถใช้ได้ตามที่คุณต้องการ เนื่องจาก JSON สามารถอ่านได้จากภาษาการเขียนโปรแกรมทั้งหมดและเป็นไปตามรูปแบบมาตรฐานที่เป็นที่ยอมรับทั่วโลก
หลังจากรันโปรแกรมแล้ว คุณจะเห็นว่ามีการสร้างไฟล์ html ที่มีชื่อของโรงแรมขึ้นด้วย เป็นสำเนาที่สมบูรณ์ของหน้า html ที่เพิ่งคัดลอกมา คุณสามารถใช้มันเพื่อการวิเคราะห์เพิ่มเติมและลองใช้มือของคุณเองในการขูดข้อมูลจากมัน
คุณควรไปกับผู้ให้ บริการ Web Scraping Service P เมื่อใด
คนส่วนใหญ่ที่ไม่มีความรู้ด้านการเขียนโปรแกรมอาจยังไม่แน่ใจเกี่ยวกับกระบวนการทั้งหมด แม้ว่าจะสามารถใช้เป็นกระบวนการเรียนรู้ได้ แต่องค์กรที่ต้องการข้อมูลขนาดใหญ่ที่ความถี่ปกติควรเลือกใช้ผู้ให้บริการโซลูชันการรวบรวมข้อมูลเฉพาะทาง ประโยชน์หลักของการทำงานร่วมกับ มืออาชีพอย่าง PromptCloud – ผู้ให้บริการจัดการเว็บแบบเต็มรูปแบบ:
- บริการที่มีการจัดการอย่างเต็มที่
- ปรับแต่งได้อย่างเต็มที่
- การสนับสนุนเฉพาะด้วย SLA . ที่แข็งแกร่ง
- เวลาแฝงต่ำ
- ปรับขนาดได้สูง
- ค่าบำรุงรักษา
ข้อจำกัดความรับผิดชอบ: รหัสที่ให้ไว้ในบทช่วยสอนนี้มีไว้เพื่อการเรียนรู้เท่านั้น เราไม่รับผิดชอบต่อการใช้งานและจะไม่รับผิดชอบต่อการใช้งานซอร์สโค้ดที่เป็นอันตรายใดๆ
