2018 年发布的 PromptCloud 博客的热门帖子
已发表: 2018-12-26我们已经在今年的暮光之城,这是我们回顾我们所创造的最佳时机。 此外,值得注意的是,在年度关闭期间,最佳名单确保人们不会错过任何东西。
因此,本汇编为您提供了与我们博客上发布的网络数据相关的 10 篇最受欢迎的文章。 如果有任何事情发生,这将为您提供帮助。
不浪费任何时间,让我们跳进去。
酒店价格抓取与优化策略
我们为希望保持有竞争力的价格并同时保持盈利的连锁酒店提供了一个有趣的解决方案。 我们谈到了基于三个主要因素——需求预测、市场反应衡量、竞争分析——来设计定价策略。 所有这些因素都有几个子因素,这些子因素将在考虑各种约束的同时进行价格建模。

最后,将这些模型与酒店业务的独特卖点相结合,将揭示对客户有吸引力的定价。
可视化 YouTube 对奥斯卡提名电影预告片的评论
在这篇文章中,我们在娱乐领域进行了一项有趣的研究,并专注于奥斯卡颁奖典礼,因为这就是周围的话题。 我们从奥斯卡提名电影的预告片中提取 YouTube 评论并创建可视化。
以下是我们分析的内容:
- 基于评论数的电影受欢迎程度
- 评论长度分布
- 评论中使用的热门术语
- 情绪分析
- 词之间的关系——二元网络图
- 一个词云,可以在“水形物语”预告片的评论中找到最常出现的词。

这是我们发现的:
- 电影的受欢迎程度与获奖或提名没有直接关系
- 《水形物语》得到了褒贬不一的评论
- 奥斯卡提名可以改变观众对电影的看法
如何说服你的老板收集网络数据
接下来,我们决定帮助您说服您的老板收集网络数据,以提高您公司的生产力和效率。 我们专注于你可以在你的武器库中使用什么,并提出了一些可靠的观点。 你可以解释你怎么能——
- 使用数据更好地定位客户。
- 将未使用的数据从责任转换为有价值的资产。
- 推动创新。
- 促进决策。
- 提高整体效率。
全部使用来自网络抓取的数据!
机器学习和网络爬虫不可避免的神圣婚姻
到了年中,当每个人都在吃任何上面写着“机器学习”的蛋糕时,我们决定做这件作品。 我们首先讨论了网络抓取,然后讨论了机器学习,然后我们实际上解释了如何代替人类不断提出新的抓取规则,而机器可以保持抓取器运行。

最初需要一段时间的训练阶段,当一个真正的人会保持刮板继续运行并根据它的行为来奖励或惩罚它以使其学习和重新学习。
人工智能是否有助于快时尚的发展?
快时尚是时尚零售商使用的一个当代术语,用于表达设计从时装秀迅速转变为捕捉当前流行趋势。 而且,目前在时尚界,暗示趋势的简单算法已经过时了。 数据团队和设计团队正在使用先进的人工智能来微调产品——从寻找颜色和材料到条纹和配饰。 我们知道这一点,因为我们目前每天提供数百万个时尚数据,为一些专注于时尚的 AI 供应商提供支持。

发现下一季顾客会喜欢什么,结果证明是数学解决方案与设计师的创造力相结合的一个案例。

泰勒斯威夫特歌曲歌词数据可视化与分析
数据分析可以应用于“音乐”等创意领域,以找出潜在的主题和多年来的变化趋势。 因此,这项研究的重点是获得无数奖项的泰勒斯威夫特。
对她的 94 首曲目进行了分析,以创建一些引人入胜的图表和图表。

这是一个简短的总结:
- 探索性分析——我们根据单个曲目和专辑对字数进行了分析,对字数进行时间序列分析以及字数分布。
- 文本挖掘——在这里,我们使用我们探索的所有歌曲构建了一个词云。 我们还创建了一个二元网络并执行了不同类型的情感分析。
该数据集在Datastock中可供您使用!
您需要了解的有关抓取物联网数据的知识
年度流行语之一是 IoT(物联网),我们决定解释这一领域的机遇。 虽然还不是流行的数据抓取环境,但网络抓取可以帮助了解很多关于不同物联网设备的信息——交互是如何发生的,哪些数据可能容易被黑客入侵等。爬取不同硬件设备提供的数据,以及因为它们的连接点可以为希望分析整个物联网生态系统并创建更新、更高效的业务流程的人们提供巨大的机会。
GDPR 时代的网络抓取——影响和机遇
由于隐私和数据安全问题,像 Facebook 和谷歌这样的庞然大物受到扫描仪的影响,GDPR 或通用数据保护条例在欧洲生效。 这迫使许多公司改变运营程序、数据存储和工作流程处理,在某些情况下,甚至对整个基础设施进行大修。
然而,这个备受关注的立法机构也为 Web Scraping 领域带来了许多打击和机会。 在本文中,我们将深入探讨哪些变化将对数据抓取公司和个人产生影响。
数据分析揭示了美国最恐怖的城市
在万圣节这个月里,我们决定和幽灵一起去写一篇文章,根据他们有多少闹鬼的地方来分析不同的美国城市。

我们创建了一个州级和城市级频率图表以及美国的热图,以确保您知道自己被吓到的可能性有多大。 词图分析还有助于了解人们如何描述幽灵般的地方,以及哪些词在描述这些地方时更常见。
为什么 Web Scraping 是 API 的更好替代方案?
我们保留了年底最受争议的文章之一(希望人们会因为节日气氛而更加快乐)。 说到重点,如果您一直在使用 API,为了满足您的数据需求,您一定知道使用它们是多么容易; 您需要做的就是传递一些参数,然后您会得到一个 JSON/XML 作为响应,然后您就可以使用它了。

API 功能通常不会经常更改,即使确实发生了微小的更改,您也会收到相同的更新文档。 那么,它比 Web Scraping 更好吗? 好吧,正如您可能听说过的那样,更容易并不总是更好。 阅读这篇年终文章以了解更多信息。
这总结了您必须阅读的 2018 年文章的摘要。 如果您想在此列表中从我们的博客中获得其他文章,请发表评论!

