电子商务的替代数据 – PromptCloud
已发表: 2019-05-27让我们从什么是 Alt 数据源开始。 它代表替代数据,我们所说的替代数据是指非传统数据源,例如通过抓取万维网获得的不同形式的数据。 替代数据数据也可以是从数据聚合器或搜索引擎网站购买的数据,用于改进有针对性的营销。 这种类型的数据可以是结构化的,甚至是非结构化的(更有可能),并且可以由网络链接、文本数据、数据表、图像、视频等组成。
Alt 数据源构成了我们今天可用的大部分数据,根据许多报告,非结构化数据占其中的 80%。 虽然这些形式的数据早些时候被忽略了,但日益激烈的竞争和获取更多数据的需求使得有必要使用尽可能多的数据源。
数据和指标是电子商务领域的核心
与大多数其他企业不同,电子商务公司几乎总是以亏损开始。 这种情况背后的原因是许多客户获取成本、设置成本、不同物流合作伙伴产生的成本、较少的网站流量等等。 但是,一旦初始阶段过去,如果公司想要长期经营,就必须实现盈利或至少收支平衡。 这就是为什么这些公司中的大多数都在使用数据和指标来增加网站流量甚至获得更多转化的原因。 除了传统的数据源,电子商务的替代数据可以帮助这些公司做出更好的数据支持的业务决策。
电子商务公司的数据源是什么?
电子商务公司的主要数据来源之一是从他们自己网站上的流量中收集的数据。 该数据可以有多种类型:
- 与总是一起购买的产品相关的数据。 该信息可用于网站的推荐引擎做出更好的推荐。
- 通过将购买的产品映射到买家的位置,可以收集关于哪些商品在哪些地方具有更高销售概率的数据。 此信息可能再次导致公司将某些产品转移到特定仓库。
- 客户联系方式可用于根据他们之前的订单历史发送促销电子邮件。
- 可以分析客户在网站上的行为以改变外观和感觉,以便用户更容易浏览网站。
但是,仅仅依靠自己网站生成的数据可能并不可行,因为每家公司都没有亚马逊那么大,并且无法产生足够的流量来了解各种各样的人的客户特征。 这就是人们选择电子商务替代数据的原因,要么通过从聚合网站购买数据,要么通过从网络上抓取数据更好。
在上面提到的两个选项中,抓取网络是更好、更便宜的选择,因为您可以更自由地选择想要获取的数据、从何处获取数据、如何构建数据,甚至是您想要的方式将其与您现有的业务流程一起使用。 从聚合器购买数据时,您只能从他们现有的数据存储库中挑选并接受他们提供的任何格式的数据。

今天使用的电子商务的替代数据是什么?
当今电子商务网站正在使用不同种类的替代数据,虽然可能性是无限的,但我们已经提到了当今使用的一些最常见的电子商务替代数据。
- 图片——图片通常指的是产品图片,电商往往需要爬网从各个角度获取更好的图片,让用户对商品没有任何疑问,退货的机会也更少。
- 视频 - 虽然图像始终是产品页面中的必需品,但也需要某些项目的视频,您需要展示如何操作机器或如何安装机器等。对于此类产品,在产品中包含视频描述页面是必须的。 这些视频通常是从网上刮下来的。
- 图表、图表和指标——从网络上收集的专注于竞争对手的图表、图表和其他指标可以帮助公司做出重要的决策,例如关注哪些产品阵容、储备哪些品牌等等。
- 股票市场数据——虽然与公司开展业务的方式没有直接关系,但股票市场数据,尤其是电子商务领域的公司,可能很好地反映了电子商务公司的总体表现,而这个指标可以用于决定是扩大规模、开设更多商店还是保持稳定。
- 产品数据(文本)- 以文本格式显示的产品详细信息,描述产品的功能、使用方法以及将其与其他产品区分开来的功能是什么,这些数据被抓取并重复使用,以便让客户更好地了解商品,并通过更高的客户信心水平使商品卖得更好。
- 产品数据(表格)- 与产品相关的属性数据,例如重量、瓦数、功率、尺寸等,通常以表格格式呈现,尽管抓取这可能比普通文本格式的产品数据更难,但它的重要性更高。
- 社交媒体数据——电子商务公司也在抓取社交媒体数据,以寻找人们谈论更多的热门话题标签或产品和品牌。 这有助于公司决定与哪些品牌合作,对哪些产品进行更多宣传,以及投放哪些广告以更好地与更大的人群建立联系。
- 电子商务领域的新闻数据——一个丑闻可以让一家公司破产,事实上,许多丑闻已经让公司的股票暴跌。 在这种情况下,关注新闻,尤其是与电子商务行业相关的新闻是一个额外的数据点,这将带来更好的收益,也有助于控制局势而不让火势蔓延。
电子商务公司使用替代数据的困难
一切都是有代价的,如果您想使用替代数据源来促进您的业务,您必须忍受这些。 面临的一些最常见的问题是 -
- 非结构化数据 - 非结构化数据构成了大部分可用数据,也是您想要抓取的大部分数据。 但是,清理它并将其转换为您的业务团队可以使用的格式是一项挑战,因为您必须编写单独的脚本来处理来自每个不同来源的非结构化数据。
- 网站结构的变化 - 如果您从特定网站抓取数据,并且其用户界面在一夜之间发生变化,您可能无法恢复抓取,直到您在抓取引擎中进行更改以适应更改。
- 版权侵权问题- 某些图像和视频可能受版权保护,在抓取视频或图像时需要小心。
- 数据清洁度——在开展业务时,数据清洁度是必须的——主要是因为您的声誉取决于它。 然而,网上的大部分数据都没有经过身份验证,也没有证据。 例如,您可能会爬取一些数据,发现您销售的手机有 4Gb 的 RAM,但后来,客户可能会抱怨该手机只有 2Gb 的 RAM,并指责您做出虚假声明。 为了减少这种情况,最好从多个来源抓取数据并让一个来源支持另一个来源。
- 更长的过程 - 如果您自己抓取数据,那么这个过程相当长,从需求收集开始,到网站列表,实际抓取数据,清理数据,将其转换为所需格式,然后将其插入现有系统。
结论
获取替代数据以使您的业务流程受益可能需要时间,甚至在开始时会很艰难,但从长远来看肯定会有所回报。 保持数据未被利用只是错过了机会。 虽然我们知道建立一个数据抓取团队并让他们抓取、清理电子商务的 alt 数据并将其转换为可插入格式是很困难的,但还有许多其他选项可用。 其中之一是在 PromptCloud 使用像我们这样的服务提供商的帮助,使您的数据收集成为一个两步过程 - 您向我们提供数据的要求。
