您的组织是否正遭受数据疲劳?
已发表: 2021-04-23在金融界,投资经理一直在寻找新的信息来源,这将为创建 Alpha 提供以前未开发的来源。 这些数据源被称为替代数据或数据疲劳。 数据是因为,嗯,信息。 替代方案,因为它们超出了典型的公司数据集。 冒着夸大陈词滥调的风险,这就是触发我们一直在寻求的“不公平优势”的原因。
另类数据的市场仍然非常原始和新生。 该公司的支出逐年增加数倍。 一些更受欢迎的替代数据来源是信用卡交易、在线抓取的数据、来自手机的地理位置数据等。直观地说,您可以说这些来源会因违反严重的隐私问题而受到关注。 因此,需要较少干扰的备用数据点。
尽管存在安全问题,替代数据市场目前正在蓬勃发展——预计 2020 年价值高达 3.5亿美元,几乎是 2016 年的 1.83 亿美元的两倍——但我们目睹了公司在 2019 年遭受替代数据疲劳。你问替代数据疲劳? 是的,它是不言自明的。 想起那句古老的格言,“新瓶装旧酒”。 同一组数据集被重新打包并出售给同一组对冲基金经理,他们浪费了宝贵的时间来准备数据而不是分析数据。 届时,市场上会出现新公司饱和:所有这些公司都将提供相同的竞争洞察力。
保护自定义信息
您可以采取一些基本的卫生命令步骤来避免替代数据疲劳。 第一步是确保您获得定制的和特定于业务的信息,这些信息将推动您的业务向前发展。 如果您想轻松消除疲劳,那将是最大的区别。 由于对另类数据的兴趣日益增长的影响,有许多研究公司提供最好的另类数据见解和/或向投资者、基金经理、旅行社和任何其他希望利用这一点的人出售另类数据集小马。 想象一下相同的数据集,从同一数据集得出的相同见解,相同的可操作点基于 A 公司和 B 公司从相同数据集中得出的见解。只有一点点差异。 他们都完全不知道他们正在使用相同的信息来对付对方。
替代数据馈送可以是特定公司不认为“传统”的任何内容。 线条真的越来越模糊。 当时被认为非常规的东西是当今最大的营销决策驱动因素之一。 必须注意,对您来说被视为“替代品”的东西不应成为来年的行业标准。 这将意味着每个人都可以平等地访问您花费大量精力整理的数据。

替代数据嗜睡
它是按原样抓取和维护“主流”数据的任务。 花时间和精力去抓取、维护和处理大量的替代数据,绝对是与主要关注圈相切的。 那么这里的罪魁祸首是什么? 是的,你猜对了。 昏睡。
替代数据集通常包含从大量来源和网站中提取的信息。 数据抓取过程可能会使您无法分析发现和得出见解。 更不用说人为错误和重复的范围增加了。 刮痧是第一步。 然后是标准化。 它必须采用“标准”格式才能有意义。 这是机器可以学习和自动化该过程的唯一方法。
现在我们已经有了适当的格式,接下来是绘制所收集数据的真正意图。 你知道美式英语和英式英语有多么不同吗? 我们不是唯一觉得这很烦人的人。 例如,有两种不同的方式可以写入单个日期。 2021 年 5 月 27 日可以写为 5/27/2021 或 27/5/2021,我们不必告诉您这种差异会对收集的数据产生何种影响。 因此,您必须收集、标准化、得出见解并做出战略性业务决策。 用最少的人力。
摆脱数据疲劳
我们从不提及我们没有解决方案的问题。 您可以从很多事情开始:
- 自动化:这个很简单。 我们刚刚解释了看似无害的人为错误的影响。 通常情况下,抓取的数据会保留为独立文件,然后手动集成。 就像数据的自动化标准化一样,自动化集成过程大大减少了以劳动力为导向的工作所带来的疲劳,并允许团队将所有精力集中在数据分析上。 通过使用 API 准备数据以支持与内部业务系统的无缝集成并为分析目的创建强大的数据集,数据集成可以实现无人化。
- 外包:将平凡的任务自动化总是有意义的。 尤其是在您需要一定程度的技术专长的情况下。 只需确保包含非竞争性排他性条款即可。 否则,您会在竞争对手手中找到相同的数据。 那会不会很糟糕。
- 量身定制:如果您决定外包所有替代数据帮助,请与有能力为您的品牌创建自定义数据集的公司合作。 一刀切的方法在这里行不通。 他们需要具备正确的网络数据集成能力。 数据集成将网络提取数据的整个生命周期视为一个单一的、有凝聚力的过程,重点是数据质量和控制。
通过提取自定义数据,还有无数其他方法可以绝对避免数据疲劳。 它很美。 跨社交媒体渠道、信用卡数据对您的评论部分进行情绪分析,以破解消费者的消费行为(尽管不受欢迎)。 使用卫星和/或监控图像来计算停车场的汽车数量。 你只需要告诉你的网络爬虫服务提供商收集你需要的数据的确切性质。 就这些。 杀死疲劳。 你是为了更好的东西。
