数据科学家的基本素质
已发表: 2017-01-12自信息技术出现以来,大数据一直在增长。 现在,我们每隔一天创建的数据相当于我们在 2003 年之前积累的所有数据。如此庞大的数据量不仅对企业,而且对整个人类本身都具有宝贵的洞察力。 一段时间以来,大数据分析一直在帮助医疗保健行业进行研究。 更重要的是,大数据甚至可能很快解决癌症之谜。
如果我告诉您,大数据实际上只是一堆如果您不知道如何使用就没有意义的数据怎么办? 这就是数据科学家发挥作用的地方。 为了理解大数据,我们需要数据科学家,而且需要准确的数据科学家。 并且不要让“数据科学家”这个头衔欺骗了你,数据科学家应该具备很多品质才能被称为“数据科学家”。 如果您正在寻找聘请数据科学家或计划自己成为一名数据科学家,以下是您应该寻找或拥有的品质。
统计思维
将数据转化为信息是数据科学家的首要工作。 因此,统计学的专业知识是不言而喻的品质。 以定量的心态看待事物对于在处理数据时保持中立并避免偏见很重要。 一个好的数据科学家明白洞察的深度和可靠性会随着数据量的增加而增加,并且会克制自己不要在数据不足的情况下得出结论。 随着大量数据的出现,趋势和见解会以数字的形式出现。 因此,对数字的热爱对于成为一名真正的数据科学家来说是必要的。 数据科学家应该能够查询大量数据以得出可行的见解,然后应用预测建模技术来预测未来趋势。 掌握统计数据对于准备报告和根据洞察力绘制推荐的行动方案是必要的。
编程技巧
数据科学家将与不同的团队合作构建管道、工具、模块、包、网站、仪表板等等。 这并不意味着数据科学家应该是专业的编码员,但对算法和代码如何工作的理解可以在数据科学家的工作中大有帮助。 当系统无法为您提供正确的趋势或见解时,是时候卷起袖子编写一些代码了。 如果没有一些编程技能和技术灵活性,这将是不可能的。
Python 被公认为最通用和兼容的编程语言,是处理数据库和 MapReduce 类型查询的理想选择。 由于易于学习语言和开源,学习 python 不应该成为你和你的数据科学梦想之间的障碍。

许多组织在雇用数据科学家时也考虑拥有出色的“伪代码技能”。 “伪代码技能”是用简单的英语编写查询或算法应该如何工作的能力。 这种解决问题的能力对于成为一名数据科学家至关重要。 数据科学是一个黄金标准以惊人的速度变化的行业,它强调了拥有比当前情景要求的更多技能的重要性。
好奇的头脑
尽管数据科学是一个相当古老的领域,但时不时地会有发现。 寻找新方法来解决老问题的动力是这背后的原因。 数据科学家应该始终保持好奇心,以寻找一种新的、更好的方式来获取、合并和处理数据,并找到获得更好洞察力的工具。 一个理想的数据科学家永远不应该停止好奇,因为数据包含的秘密只会向好奇的人坦白。 一个真正的数据科学家不是试图看看数据如何证明他的偏见是正确的,而是寻找隐藏在其中的真相。
有了数据,事情有时会变得相当困难,只有好奇心才能驱使你走向结果。 这就是为什么好奇心是数据科学家最基本的素质之一。
结果导向的性质
数据分析更多的是关于结果而不是过程本身。 只要有预期的结果,您如何将结果与数据一起带来并不重要。 数据科学家有时可能不得不采取不止一种方法来解决某些问题。 对于数据科学家来说,被小障碍拖住并不是一个好的品质。 在这种情况下,以结果为导向会有所帮助,因为将数据转换为结果的坚定决心成为了自己的驱动力。 一般来说,数据科学家是在处理不同任务的同时从一个问题转移到另一个问题的人。 只有结果才能阻止他们的努力。
创造力
创意在这个列表中可能看起来很奇怪。 事实是,它是数据科学家最重要的品质之一。 有创造力的人不怕犯错,他们尝试新事物,敢于探索新领域。 他们在失败中寻找机会,可以轻松改变方向。 所有这些对于数据科学来说都是必不可少的。
我们经常将人分为左脑型和右脑型。 像大数据这样的硬科学很少与创造力联系在一起,这是一个很大的错误。 数据科学家介于这两个类别之间,需要一系列创造力来寻找更新的方法和方法来处理数据。 统计数据和数据库并不是数据科学的全部内容,而是讲故事使分析的最终输出对决策者有用。
当然,仅凭创造力无法成为一名数据科学家。 能够准备易于使用、有吸引力且引人注目的报告的人可能并不总是最适合数据科学家的角色。 数据科学家可以被称为创造性的问题解决者。
对数据库的理解
无论您是使用结构化数据、非结构化数据还是同时使用两者,优秀的数据科学家都必须对数据库的工作有基本的了解。 此外,对列式数据库和关系数据库的基本了解可以大大简化数据科学家的工作。 许多企业仓库仍然使用传统的关系数据库。 数据科学家也必须参与这些数据库的设置,尽管会有技术人员来执行这项任务。 开发可以处理非结构化数据的数据库基础设施的诀窍就像一颗樱桃。
出色的沟通技巧
数据科学家将主要同时与技术、分析和业务人员一起工作。 S(he) 经常充当所有相关方的翻译。 同时处理技术和商业术语,并知道与需要强大沟通技巧的人一起使用什么。 分析的输出通常并不漂亮,至少对于不是数据科学家的人来说是这样。 洞察力和趋势被困在数字中,应该以他们理解的方式解释和传达给业务团队和利益相关者。 一个伟大的数据科学家应该能够使用讲故事、隐喻和视觉交流手段将分析中的复杂输出转化为来自不同背景的人们能够理解的更简单的形式。
对数据的渴望
伟大的数据科学家总是渴望更多的数据。 对数据的追求是没有任何既定目标的,因为更多的数据总是更好的数据。 数据科学家应该继续寻找更多的数据来源、更好的获取数据的方法以及处理数据的创新方法。 获取更多数据的动力是数据科学家必须具备的,因为数据是分析的燃料。