데이터 과학자의 필수 자질

게시 됨: 2017-01-12
목차
통계적 사고
프로그래밍 기술
호기심 많은 마음
결과 지향적인 성격
창의력
데이터베이스의 이해
훌륭한 의사 소통 능력
데이터에 대한 굶주림

빅 데이터는 정보 기술의 여명기부터 성장해 왔습니다. 이제 우리가 격일로 생성 하는 데이터는 2003년까지 축적된 모든 데이터와 같습니다. 이 엄청난 양의 데이터는 비즈니스뿐만 아니라 인류 전체에 대한 귀중한 통찰력을 제공합니다. 빅데이터 분석은 이미 오래전부터 헬스케어 산업 연구에 도움이 되어 왔습니다. 게다가 빅 데이터는 의 수수께끼를 풀 수도 있습니다 .

빅 데이터는 실제로 사용 방법을 모른다면 의미가 없는 데이터 더미일 뿐입니다. 여기에서 데이터 과학자가 등장합니다. 빅 데이터를 이해하려면 데이터 과학자가 필요하고 정확하려면 좋은 과학자가 필요합니다. 그리고 '데이터 과학자'라는 제목에 속지 마세요. 데이터 과학자가 되기 위해 갖추어야 할 자질은 꽤 많습니다. 데이터 과학자를 고용하려고 하거나 스스로 데이터 과학자가 될 계획이라면 다음과 같이 찾거나 보유해야 할 자질이 있습니다.

데이터 과학자

통계적 사고

데이터를 정보로 바꾸는 것은 데이터 과학자의 주요 업무입니다. 따라서 통계의 노하우는 말할 필요도 없는 품질입니다. 데이터를 다루는 동안 중립을 유지하고 편견을 없애기 위해서는 양적 사고방식으로 사물을 바라보는 것이 중요합니다. 훌륭한 데이터 과학자는 통찰력의 깊이와 신뢰성이 데이터의 양에 비례하여 증가한다는 것을 이해하고 부적절한 데이터로 결론에 도달하는 것을 자제합니다. 엄청난 양의 데이터로 추세와 통찰력이 숫자로 나타납니다. 따라서 숫자에 대한 사랑은 진정한 데이터 과학자가 되기 위해 필요합니다. 데이터 과학자는 많은 양의 데이터를 조사하여 실행 가능한 통찰력을 얻은 다음 예측 모델링 기술을 적용하여 미래 추세를 예측할 수 있어야 합니다. 보고서를 준비하고 통찰력을 기반으로 권장 조치를 계획하려면 통계를 잘 파악해야 합니다.

프로그래밍 기술

데이터 과학자는 여러 팀과 협력하여 파이프라인, 도구, 모듈, 패키지, 웹사이트, 대시보드 등을 구축합니다. 이것은 데이터 과학자가 전문 코더여야 한다는 것을 의미하지는 않지만 알고리즘에 대한 이해와 코드 작동 방식은 데이터 과학자의 작업에 큰 도움이 될 수 있습니다. 시스템이 올바른 추세나 통찰력을 제공할 수 없으면 소매를 걷어붙이고 코드를 작성할 때입니다. 이것은 약간의 프로그래밍 기술과 기술적 유연성 없이는 불가능합니다.

Python은 가장 다재다능하고 호환 가능한 프로그래밍 언어로 인정되며 데이터베이스 및 MapReduce 유형 쿼리를 처리하는 데 이상적입니다. 언어와 오픈 소스를 배우기 쉽기 때문에 파이썬을 배우는 것은 당신과 데이터 과학의 꿈 사이에 큰 장애물이 되어서는 안 됩니다.

많은 조직에서 데이터 과학자를 고용할 때 우수한 '의사 코드 기술'을 고려하기도 합니다. '의사 코드 기술'은 쿼리 또는 알고리즘이 일반 영어로 작동하는 방식을 작성하는 기능입니다. 이 문제 해결 능력은 데이터 과학자로 성장하는 데 필수적입니다. 데이터 과학은 현재 시나리오에서 요구하는 것보다 더 많은 기술을 보유하는 것의 중요성을 강조하는 놀라운 속도로 황금 표준이 변화하는 산업입니다.

호기심 많은 마음

데이터 과학은 상당히 오래된 분야이지만 때때로 발견이 이루어집니다. 오래된 문제를 해결하기 위해 새로운 방법을 찾고자 하는 열망이 그 이유입니다. 데이터 과학자는 항상 탐구심을 유지하여 데이터를 수집, 병합 및 처리하는 새롭고 더 나은 방법을 찾고 더 나은 통찰력을 얻을 수 있는 도구를 찾아야 합니다. 데이터에는 호기심 많은 사람에게만 고백할 비밀이 있기 때문에 이상적인 데이터 과학자는 호기심을 멈추지 않아야 합니다. 진정한 데이터 과학자는 데이터가 자신의 편향을 어떻게 증명하는지 보려고 하는 것이 아니라 그 안에 숨겨진 진실을 찾는 것입니다.

데이터를 사용하면 상황이 매우 어려워질 수 있으며 호기심만이 결과를 이끌어낼 수 있습니다. 이것이 바로 호기심이 데이터 과학자의 가장 필수적인 자질 중 하나인 이유입니다.

결과 지향적인 성격

데이터 분석은 프로세스 자체보다 결과에 더 가깝습니다. 예상 결과가 있는 한 데이터와 함께 결과를 가져오는 방법은 중요하지 않습니다. 데이터 과학자는 때때로 특정 문제를 해결하기 위해 둘 이상의 경로를 택해야 할 수도 있습니다. 작은 장애물로 인해 지체되는 것은 데이터 과학자에게 좋은 품질이 아닙니다. 데이터를 결과로 변환하려는 강한 결의가 스스로의 원동력이 되는 경우 결과 중심적인 태도를 취하는 데 도움이 됩니다. 일반적으로 데이터 과학자는 한 문제에서 다른 문제로 이동하면서 동시에 다른 작업을 수행하는 사람들입니다. 결과 외에는 그 무엇도 그들의 노력을 막을 수 없습니다.

창의력

창의성은 이 목록에서 이상한 것처럼 보일 수 있습니다. 사실 데이터 과학자에게 가장 중요한 자질 중 하나입니다. 창의적인 사람들은 실수를 두려워하지 않고 새로운 것을 실험하고 새로운 영역을 탐험합니다. 그들은 실패에서 기회를 찾고 쉽게 방향을 바꿀 수 있습니다. 이 모든 것은 데이터 과학에 필수적입니다.

우리는 흔히 사람을 좌뇌형과 우뇌형으로 분류합니다. 빅 데이터와 같은 하드 과학은 창의성과 거의 관련이 없으며 이는 큰 실수입니다. 데이터 과학자는 두 범주 사이에 있으며 데이터를 처리하는 더 새로운 접근 방식과 방법을 찾기 위해 창의력을 발휘해야 합니다. 통계와 데이터베이스는 데이터 과학의 전부가 아니라 의사 결정자에게 유용한 분석의 최종 결과를 만드는 스토리텔링입니다.

물론 창의성만으로는 데이터 과학자가 될 수 없습니다. 사용하기 쉽고 매력적이며 눈길을 사로잡는 보고서를 준비할 수 있는 사람이 데이터 과학자의 역할에 항상 가장 적합한 것은 아닙니다. 데이터 과학자는 창의적인 문제 해결사라고 할 수 있습니다.

데이터베이스의 이해

정형 데이터, 비정형 데이터 또는 두 가지 모두로 작업하는지 여부에 관계없이 훌륭한 데이터 과학자는 데이터베이스 작업에 대한 기본적인 아이디어가 있어야 합니다. 게다가, 컬럼 및 관계형 데이터베이스에 대한 기본적인 이해는 데이터 과학자의 작업을 더 쉽게 만드는 데 큰 도움이 될 수 있습니다. 많은 기업 창고는 여전히 전통적인 관계형 데이터베이스를 사용합니다. 작업을 실행할 기술 인력이 있지만 데이터 과학자도 이러한 데이터베이스 설정에 참여해야 합니다. 비정형 데이터를 처리할 수 있는 데이터베이스 인프라를 개발하는 노하우는 꼭대기에 있는 체리와 같습니다.

훌륭한 의사 소통 능력

데이터 과학자는 대부분 기술, 분석 및 비즈니스 담당자와 동시에 작업합니다. S(그)는 종종 관련된 모든 당사자의 번역가 역할을 합니다. 기술 및 비즈니스 전문 용어를 동시에 처리하고 강력한 의사 소통 기술이 필요한 사람과 무엇을 사용해야 하는지 알고 있습니다. 분석 결과는 일반적으로 적어도 데이터 과학자가 아닌 사람에게는 그다지 좋지 않습니다. 통찰력과 추세는 숫자 안에 갇혀 있으며 비즈니스 팀과 이해 관계자가 이해하는 방식으로 해석되고 전달되어야 합니다. 훌륭한 데이터 과학자는 분석의 복잡한 결과를 스토리텔링, 은유 및 시각적 커뮤니케이션 수단을 사용하여 다양한 배경을 가진 사람들이 이해할 수 있는 더 간단한 형식으로 변환할 수 있어야 합니다.

데이터에 대한 굶주림

훌륭한 데이터 과학자는 항상 더 많은 데이터에 굶주려 있습니다. 더 많은 데이터가 항상 더 나은 데이터이기 때문에 데이터 탐색은 정해진 목표가 없는 것입니다. 데이터 과학자는 계속해서 더 많은 데이터 소스, 더 나은 데이터 획득 방법, 데이터 처리를 위한 혁신적인 방법을 찾아야 합니다. 데이터가 분석을 위한 연료이기 때문에 데이터 과학자가 더 많은 데이터를 획득하려는 추진력이 있어야 합니다.