데이터 사이언티스트란 무엇입니까?

데이터 사이언티스트는 데이터를 관리하고 분석하여 비즈니스 문제를 해결하기 위한 다양한 기술 및 도메인 기반 기술을 필요로 하는 직업입니다. 일부 수학자, 일부 비즈니스 분석가 및 일부 컴퓨터 과학자가 포함됩니다. 훌륭한 데이터 사이언티스트는 데이터의 추세와 패턴을 알아볼 수 있으며 데이터를 사용하여 유용하고 실행 가능한 결과를 생성하는 방법을 알고 있습니다. 데이터 사이언티스트는 현대 비즈니스의 최전선에서 업무 방식을 변화시킵니다.

데이터 사이언티스트 기술 다이어그램

데이터 사이언티스트의 역사

2001년 컴퓨터 과학자인 William S. Cleveland는 '데이터 과학: 통계의 기술 영역 확장을 위한 실행 계획'이라는 기사를 썼습니다. 이 기사에서는 응용 통계학 자의 학문으로서 데이터 사이언스를 소개했습니다. 그것은 불과 20년 전이었고 기술과 비즈니스 세계는 그 이후로 빠르게 이동했습니다.

이것은 상대적으로 새로운 경력 경로이기 때문에 현재 데이터 사이언티스트는 다양한 배경과 전문성을 가지고 있습니다. 많은 사람들이 통계 학자, 수학자 또는 데이터 분석가로 경력을 시작합니다. 그러나 컴퓨터, 인공 지능(AI) 및 데이터 학습 도구에 대한 액세스가 보편화됨에 따라 해당 역할도 진화했습니다. 데이터 사이언티스트는 더 이상 IT 부서에만 국한되지 않습니다. 그들은 전체 비즈니스의 필수적인 부분이 되었습니다. 비즈니스에 대한 확장 및 중추적 영향으로 인해 데이터 사이언스의 역할을 수행하려면 데이터 통찰력을 비즈니스 전략으로 전환할 수 있는 논리적이고 혁신적인 사고를 가진 사람이 필요합니다.

데이터 사이언티스트에게 필요한 자격은 무엇입니까?

지난 10년 동안 고등 교육 기관에서는 데이터 사이언티스트를 위한 특정 과정을 개발했습니다. 업계에서 일하기를 원하는 사람들은 많은 대학에서 데이터 사이언스 학사 또는 석사 학위를 취득할 수 있습니다.

데이터 사이언티스트가 수강하는 과정은 일반적으로 통계 모델링, 데이터 관리, 데이터 시각화, 머신 러닝, 소프트웨어 엔지니어링, 데이터 윤리, 연구 설계 및 사용자 경험입니다. SQL, Python, Perl 및 R과 같은 다양한 프로그래밍 언어를 배울 수 있으며 Hadoop, Pig, Spark, Hive 및 MapReduce에 익숙해질 것입니다.

그러나 더 많은 오픈 소스 소프트웨어 사용이 가능해지고 상용화된 데이터 사이언스 도구가 늘어나면서 오늘날 사람들이 배우는 내용은 곧 쓸모없게 될 수 있습니다. 따라서 데이터 사이언티스트는 민첩해야 하며 업계 내에서 새로운 기술과 기술을 끊임없이 배워야 합니다.

당신은 어떤 데이터 사이언스 슈퍼 히어로인가요?
당신은 어떤 데이터 사이언스 슈퍼 히어로인가요?
이 전자 책을 다운로드하여 데이터 사이언티스트로서 차별화되는 데 필요한 여섯 가지 주요 기술을 알아보십시오.

데이터 사이언티스트는 학위 이상이 필요합니다

우수한 데이터 사이언티스트는 호기심이 많아야 하며 항상 새로운 정보와 비즈니스 과제에 대한 새로운 사고 방식을 찾아야 합니다. 강한 직관력과 증거를 찾는 습관은 데이터 사이언티스트에게 있어 훌륭한 특성입니다. 그들은 답이 없는 곳에서 답을 찾을 수 있을 만큼 창의적이어야 하며 지속적으로 통찰력과 결과를 찾아야 합니다.

데이터 사이언티스트는 또한 도메인 비즈니스 지식에 대한 깊은 이해가 있어야 합니다. 데이터와 프로그래밍을 아는 것과 이러한 통찰력에서 비즈니스 전략을 만드는 통찰력을 갖는 것은 또 다른 일입니다. 비즈니스에 대한 위험과 기회를 파악하고 데이터를 사용하여 비즈니스 성장을 위한 전략을 제공할 수 있어야 합니다. 사람들이 특정한 날씨 조건에서 해당 상품을 더 많이 구매한다는 것을 아는 것은 한 가지 예입니다. 그러나 기업이 이러한 유형의 정보를 어떻게 활용할 수 있을까요? 데이터 사이언티스트의 역할은 비즈니스를 지속적으로 새로운 차원으로 끌어 올리는 이와 같은 질문을 파악하고 답하는 것입니다.

훌륭한 데이터 사이언티스트에게는 뛰어난 의사 소통 기술도 필요합니다. 이해 관계자 및 관리자에게 다시 보고하고 분석 결과를 명확하게 설명할 수 있어야 합니다. 데이터가 불완전한 위치와 이를 해결하는 데 필요한 사항을 설명할 수 있어야 합니다. 그 결과를 바탕으로 최선의 행동 방침을 설득하고 설득합니다. 새로운 프로그램과 기술이 바뀔 것이지만 비판적으로 생각할 수 있고 양적, 영역 별 기술이 항상 요구됩니다.

데이터 사이언티스트는 무엇을 합니까?

데이터 사이언티스트는 데이터를 수집하고 가설과 추론을 개발한 다음 머신 러닝을 사용하여 해당 데이터 내의 패턴, 관계 및 추세를 감지합니다. 여기에는 주어진 날짜에 대해 다음을 포함할 수 있습니다:

  • 데이터 세트 분석
  • 데이터 정리
  • 대시 보드 및 보고서 작성
  • 데이터 시각화
  • 통계적 추론 생성
  • 통계적 학습 모델 개발
  • 복잡한 예측 모델 생성
  • 통계 도구 사용
  • 분석 결과를 이해 관계자에게 전달
  • 설득력있는 의사 결정자

대기업은 매일 최대 40 페타 바이트의 데이터를 생성할 수 있습니다. 이 기업의 데이터 사이언티스트들은 이런 데이터를 사용하여 사람들이 특정 품목을 언제 어디서 구매 하는지를 포함하여 다양한 결과를 예측합니다. 이를 통해 최대 판매를 위해 이벤트 및 판매를 계획하고 가격을 책정하여 최대 수익을 창출하면서도 가장 많은 양의 주식 이동이 가능하게 할 수 있습니다.

데이터 사이언티스트는 일반적으로 팀으로 작업하며 관련 정보를 얻기 위해 빅 데이터를 마이닝합니다. 또한 수집해야 하는 데이터 유형, 분석 방법 및 해석 결과에 대해 경영진에게 조언할 수 있습니다. 2017년 연구에 따르면 데이터 사이언티스트의 시간 중 80 %가 데이터 관리에 사용됩니다. 데이터를 찾고, 청소하고 정리합니다. 이로 인해 작업 시간의 20 %에서만이 실제로 분석을 수행할 수 있습니다. 하지만 이마저도 변화하고 있습니다. 자동 머신 러닝과 딥러닝의 등장으로 데이터 사이언티스트는 이러한 도구들이 더욱 자동화되고 데이터 정리 및 조직의 많은 부분을 차지하게 되어 데이터 사이언티스트는 분석에 더 많은 시간을 할애할 수 있습니다.

데이터 사이언티스트의 역할이 중요한 이유는 무엇입니까?

비즈니스에서 데이터 사이언티스트는 매우 중요합니다. 그들은 수백만, 심지어 수십억 개의 데이터 포인트를 가져 와서 중요한 정보로 변환하여 조직이 비즈니스를 저장하거나 성장시킬 수 있는 예측을 할 수 있게 합니다. 산업별 데이터 사이언티스트의 역할에 대한 몇 가지 예는 다음과 같습니다:

마케팅 최적화

데이터 사이언티스트는 마케팅의 중요한 부분입니다. 예를 들어 데이터 사이언티스트는 고객이 이탈 위험이 높다는 사실을 비즈니스에 알리는 일련의 트리거를 생성할 수 있습니다. . 마케팅에서 새로운 고객을 찾는 비용이 기존 고객을 유지하는 비용보다 훨씬 크다는 것은 잘 알려져 있습니다. 데이터 사이언티스트가 설정한 트리거를 통해 회사는 개입하여 변경하거나 고객과 대화하여 유지하도록 할 수 있습니다.

의료

이것은 데이터 사이언티스트들에게 엄청난 기회가 있는 거대한 분야입니다. 최적의 수준에서 명부 및 직원 관리부터 의사의 지시를 따르지 않을 위험이 높은 환자 식별에 이르기까지 데이터 사이언티스트는 비즈니스 관행과 건강 결과를 개선할 수 있는 수천 가지 기회를 찾을 수 있습니다.

사기 감지

보험 및 은행 산업은 데이터 사이언티스트를 사용하여 사기 위험을 식별함으로써 매년 수십억 달러를 절약하고 있습니다. 예를 들어 고객이 대출을 신청하면 고객에 대한 여러 데이터 포인트가 수집됩니다. 이 정보를 처리하여 이전 사기 사건에 대한 알려진 정보와 비교합니다. 거의 즉시 시스템은 이 사람이 위험한 사람인지를 판단할 수 있습니다.

데이터 사이언티스트가 되는 방법

논리적인 두뇌가 있고, 숫자 다루기를 좋아하고, 컴퓨터 작업을 즐기며, 비즈니스에 대한 예리한 이해가 있다면 데이터 사이언티스트로서의 역할이 꿈꾸던 직업일 수 있습니다.

첫 번째 단계는 컴퓨터 과학, 통계 또는 관련 분야에서 학사 학위를 취득하는 것입니다. 이 학위를 통해 다음과 같은 기술을 갖출 수 있습니다:

  • 수학, 특히 통계
  • 코딩
  • 데이터베이스, 데이터 레이크 및 분산 스토리지
  • 데이터 정리 기법
  • 데이터 시각화보고 기술

학사 학위는 입문 수준의 지식을 제공하지만 해당 분야가 성장함에 따라 더 많은 자격이나 전문화가 필요합니다. 데이터 또는 관련 분야의 석사 학위를 고려하고 관심있는 특정 비즈니스 도메인으로 드릴 다운을 시작하십시오.

자격을 취득하면 관심 분야에서 경험을 쌓는 것이 다음 단계입니다. 의료, 마케팅, 정부 또는 기업은 모두 전문화에 대한 탁월한 전망을 제공합니다. 데이터 사이언티스트의 기술을 가르칠 수는 있지만 데이터와 실제 영향 간의 관계를 이해하려면 비즈니스에 소요되는 경험과 시간이 필요합니다.

데이터 사이언스 소프트웨어
TIBCO Data Science 사용해보기-무료 평가판
TIBCO Data Science를 사용하여 조직 전체에서 머신 러닝을 민주화하고 협업하며 운영합니다.

데이터 사이언티스트가 직면한 과제

부분적으로 새로운 산업이라는 사실 때문에 데이터 사이언티스트들은 몇 가지 도전에 직면하고 있습니다. 남성이 지배하는 산업이며 많은 STEM(과학, 기술, 공학 및 수학) 경력과 마찬가지로 여성도 경력을 시작하고 유지하는 데 추가적인 장애물에 직면하는 경우가 있습니다. 2019년에는 데이터 사이언티스트의 18 %만이 여성이었습니다. 이러한 다양성 부족은 현장에서 문제를 일으키기 시작했습니다. 알고리즘은 인간에 의해 만들어지며 편견에 취약합니다. 예를 들어, 은행 업계에서 솔로 여성은 대출을 받는 데 부정적인 영향을 미칩니다. 그러나 데이터에 따르면 대출금을 갚는 데 여성이 남성보다 낫습니다. 은행은 최고의 고객을 놓치고 여성은 재정적 안정과 독립성을 놓칠 수 있습니다. 다양한 인력을 보유하면 이러한 오류와 편견을 퇴치하는 데 도움이 됩니다.

새로운 산업이기 때문에 일관된 어휘와 실천 기준으로 어려움을 겪고 있습니다. 표준은 이해 관계자, 데이터 사이언티스트, 입법자 간의 합의로 이루어져야 할 것으로 예상되지만 아직까지 형성된 것은 없습니다.

쉽게 해석할 수 있는 설명 가능한 AI에 대한 요구도 있습니다. 생각하는 리더는 예측이 허공에서 나온 수치가 아니라 머신 러닝 모델의 논리를 추적하고 쉽게 설명할 수 있어야 한다고 생각합니다.

데이터 사이언티스트를 위한 현재 전망

대부분의 STEM 경력과 마찬가지로 데이터 사이언티스트는 높은 평가를 받고있는 직원입니다. 현재 적절한 분석 기술을 갖춘 자격 있는 데이터 사이언티스트가 부족합니다. 평균보다 높은 급여 기대치, 빠르게 성장하는 시장 및 그 가치에 대한 이해가 높아짐에 따라 데이터 사이언티스트의 고용 옵션은 탁월합니다. 2018년에는 안전한 성장에 필요한 151,000 명의 데이터 사이언티스트가 부족했습니다.

특히 소외 계층의 사람들이 현장에 들어가도록 장려되고 있습니다. 일부 대학은 이러한 소외된 그룹이 데이터 과학 프로그램에 참여하도록 인센티브를 제공하고 기업은 편향되지 않은 결과를 위해 다양성이 필요하다는 사실을 점점 더 인식하고 있기 때문에 매력적이고 안정적인 고용 옵션입니다.