HANA : Have A Nice AI

모두를 위한, 하나를 위한 AI

쉽게 읽는 AI/AI의 마음 : 데이터 사이언티스트

데이터 사이언티스트 하고 싶다면, 데이터 사이언티스트 하세요 - 마지막 ③탄

KM-Hana 2023. 9. 10. 02:21

"데이터 사이언티스트 하지 마세요" 반론과 비판 2탄에 이어서,
3탄을 이어서 이야기해 보고자 합니다.

 

"데이터 사이언티스트 하지 마세요"를 요약하자면 다음과 같습니다.

   1. 대부분의 회사에서는 데이터가 없다. 즉 머신러닝만으로 성과를 낼 환경이 부족하다.

      - 로그를 직접 남기거나 백앤드 개발자를 설득해야 하므로 업무의 진행 속도가 느리다.

   2. 신입이나 학부 졸업만으로는 성과 내기 어렵다.

       - 석·박사보다 성과를 내기 어렵기에, 신입을 잘 뽑지 않는다.

       - AI 프로젝트에서 모델링은 5% 정도다.. (그에 비해, 요즘 학부생들이 머신러닝에만 관심이 높다)

   3. 백앤드로 시작해야 한다.

       - 백앤드가 수요가 더 높고 연봉도 높다.

       - 백앤드에서 데이터 엔지니어링으로 가기 쉬우며, 백앤드에서 머신러닝으로 가기 쉽다.

 

※ 반론과 비판 - "데이터 사이언티스트 하지 마세요"의 1과 2탄 요약

더보기

※ 반론과 비판 - "데이터 사이언티스트 하지마세요" ②탄

   1탄에서는 : 주제 1. "데이터가 없다. 머신러닝만으로는 성과를 내기 어렵다"에 대해서 반박했습니다.

    ○ 반박 1.1 "데이터 사이언티스트는 머신러닝만으로 성과를 내지 않는다."

    ○ 반박 1.2 "데이터가 부족해도 성과를 낼 수 있다"

     을 들며, 데이터 부족이 데이터 사이언티스트를 포기할 이유가 될 수 없음을 이야기했습니다.

https://kmhana.tistory.com/44

 

반론과 비판 : "데이터 사이언티스트 하지 마세요" - ①탄

데이터 사이언티스트이란 직무에 관심 있던 취준생이라면 연관 검색어로 "데이터 사이언티스트 하지 마세요"를 봤을 수 있을 것입니다. 더보기 ※ "데이터 사이언티스트 하지 마세요" : 관련 영

kmhana.tistory.com

 

   2탄에서는 : 주제 2. "신입이나 학부생은 성과를 내기 어렵다"에 대해서 반박했습니다.

    ○ 반박 2.1 "하지 말아야 할 실수 -  데이터 사이언티스트의 기본을 지키자"

       - 주어진 문제를 AI 모델로 먼저 해결하려는 실수

       - 잘 알지 못하는 최신 딥러닝 모델을 바로 적용하는 실수

       - 과거의 성공한 경험에 매몰되는 실수.

     ○ 반박 2.2 "데이터 사이언티스트 성과의 해답은 데이터에 있다. - 데이터를 사랑해야 한다." 

     을 들며, 신입이나 학부생이 하지 말아야 하는 실수와 

https://kmhana.tistory.com/45

 

반론과 비판 : "데이터 사이언티스트 하지 마세요" - ②탄

"데이터 사이언티스트 하지 마세요" 반론과 비판 1탄에 이어서, 2탄을 이어서 이야기해보고자 합니다. "데이터 사이언티스트 하지 마세요"를 요약하자면 다음과 같습니다. 1. 대부분의 회사에서

kmhana.tistory.com

 

 

  마지막 3탄에서는

    ○ 주제 3. "데이터 사이언티스트가 되기 위해서는 백앤드로 시작해야 한다." 에 대한 반박과 반론

    ○ 데이터 사이언티스트(Data Scientist)를 하고 싶다면, 데이터 사이언티스트를 하세요

를 이야기하고자 합니다.


주제 3. "데이터 사이언티스트가 되기 위해서는 백앤드로 시작해야한다."

  데이터 사이언티스트가 되기 위해서 백엔드로 시작하라고 합니다. 

  그 근거로 백앤드가 더 많은 수요가 있고 연봉도 더 높다고 말하고 있습니다.

 

  그럴 수 있습니다. 백앤드가 더 수요가 높을 수 있고, 연봉도 더 높을 수 있습니다.

  하지만, 매우 틀렸습니다. 

    - 백엔드도 하나의 큰 전문 분야이며, 데이터와는 전혀 다른 업무일 수 있습니다.

    - 그나마 유사한 데이터 엔지니어(Data Engineer)도 데이터 과학자와는 목적과 방향성이 다릅니다.

    - 백엔드도 하나의 큰 전문 분야이기 때문에, 백엔드에서 데이터 과학자로 전환하는 것이 쉽지 않습니다.

  데이터 사이언티스트가 되고 싶다면, 데이터 사이언티스트를 해야 합니다.


반박 3.1 "백엔드도 매우 큰 하나의 전문 분야이다."

  데이터 사이언티스트(AI 전문가)가 되고 싶다면, 데이터 사이언티스트(AI 전문가, 데사)가 되기 위한 준비를 해야 합니다.

  백엔드가 되고 싶다면, 백엔드가 되기 위한 준비를 해야 합니다.

  

  백엔드라는 분야는 매우 광범위합니다. 서버관리나 API 설계, 데이터베이스 관리 등 다양한 분야를 포괄합니다.

  ○ 백엔드 개발자 전부가 데이터 사이언티스트와 밀접하지 않습니다.

        - "데이터 사이언티스트 하지 마세요"를 보고 단순히 "백앤드하면 데사가 될 수 있구나"로 오해하지 않길 바랍니다.

        - 백엔드 중 AI 엔지니어(Data 엔지니어)로 불리는 직업이 데이터 사이언티스트(AI 전문가)와 밀접합니다.

  ○ AI Engineer(Data Engineer)의 주요 업무는

        - 데이터 인프라를 효과적으로 구축하고 저장 및 수집하는 역할을 배울 수 있습니다. 

        - 모델을 배포하고 모니터링하는 시스템을 구축합니다.

       해당 업무를 배우는 과정에서 데이터와 모델에 대한 이해를 키울 수 있습니다.

 

  막연하게 데이터 과학자가 되고 싶어서, 백앤드로 우회하게 되면 두 가지 문제가 발생할 수 있습니다.

    1. 백엔드와  Data Scientist의 역할과 목적이 달라 시각(관점)이 다릅니다.

        - 백앤드는 너무 다양하고 달라 그나마 Data Scientist(AI 전문가)와 밀접한 Data Engineer로 한정해 설명하겠습니다.

        - Data Scientist와 밀접한 Data Engineer도 명확히는 업무의 목적과 역할이 달라 관점이 다릅니다.

Data 직업별 역할 - https://www.datacaptains.com/blog/guide-to-data-roles

        - 용어는 회사마다 다를 수 있습니다. (이게 취업하는 분들에게 더 큰 혼란을 줍니다.)

        - (대체로) Data Scientist는 모델과 관련된 개발과 데이터 분석 등을 진행합니다.

           : 모델이 얼마나 문제를 잘 해결할지나 목표성능에 도달할지를 고민합니다.

           : 그림에서 Data Scientist와 Data Analysts를 합친 범위와 유사합니다.

        - (대체로) Data Engineer는 데이터 파이프라인과 모델 배포 등을 담당합니다.

           : 데이터 파이프라인과 모델 배포와 관련된 인프라와 시스템을 어떻게 효율적으로 구축할지 고민합니다.

           : 그림에서 Data Engineer와 ML Engineer를 합친 범위와 유사합니다.

  ○ MLOps을 저는 과수원을 비유하곤 합니다.

        - Data Scientist는 어떻게 과수원의 나무를 키워내고 맛있는 열매를 맺을지를 고민합니다.

           : 서비스가 주어진 목표(성과)를 어떻게 Model로 해결하고, 고객에게 어필할지 고민합니다.

        - Data Engineer는 어떻게 효율적으로 과수원의 땅을 개간하고, 열매를 따서 납품할지를 고민합니다.

           : 서비스에서 모델을 어떻게 효율적으로 운용하고 고객에게 빠르게(무사히) 전달할지 고민합니다.

  ○ 데이터 엔지니어 경험이 데이터 사이언티스트가 되기 위한 좋은 경험이 될 수 있으나 (반대도 가능합니다.)

        - Data Scientist를 하고 싶으신 분이 Data Engineer로 취업하게 될 경우, 생각했던 업무와 달라 자칫 길을 잃게 될 수 있습니다.

        - 적성이 맞지 않을 수 있고, 컴퓨터공학 베이스가 없으신 분은 더 방황할 수 있고 자신의 강점을 살리지 못할 수 있습니다.

        - 마찬가지로, Data Engineer를 하고 싶은 분이 Data Scientist가 되신다면, 자신의 강점을 살리지 못할 수도 있습니다.

 

    2. 백엔드도 하나의 큰 전문 분야입니다. 

  1인분을 하기 위해서는 많은 시간과 노력이 필요합니다.

  ○ AI Engineer도 하나의 큰 분야이기에, 백앤드 업무에 익숙해지는데 많은 시간과 노력이 필요합니다.

        - 한 분야의 전문가가 되기는 굉장히 어렵습니다. (1만 시간의 법칙 - 3시간이면 10년이 걸리는 시간)

  ○ Data Engineer와 Data Scientist가 메인으로 다루는 도구가 다르고, 역할이 다릅니다.

        - Data Engineer에서 Data Scientist로 변경하시기 위해서는, 새롭게 도구와 문제를 해결하는 관점을 바꾸셔야 합니다.

        - 당연히 기존의 백엔드 업무(예를 들어 데이터 파이프라인 구축이나 유지관리 등)를 해결하시면서 준비하셔야 합니다.

Data Engineer vs Data Scientist Tool

 

     물론, 백앤드와 데이터 사이언티스트를 모두 통달하실 수도 있을 것입니다. (풀 스택 데이터 사이언티스트)

        - 불가능은 없지만, 뛰어난 재능(천재성)과 밀도 있는 노력과 더불어 경험도 필요하기에 많은 시간이 필요합니다.

 

  ○ Data Engineer를 하시는 동안, 데이터 인프라도 매우 빠르게 발전하고 있고 그 추세를 따라가는 것도 많은 노력이 듭니다.

  ○ Data Engineer의 트렌드를 따라가는 동안, AI 모델 역시 매우 빠른 속도로 달라지고 발전할것입니다.

      : 즉, 점점 자신이 처음 데이터 사이언티스트를 준비했을 때와는 달라져 있을 수도 있습니다.

  ○ AI는 시시각각 발전하고 일 년에 수백 수천 편의 논문이 쏟아지고 있으며, 데이터 사이언티스트는 지속적으로 트랜드를 알아야 합니다.

        - 잠시 손을 놓고 있으면, 어느샌가 AI 최신동향과 동떨어지게 됩니다.

        - 2017년 Transformer가 처음 등장했고, GPT-1(2018년), GPT-2(2019년), GPT-3(2020년)가 1년에 거쳐 발전했습니다.

        - 연구에서의 개발과 상용화는 매우 큰 차이가 있는데, GPT-4가 적용된 ChatGPT(2022년)가 현재 훌륭하게 상용화했습니다.

  ○ 저는 데이터 사이언티스트(AI 모델링) 업무를 하고 있지만, 현재 AI 트렌드를 따라가는 것이 쉽지 않습니다.

        - 때론 벅찹니다.

  ○ 신입에게는 AI 트렌드를 얼마나 잘 알고 있는지를 묻지 않습니다.

        - 하지만, 당신이 경력자고 연차가 있다면, 이야기는 다를 수 있습니다.

 

  ○ 하고 싶었던 일을 두고 우회의 길을 선택한다면

   점점 처음 자신이 하고 싶었던 일을

    1.  잊게 될 수 있습니다.

    2. 멀어질 수 있습니다.

 


반박 3.2 "도망쳐서 도착한 곳에 낙원은 없다."

  유명한 만화에서 나온 명언입니다.

 

  Data Scientist의 목표를 두고 우회의 길을 선택했는데, 그 선택이 적성에 맞아 만족한다면 너무나 다행입니다.

  Data Engineer나 백엔드 모두 훌륭한 일입니다.

 

    ○ 하지만 진짜 자신이 하고 싶은 일이 "데이터 사이언티스트"나 "AI 전문가"라면 

          - "데이터 사이언티스트"나 "AI 전문가"를 위한 준비와 도전을 해보길 바랍니다.

 

  그 누구도 자기의 삶을 대신 살아주지 않습니다.
꿈이었다면 그걸 지키세요.
누군가 당신이 할 수 없다고 한다면, 듣지 마세요.
그게 가족일지라도요

 

    ○ 누군가는 데이터 사이언티스트(AI 전문가)가 되고 싶다면, 그 길이 어려우니 다른 길(백엔드)로 가라고 합니다.

          - 하지만, 그 말은 한 사람은 당신의 인생을 대신 살아주지 않습니다.

          - 어쩌면 자신이 편하게 모델링 할 수 있는 환경을 가지고 싶어, 자기의 귀찮은 업무를 대신할 사람이 필요했을지도 모르죠.

          ※ "데이터 사이언티스트 하지 마세요" 관련 영상 : 

더보기

※ "데이터 사이언티스트 하지 마세요" :
   관련 영상 : https://www.youtube.com/watch?v=8mjeJpHtLVQ 

 

도망쳐서 도착한 곳에 낙원은 없습니다.

새는 알에서 나오기 위해 투쟁합니다.
새에게 있어 알은 자신의 세계입니다.
태어나려는 자는 한 세계를 깨뜨려야만 합니다.


번외 "대학원으로 도망가지 마세요"

"도망쳐서 도착한 곳에 낙원은 없다."에서 말씀드린 내용과 관련되어서 한 가지 더 말씀드리고자 합니다.

  ○ 데이터 사이언티스트를 하기 위해서 많은 분이 대학원에 가라고 이야기합니다.

        - 저 역시 대학원 진학이 데이터 사이언티스트의 꿈을 이어갈 수 있는 하나의 큰 밑거름이 되었습니다.

        - 하지만, 쉽게 대학원을 추천해 드리기가 어려웠습니다.

        - 열악한 환경과 배우기 어려운 조건 등.. 대학원 생활은 매우 고되었습니다.

  ○ 데이터 사이언티스트가 되겠다는 목표가 없었다면 대학원 생활을 버티기 어려웠을 겁니다.

        - 대학원은 취업이 안 되어서 도망간 피난처가 아니었고

        - 대학원은 데이터 사이언티스트가 되기 위해 도망간 것이 아니었습니다.

        - 대학원은 데이터 사이언티스트가 되기 위한 과정이었습니다.

  ○ 대학원을 만약 진학하신다면, 목표를 이루기 위한 과정이라고 생각하시고, 단단히 마음먹고 가시길 추천해 드립니다.

        - 새는 알에서 나오기 위해 투쟁합니다.

        - 새는 알에 부딪히고 깨지고, 그럼에도 분투하는 과정을 통해 알을 깨고 하늘로 날아갈 수 있으니깐요.

  ○ 대학원이 도망치는 피난처가 아닌, 목표를 위한 밑거름으로 선택하시길 바랍니다.

        - 작은 생각의 차이가 많은 것을 바꾸더라구요

 


마치며 

"데이터 사이언티스트 하지마세요"에 대한 반박과 비판을 시작으로  

"데이터 사이언티스트가 하고 싶다면, 데이터 사이언티스트를 하세요"로

3탄으로 이어진 이야기가 되었네요

 

윗글에서 인용했던 글은 행복을 찾아서(영화)와 데미안(책)에서 나왔습니다.

  - 행복을 찾아서(영화)는 자신의 꿈을 위해 포기하지 않고 노력하는 내용을 담고 있습니다.

  - 데미안(책)은 세상의 편견을 깨고 진짜 자신을 찾는 내용을 담고 있습니다.

 

여러분의 목표(꿈)로 나아가는 한 걸음 한 걸음들을 응원하며,

인용했던 영화와 책을 함께 추천하며 글을 마칩니다.

 

데이터 사이언티스트 하고 싶다면, 데이터 사이언티스트 하세요!