데이터 사이언티스트(AI 전문가) 취업 설명회에서 받았던 첫 질문이었다.
“경영학과인데 파이썬를 공부해야 할까요?”
“또, 저는 좋은 학교가 아닌데, 데이터 분석 관련 일을 할 수 있을까요?”
라는 질문이었다.
데이터 사이언티스트(Data Scientist)라는 직무를 고민하는 사람들이
"학력과 학과"에 대해 고민이 많다는 것을 알게 되었다.
나 또한, 관련된 고민이 많았었다.
내가 처음 AI 직무로 취업할 때 "석사 이상"이라는 필수조건이 심심치 않게 보였기 때문이다.
높은 연차가 아님에도, 면접관으로 참여하면서 경험하고 배운 점 덕분에,
데이터 사이언티스트가 되고 싶은 분들의 "학력과 학과"에 대한 고민을 답하고자 한다.
나의 답은 다음과 같았다.
"우리는 함께 성장할 수 있는 사람을 뽑는다."
"그렇기에, 당신이 어떤 학과를 다니는지. 어떤 학교에 다니는지는 그다지 중요하지 않다."
"여러분이 얼마나 치열하게 데이터를 고민했는지. 문제를 해결하기 위해 어떤 과정을 거쳤는지가 더 중요하다."
"우리는 당신의 한계를 두고 있지 않는데, 왜 스스로의 한계를 규정하고 있는가?"
지금 와서 생각해보니 위의 답변이 충분하지 못했던 거 같다.
데이터 사이언티스가 되기 위해 필요한 학력과 학과에 대해서, 좀 더 자세히 뜯어보고자 한다.
1장. 데이터 사이언티스트의 "자격 : 학력과 학과일까? 의 구성 내용 :
1. 데이터 사이언티스트는 누구와 일하는가.
1.1) 자신의 한계를 두지 않는 것. 왜 중요할까?
1.2) 한계의 또 다른 이름 : 편견
2. 학력과 학벌의 중요성과 해결책
2.1) 동료와 환경
2.2) 경험
3. 새는 알을 깨고 나온다.
○ 데이터 사이언티스트는 누구와 일하는가.
내가 함께 일하는 동료는 다음과 같다.
첫 번째, 데이터의 숨은 가치를 발견하는데, 필요한 것이 있다면 한계를 두지 않고 다양한 방법을 찾는(배우는) 사람
두 번째, 끊임없이 배우고 변화하는 사람. 즉, 배웠고 배우고 배울 사람.
나 또한, 그런 사람이 되고자 분투한다.
데이터 속에 숨은 가치를 발견하기 위해선 다양한 것이 필요하다.
- 모델에 대한 지식이나 수학(통계)
- 프로그래밍 언어
- 데이터 처리 기술
- 심지어 시스템(백그라운드) 기술이 필요할 수도 있다.
※ "이걸 다 할 수 있어?" 라고 반문할 수 있다. 나 역시 지금도 고민하고 있지만, 나의 해결책 중의 하나는 Chapter 2에서 나온다.
이 모든 것을 어느정도 알아야하며, 어느것도 쉽게 포기해선 안 된다.
○ 자신의 한계를 두지 않는 것. 왜 중요할까?
학과와 학력에 관해서 이야기하다가
왜 한계를 이야기하는지 궁금한 분들도 있을 거 같다.
결론부터 말하면, 데이터 사이언티스트에게 중요한 경험은 학력과 학벌이 아니기 때문이다.
데이터를 위해서라면, 무엇이든지 할 수 있는 사람을 원한다.
- AI. 머신러닝. 딥러닝. 통계.
- 컴퓨터 언어. 데이터 처리 기술.
모든 도구를 동원하여, 데이터 속의 숨겨진 가치를 뽑아내어야 한다.
- 컴퓨터 공학이라고 해서, 통계학과를 나왔다고 해서 될 수 없다.
- 컴퓨터와 통계 모두를 알아야 한다.
- 모두를 알아야 조금이나마 데이터를 더 이해할 수 있기 때문이다.
자신의 한계를 두지 않고, 끊임없이 배우고 연구하고 파고들어야 한다.
할 수 없을 거 같다면, 이 직무로 들어오는 것을 다시 한번 생각해 봐야 한다.
○ AI와 적합한 학과.
AI를 배우기 위해서 적합한 학과가 몇 가지 있다.
대표적으로는 통계학과나 컴퓨터공학, 산업공학이 있으며, 최근 AI 학과처럼 특수학과도 많이 생겼다.
수학과나 물리학과, 전기·전자, 기계공학 출신의 데이터 사이언티스트도 많이 양성되고 있다.
위의 학과가 아니라도 좌절하지 마라.
위의 학과에서 공부했다면 안심하지 말자.
자만하여 발전하지 않는 사람은 이 직무에 적합하지 않다.
관련 없는 학과에 있었어도, 끊임없이 노력하고 한계를 뚫은 사람에게 기회가 있기 때문이다.
만약, 당신이 AI 특수 학과에 들어가서 통계와 딥러닝을 모두 배웠고, SQL도 알아서 빅데이터 처리도 배웠다고 가정해 보자.
그렇다면, 다 준비가 되었고 더 이상 배우지 않아도 괜찮을까?
그 답은 딥러닝의 역사를 보면 알 수 있다.
AI의 꽃을 피운 딥러닝은 두 번의 큰 겨울을 맞이했다.
하지만, CNN의 발전과 알파고 이후, 다시 봄이 찾아왔으며,
Tansformer가 꽃을 피웠고, ChatGPT가 AI를 만개(滿開)시켜 빛내고 있다.
현재 AI 발전의 속도는 무섭고, 방대하다.
내가 어제 배운 지식과 기술이 레거시(Legacy)가 될 수도 있다는 뜻이다.
- 그 것이 컴퓨터 언어인 파이썬이. (→ AI에 더 적합한 언어)
- 그 이 지금 뜨거운 GPT가 (→ GPT을 뛰어넘는 새로운 기술)
될 수도 있다.
아니 이미 진행되고 있다.
물론, AI가 시들해질 것이라는 의미는 아니다.
다만, AI를 구축(구성)하는 방법과 모델은 얼마든지 바뀔 수 있다는 뜻이다.
지금의 대세가 미래의 대세가 아닌 사례는 매우 많다.
맨 앞에서 나왔던 취업설명회에서의 질문
“저는 좋은 학교가 아닌데, 데이터 분석 관련 일을 할 수 있을까요?”
“또, 경영학과인데 파이썬를 공부해야 할까요?”
에서 지금까지 흘러왔다.
질문자는 지금 "파이썬"을 이야기했지만.
지금 우리가 모델링을 위해 많이 쓰는 파이썬은 앞으로도 계속 쓰는 프로그래밍 언어가 아닐 수 있다.
그때는 데이터 사이언티스트는 그에 맞는 프로그래밍 언어를 배워야 한다.
- 그렇다면 그때도 질문할 것인가?
- 새로운 언어를 배워야 하냐고?
따옴표" "의 단어를 딥러닝이나 통계라는 단어 등으로 바꿔도 마찬가지이다.
결국, Data Scientist는 끊임없이 배워야 하고.
과거의 내 지식과 새로운 기술 사이를 저울질해야 한다.
※ 반론 : 새로운 AI 기술(언어)을 배울 필요 없다.
반론이 있을 수 있다.
- 기존 기술이나 언어의 끝판왕이 되면 되지 않는가?
일부 맞는 말이지만, 두 가지 문제가 있다.
- 첫 번째, 사용하는 언어(기술)가 적어진다는 건 수요가 적어진다는 의미가 된다. 즉, 살아남기가 쉽지 않다.
끝판왕의 기술자가 아니라면, 기존 기술을 사용할 기회조차 없을 수 있다.
- 두 번째, 새로운 기술을 모르는 사람은 끝판왕의 기술자가 되기 어렵다.
기존의 기술과 새로운 기술 간의 장단점과 특징을 알고 설득할 수 있어야 한다.
결국 하나의 기술의 끝판왕이 되기 위해서는, 새로운 기술이 무엇인지 공부해야 한다.
나의 답변 “우리는 당신의 한계를 두고 있지 않은데, 왜 스스로 자신의 한계를 규정하고 있는가?”의 속뜻은 이러했다.
데이터 사이언티스트가 되기 위해,
자신의 한계를 두지 않는 건 선택사항이 아니라. 필수사항이다.
말은 쉽다는 것을 알고 있다.
나 또한 어렵다.
수많은 좌절을 할 것이고, 고통스러울 때도 있을 것이다.
나는 통계학과에서부터 시작했기에 컴퓨터 언어가 너무 큰 장애물이었고,
큰 대용량의 데이터를 다루어 본 적이 없기에 한계가 많았다.
지금도 부족하고 배운다. 물어보고 다시 알아간다.
실제로 내가 했던 질문이었다.
- 나는 통계를 했는데 컴퓨터 공학도 알아야 해?
- 데이터 분석을 하는데 SQL도 알아야 해?
이 질문들이 스스로 한계를 만들고 나를 가로막는 장애물이었다.
데이터 사이언티스트가 되고 싶은 당신이.
좋지 않은 대학을 다니거나 AI와 전혀 관련 없는 학과를 전공하고 있다면, 그것이 극복해야할 장애물일 수는 있다.
하지만, 결코 넘지 못할 장애물은 아니다.
다음 장에서 "2) 한계의 또 다른 이름 : 편견 - ②"을 이어갑니다.
'쉽게 읽는 AI > AI의 마음 : 데이터 사이언티스트' 카테고리의 다른 글
데이터 사이언티스트 하고 싶다면, 데이터 사이언티스트 하세요 - 마지막 ③탄 (20) | 2023.09.10 |
---|---|
반론과 비판 : "데이터 사이언티스트 하지 마세요" - ②탄 (2) | 2023.08.21 |
반론과 비판 : "데이터 사이언티스트 하지 마세요" - ①탄 (3) | 2023.08.13 |
1) 진짜 데이터 사이언티스트 되는 법 (8) | 2023.07.10 |