Search
Duplicate

직무인터뷰 #5 : 김선우님

HR 도메인 자연어 처리 전문가, 김선우님

'HR-Technology 리더' 사람인은 시장을 리드하기 위한 빅데이터, AI기술 역량을 집중하고자 AI LAB 을 운영하고 있습니다. 이번에는 AI LAB에서 자연어처리(NLP) AI 기술을 담당하는 김선우님을 만나봤어요. 선우님은 인터뷰 당일에도 「2021 한국컴퓨터종합학술대회(KCC2021)」에서 발표를 하고 오셨더라구요. 연달아서 저희와의 인터뷰도 진행해주셨습니다!
기회를 창출할 수 있는 AI LAB
안녕하세요, AI LAB에서 자연어를 다루고 있는 김선우입니다. HR 도메인 분야에 걸맞게 비정형 데이터를 추출하고 정제하고 있어요. 비정형 데이터란 정해진 규칙이 없어서 값의 의미를 쉽게 파악하기 어려운 데이터로 우리가 흔히 사용하는 텍스트, 음성, 영상과 같은 데이터가 바로 비정형 데이터에 속해요. 이러한 비정형 데이터를 추출하고 정제하여 저는 사람인 공고와 이력서에 대한 분석, 메세지 필터링 등 다방면으로 기술을 활용하죠.
AI LAB은 다양한 전문가들이 모여서 협업하고 인사이트를 도출하며, 이를 서비스에 녹이고 있어요. 각자 전문적인 분야가 있어서 서로를 존중합니다. 저는 언어공학 분야를 전공했고, 자연어처리에 경험이 있어요. 그 밖에 언어학 박사도 계시고, 수학과 통계학 관련 전문적인 역량과 경험을 가진 분들도 계셔서 서로 시너지를 만들어내고 있습니다.
AI LAB 실원들은 스스로 얼마든지 서비스나 기술을 제안할 수 있어요. 스스로 가진 역량을 십분 활용하여 이를 기회로 창출할 수 있다는 게 굉장한 매력인 부서죠. 전문성을 인정 받아 주도적으로 다양한 도전을 시도할 수 있어요.
기술이 지닌 기반과 목적성을 이해해야 합니다.
기술을 활용하고자 할 때 무작정 최신 트렌드의 기술을 활용하는 것이 항상 옳은 것은 아니라고 생각해요. 해당 기술이 어떻게 생겨났고, 무엇을 해결하기 위해 등장했는지 이해해야 합니다. 다양한 기술 중에서 주어진 과업을 해결하기 위해 환경에 걸맞는 기술을 사용해야 하죠. 항상 최첨단 기술을 사용하는 게 올바른 방향성이 될 수는 없다고 생각해요.
ML/DL의 경우, 요즘은 Tensorflow, Torch, Scikit-learn처럼 다양한 오픈소스 라이브러리가 존재하여 모델링 자체에 대한 난이도는 낮아졌어요. 하지만 모델에 대한 이해도가 낮다면 아무런 효과 없습니다. 각 모델 별 특징을 잘 알고, 과업과 데이터에 적합한 모델을 선정할 수 있어야 합니다.
조건에 걸맞은 인사이트를 도출하기 위해 꾸준히 논문과 다양한 자료를 통해 기술이 가진 목적성과 한계를 파악해야 해요. Kaggle과 같은 곳에서 공개된 데이터들을 바탕으로 실제 모델들을 활용해보면서 경험하는 것도 필요합니다. ML/DL 방면에서는 다양한 경험을 통해 정확한 판단이 가능해질 거라고 생각해요.
당당하게 자랑할 수 있는 HR 서비스를 만들 겁니다.
사람인은 전사적으로도 그렇지만, 특히 AI LAB은 젊은 연령층으로 구성되어 있어요. 그렇다 보니 기업 문화와 조직 문화 또한 지속적으로 성장하고 있다는 것을 피부로 느껴요. 개인적으로 AI LAB은 스타트업에 비견될 정도로 열정과 활기가 넘치기도 해요! 그렇다고 직원에 대한 케어나 지원에 소홀한 것도 아닙니다. 연구/개발 조직 규모도 점점 커지고 있고, 회사에서 서포팅 해주는 영역이 매년 눈에 띄게 늘어나고 있어요. 학회에 참여할 때의 적지 않은 참가 비용이나, ML/DL 모델링을 위한 고가의 GPU 장비도 아낌없이 회사로부터 지원 받으면서 자유롭게 업무를 하고 있습니다.
저는 친구들에게 당당하게 자랑할 수 있는 HR 도메인의 자연어처리 서비스를 만들고 싶어요. 2-3년 전부터 Transformer 등의 모델을 활용한 전이학습이나, 도메인 적용을 위한 소규모 데이터의 증강 및 효율적인 학습 방법 등에 대한 연구가 많이 진행 되고 있잖아요? 이에 대해 관심 갖고 살펴보고 있어요. 하나씩 하나씩 서비스에 녹여낼 겁니다. 사람들이 서비스를 이용할 때 고민 없이 사용하기를 바라며 오늘도 연구/개발하고 있습니다.