통합 검색어 입력폼

당신이 언제 행복한지 알 수 있는 가장 정확한 방법

조회수 2020. 10. 26. 05:00 수정
번역beta Translated by kaka i
번역중 Now in translation
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 다양한 분야의 재밌고 유익한 콘텐츠를 카카오 플랫폼 곳곳에서 발견하고, 공감하고, 공유해보세요.

데이터로 행복을 기록해 온, 스냅 김진영 데이터 사이언티스트

여러분은 언제 가장 행복하다고 느끼시나요? 아마 막연히 퇴근 후나 주말을 꼽는 사람들이 많을 텐데요. 오늘 EO가 소개해드릴 분은 자신의 행복지수를 무려 10년 동안이나 데이터화해 분석했다고 합니다.


이 외에도 다양한 일상 속 데이터를 모으면서 데이터와 함께하는 삶을 살아오셨다는데요. 데이터 과학이 우리 삶의 다양한 문제를 해결할 수 있도록 돕는 수단임을 잘 알고 있었기 때문이겠죠. 마이크로소프트를 거쳐 현재 스냅에서 데이터 과학자로 일하고 있는 김진영 님을 지금 소개합니다.

Q. 자기소개를 부탁드립니다.


안녕하세요, 김진영이라고 합니다. 저는 한국에서 대학을 마치고 미국에서 컴퓨터과학으로 박사 학위를 받았어요. 그 후 마이크로소프트에서 ‘Bing’이라는 검색엔진에 들어가는 각종 알고리즘을 평가하는 문제를 연구했습니다. 2018년에는 ‘스냅’이라는 회사로 자리를 옮겼습니다. 


스냅은 스냅챗 등 소셜미디어 서비스를 제공하는 곳인데요. 회사와 계약이 되어 있는 다양한 퍼블리셔들이 스냅챗에 콘텐츠를 올리거든요. 매일 사용하는 사람이 2억 명 정도 돼요. 그 사람들이 보낸 콘텐츠를 최적화하기 위해서 그 사람들의 다양한 취향을 분석해서 최적의 콘텐츠와 매칭을 해주고, 매칭된 결과를 검색과 추천 시스템을 통해서 제공하는 일을 하고 있어요.

Q. 데이터 과학에 관심을 가지게 된 계기가 궁금합니다.


굉장히 오래전부터 기록하고 다시 들여다보는 것을 좋아했어요. 종이에 기록을 하면 나중에 보기가 어렵잖아요. 제 전공이 전자, 컴퓨터 관련 분야였기 때문에 어느 순간에 컴퓨터로 기록을 하게 된 거예요. 문제가 있으면 항상 '그 문제에 대한 데이터를 기록해보자'라는 생각을 했죠. 


거기서 시작을 해서 기록이 데이터화되고, 그다음에는 모은 데이터에 대한 분석이 굉장히 자연스럽게 일어났어요. 데이터 분석을 하기 위해서 기록하는 게 아니라 제가 가지고 있는 문제를 해결하자는 생각으로부터 출발한 겁니다. 저는 제 개인의 행복도에 관심이 많았거든요.


제가 더 행복할 방법이 뭘까 항상 고민했었는데, 행복도라는 것도 데이터화할 수 있겠다고 생각했어요. ‘스스로한테 너 오늘 얼마나 행복하니’라고 물어보고, 그 답변을 계속 모으면 데이터가 되는 거잖아요.


그렇게 행복도를 계속 모아서 분석하는 일을 10년 정도 했습니다. 그 일을 통해서 제가 언제, 어떤 일을 할 때 행복한지 알 수 있는 단서를 얻었어요. 


그중에는 굉장히 놀라운 것도 있었습니다. 예를 들어 저는 보통 사람들처럼 제가 놀 때 행복하다고 믿고 있었는데요. 제가 대학원에 다닐 때는 학교에 있는 시간이 더 행복했더라고요. 그런 걸 알고 나서는 학교에 오래 있는 것에 대한 죄책감 같은 게 없어졌죠. 그게 다 행복한 일이니까요.


세상에는 굉장히 다양한 종류의 공개 데이터가 있어요. 본인의 데이터가 아니더라도 꼭 보시라고 말씀드리고 싶어요. 대부분의 사람이 데이터를 직접 모아서 뭔가를 해보기보다는, 남이 분석해놓은 결과를 가지고 판단을 하거나 의사결정을 하는 경우가 많을 텐데요.


그런 경우 현명한 데이터 소비자가 되는 것도 굉장히 중요한 일인 것 같습니다. 의심하는 데에서 출발하되, 의심해서 걸러진 데이터는 더 확실하게 믿을 수가 있겠죠.

Q. 데이터 과학이 주목받고 있지만, 비전문가 입장에선 정말 어려운 분야인 것 같아요.


데이터가 주목받고 있는 이유는 아무래도 데이터를 저장하고 처리해서 결론을 내리는 기술들이 발전을 했기 때문인데요. 그런데 그 기술들이 워낙 주목을 받다 보니까 데이터의 본질이라고 할 수 있는 문제해결 부분이 오히려 많이 가려지는 것 같아요.


데이터를 다루려면 굉장히 어려운 고급 통계나 복잡한 프로그래밍 같은 것들을 잘해야 할 것 같다는 생각을 많이 할 수 있는데요. 기본적인 데이터 분석 스킬만 배우면, 일단 문제를 정말 잘 이해하는 사람이 무척 잘 할 수 있는 게 데이터 분석인 것 같습니다.


데이터 과학은 기본적으로 사람의 지적 능력을 데이터를 통해서 향상시키는 과정이라고 생각해요. 그 과정을 데이터를 가지고 판단을 내릴 수 있는 기술을 통해서 도움받는 거예요. 그렇게 생각하면 제가 삶에서 해볼 수 있는 게 굉장히 많은 거죠.


예를 들어, 재작년에 제 첫아이가 태어났어요. 아이를 키워본 적이 없으니까 정말 모르는 분야잖아요. 어떻게 할까 고민을 하다가 데이터를 모아보자고 생각했어요. 아이가 자고 일어나는 시간, 우유를 먹는 시간, 배변하는 시간 등에 대한 데이터를 모으기 시작했는데요.


아이가 백일 전 즈음에 한국에 갔다 온 적이 있었는데, 한국에 갔다 오면 생활습관이 완전히 달라지잖아요. 미리 모아둔 데이터 덕분에 아이가 돌아와서 얼마나 적응을 하고 있는지 확인할 수 있었습니다. 아내에게서 굉장히 칭찬을 받은 첫 번째 경험이었다고 생각해요.

Q. 데이터 과학 분야는 어떤 방향으로 나아가고 있나요?


데이터 과학의 역사를 살펴보면, 2000년대 후반 들어 빅데이터가 한창 화두였습니다. 모든 사람이 ‘빅데이터를 공부해야 한다’라고 얘기했었죠. 그때는 굉장히 복잡한 알고리즘이나 프로그래밍을 해야 빅데이터를 다룰 수 있는 시대였어요.


그런데 지금 보면 대학원 수준의 프로그래밍이 필요했던 일이 거의 고등학교 수준으로 떨어진 겁니다. 매우 제한된 분야에서만 데이터를 사용하다가 모든 분야에서 데이터를 사용하기 시작하면서 나타난 현상인데요.


예를 들어 무선통신기술이 처음 발달했을 때를 생각해봅시다. 그때는 모스부호 같은 전신부호를 아는 사람만 통신할 수 있는 시대였는데, 점차 기술이 발달하면서 모든 사람이 전화기를 들고 통화를 할 수 있는 시대가 됐잖아요.


데이터 관련 기술도 마찬가지일 거예요. 올해 뜨는 기술이 몇 년 뒤에는 시스템 안에 다 들어가 있어서 그 기술을 안다는 게 전혀 차이를 만들지 못할 확률이 매우 높아지고 있고, 딥러닝 자체도 범용화되고 있어요. 범용화된다는 건 딥러닝을 몰라도 클라우드 같은 데에서 알고리즘을 꺼내 쓸 수 있고, 그걸 데이터에 적용해서 사용할 수 있게 된다는 거죠.


이런 과정이 차곡차곡 진행되고 있고요. 데이터를 전공하지 않아도 모든 사람이 언어를 배우듯이 데이터 관련 스킬을 배워서 자신의 일을 할 수 있는 시대가 오지 않을까, 혹은 어느 순간 데이터 과학이 특별해지지 않는 시대가 오지 않을까 생각합니다.

Q. 그렇다면 데이터 과학 분야에 있는 사람들의 고민도 많아질 것 같은데요.


데이터 관련 기술과 함께 본인의 고유 분야를 갖고 있는 편이 마음이 편하지 않을까 생각합니다. 데이터 기술을 몰라도 데이터를 모을 수 있고, 분석할 수 있고, 결론을 내릴 수 있는 게 데이터 관련 기술의 목표이기 때문입니다.


예를 들어 패션에 관심이 많은 사람은 패션을 공부하면서 데이터를 같이 공부하는 거예요. 패션 분야에도 다양한 문제가 있을 거 아니에요.


패션을 공부하면서 패션 트렌드를 예측하기 위해 패션 트렌드 관련 문제에 대한 데이터를 아는 사람이 그 문제를 풀 수 있겠죠. 그 두 가지를 접목할 수 있는 일이니까요. 그런 걸 할 수 있는 사람이 훨씬 더 유리하다고 생각해요.


그리고 앞서 말씀드린 것처럼 데이터 과학이 더 이상 특별해지지 않는 시대가 온다고 하더라도, 데이터 과학자가 할 일이 완전히 사라지는 건 아니라고 생각해요. 90%의 데이터 문제는 90%의 사람이 풀 수 있겠지만, 그때가 되어도 중요한 10%의 문제들이 있겠죠.


거기서 중요한 것은 다양한 역할의 사람들과 소통을 하게 되는데 각각의 사람들이 가진 경험치가 다르다는 거예요. 전달하는 방식도 달라지고 깊이도 달라지고요. 경영진한테는 프레젠테이션과 같은 장표를 만들어서 문제의 개요부터 설명해야 할 때도 있겠죠.


매일 데이터를 봐야 하는 개발자의 경우, 문서화하기보다는 데이터를 일목요연하게 볼 수 있는 대시보드를 만들어서 매일 들어가 데이터를 볼 수 있게 해줘야 하겠고요. 데이터를 전달받는 주체의 경험과 필요에 따라서 소통 방식이 매번 달라지는데, 그런 것도 데이터 과학자로서 신경을 많이 써야 하는 부분인 것 같아요.

Q. 진영 님과 같이 실리콘밸리 입성을 꿈꾸는 데이터 분야 종사자에게 해주고 싶은 말이 있다면요?


찾아보시면 아시겠지만 실리콘밸리에서 데이터 과학자로 일한다는 게 웬만큼 해서는 먹고살기가 쉽지 않아요. 그래서 실리콘밸리의 꿈을 꾸시는 분들이 있다면 일단 한국에서 잘하시는 걸 추천하고요.


그런 환상보다는 역시 데이터를 먼저 모아보세요. 실리콘밸리가 어떤 곳인지에 대한 데이터를 모아보시고 그다음에 결론을 내리시라고 말씀드리고 싶네요.

* 본 인터뷰는 2019년 4월 공개된 <당신의 일상을 바꿔줄 데이터 사이언스 이야기 | 스냅 데이터과학자 김진영 [리얼밸리 시즌2 EP 22]>의 내용을 바탕에 두고 있습니다.

👆행복을 데이터로 기록하고, 데이터에서부터 행복을 찾는 데이터 사이언티스트 김진영 님의 이야기를 영상으로도 만나보세요.


글·편집 조철희






EO(Entrepreneurship & Opportunities)


이 콘텐츠에 대해 어떻게 생각하시나요?