네이버에서 AI 높임말 번역 개발…업스테이지 공동 창업
가보지 않은 길이라도 과감하게 발걸음 내디뎌
"지금 기준 아닌 1년 후, 10년 후 미래 그려야"
"미래를 쫓아가기보다는 미래가 올 곳에 미리 가 있어야죠."
새로운 기술이 쏟아지는 인공지능(AI) 산업에서 업스테이지는 누구보다도 빠르게 움직이는 기업입니다. 생성형 AI 붐을 일으킨 오픈AI가 챗GPT 개발 도구를 공개하자마자 카카오톡과 라인에 붙여 서비스했습니다. 챗GPT 대항마로 오픈소스 대규모언어모델(LLM)이 부상하자 자체 모델로 글로벌 오픈소스 LLM 리그에서 1위를 차지했습니다. 지난 9월에는 LLM 전담팀을 조직한 지 한 달 만에 자체 모델 '솔라'를 개발했습니다. 회사의 성장도 기술 개발 속도만큼 빠릅니다. 2020년 네이버 출신 개발자 3명이 뭉친 회사 인력은 3년이 안 돼 160명으로 늘었습니다.
박은정 업스테이지 최고과학책임자(CSO)는 3명의 공동창업자 중 하나입니다. "내가 있는 곳으로 미래가 온 경우"라고 겸손하게 말하지만 미래를 먼저 내다보고 준비했습니다. 바둑 두는 AI 알파고로 붐이 일기 전부터 AI 시작점인 데이터 마이닝을 연구했습니다. 지금은 AI 주권의 핵심으로 떠오른 한국어 연구에 아무도 관심이 없을 때 한국어 높임말 번역을 개발했습니다. 가보지 않은 길이라도 과감하게 내디딘 발걸음이 그를 미래로 이끈 셈입니다.
미래 보고 과감한 베팅…관심 밖 한국어 데이터 연구
박 CSO가 데이터 마이닝을 시작한 것은 대학원 때입니다. 데이터 마이닝은 데이터에서 숨겨진 패턴과 관계를 찾아 가치 있는 정보를 발견하는 것입니다. 데이터라는 원석에서 다이아몬드 같은 인사이트를 캐낸다는 점에서 매력을 느꼈습니다. 반도체 공정 데이터에서 불량 웨이퍼 탐지하기, 기업 공시자료를 토대로 주가 예측하기 등을 연구하며 머신러닝을 활용했습니다. 머신러닝은 대량의 데이터로 다음에 일어날 일을 예측하는 것으로 AI의 한 분야입니다. 데이터를 파헤칠수록 박 CSO는 AI가 세상을 흔들 것이라 직감했습니다. AI는 쉽게 말해 데이터를 넣어 특정 업무를 잘하는 함수를 만드는 것입니다. 비교적 단순한 일이지만 활용처가 무궁무진합니다. 박사 과정을 마칠 때쯤 알파고가 이세돌 9단을 꺾었습니다. 그의 직감은 확신으로 바뀌었습니다.
박 CSO는 확신하는 일에 과감하게 베팅하는 편입니다. 파이선 개발자들의 축제인 파이콘 1회가 한국에서 열릴 때 코엔엘파이(KoNLPy)를 선보였습니다. 한국어 데이터를 컴퓨터가 이해할 수 있도록 분석해주는 도구입니다. 당시 파이선은 아무도 쓰지 않는 프로그래밍 언어였습니다. 한국어 역시 아무도 관심을 갖지 않는 비주류 언어였습니다. 박 CSO는 "파이선을 써보니 너무 편해서 앞으로 주류 언어가 될 거라 봤다"며 "지금을 기준으로 생각하기보단 1년 후, 10년 후는 어떻게 될지를 생각해야 미래가 있는 곳에 가 있을 수 있다"고 강조했습니다. KoNLPy는 지금까지 AI 개발자들이 많이 쓰는 프로그램입니다. 업스테이지에 합류하는 개발자 중에선 이 프로그램 때문에 입사를 선택하는 경우가 있을 정도입니다.
한국어 데이터에 대한 관심은 2016년 네이버 입사로 이어졌습니다. 네이버에서 AI 번역을 개발하는 파파고 리더로부터 제안받았습니다. 당시 박 CSO는 컴퓨터에 인간의 언어를 이해시키는 자연어처리(NPL)에 집중하고 있었습니다. NPL 분야에서도 꽃으로 불리는 번역 서비스에 뛰어든 것입니다. 글로벌 IT 회사에서도 영입 제안을 받았지만 한국어를 다뤄보고 싶다는 생각에 네이버를 택했습니다.
네이버에선 높임말 번역을 개발했습니다. AI가 한국어 특유의 높임말을 소화하지 못해 번역 품질이 떨어진다고 판단했기 때문입니다. 처음 몇 년은 실패의 연속이었습니다. 주체 높임, 객체 높임 같은 문법부터 해요체, 하게체 같은 단계까지 복잡한 높임말을 간단한 함수로 표현하기가 어려웠습니다. 박 CSO는 의외로 단순한 방법에서 돌파구를 찾았습니다. 복잡한 문법, 표현은 생략하고 높임말을 이진법처럼 구분했습니다. AI에 '~니다'가 들어가면 높임말, 그렇지 않으면 반말이라고 학습시켰습니다. 번역기에도 온·오프 스위치를 붙여 스위치를 켜면 높임말 표현으로 번역하도록 했습니다. 박 CSO는 "복잡하고 팬시(화려)한 기술보다 단순하지만 임팩트 있는 기술에서 답을 찾았다"며 "단순한 결과물(output)을 내는 게 아니라 실질적인 가치(outcome)를 만들어 내는 게 중요하다는 것을 배웠다"고 설명했습니다.
네이버에서 입지를 굳힌 그는 2020년 돌연 창업에 도전했습니다.
* 잘나가는 대기업에서 나와 창업에 도전한 박은정 CSO! 그 도전에 대한 스토리는 '인터뷰 더보기'에서 보실 수 있어요!👇