Company

Textscope®

Business

Insight

Career

로민에서 취득할 수 있는 데이터를 활용하여 가치를 창출하는 부분에 대해 보람을 느끼고 있어요.

데이터 엔지니어 승관님

“프로젝트의 시작에서 가장 먼저 나서야 하는 로민의 데이터 엔지니어 승관님! 승관님에게 데이터 엔지니어의 업무와 로민의 데이터 엔지니어에게 꼭 필요한 역량에 대해 들어볼까요?

“프로젝트의 시작에서 가장 먼저 나서야 하는 로민의 데이터 엔지니어 승관님! 승관님에게 데이터 엔지니어의 업무와 로민의 데이터 엔지니어에게 꼭 필요한 역량에 대해 들어볼까요?

로민의 데이터 엔지니어는 어떤 일을 하나요?

로민의 데이터 엔지니어는 프로젝트의 시작에서 가장 먼저 나서야 하는 포지션이에요. 프로젝트가 시작되면 고객사에서 제공받은 데이터를 분석 및 ETL 진행하고, 머신러닝팀에 제공되어야 할 gt(ground truth)에 대한 라벨링 가이드라인 작성을 시작합니다.

또한 라벨링 된 gt에 대한 퀄리티 보장을 위해 위에서 설계한 정책에 따른 Sanity Check 파이프라인을 설계하고, 머신러닝팀에 데이터를 배포하기 위한 파이프라인을 설계하며, 설계된 파이프라인에 대한 자동화 및 인프라를 관리합니다. 그리고 생성된 이미지 및 gt에 대한 버전 관리하는 등 데이터와 관련된 전반적인 업무를 진행하고 있어요.

로민의 데이터 엔지니어에게 필요한 역량은?

우선 머신러닝팀과 협업을 하기 위해 머신러닝 파이프라인에 대한 전반적인 이해가 필요해요. 머릿속에 파이프라인에 대한 그림이 그려져 있어야 현재 프로젝트에서 어떤 방향으로 태스크를 진행해야 하는지 보이죠. 또한 데이터 관리에 대한 꼼꼼함도 필수라고 할 수 있어요. 수집되는 이미지와 머신러닝 데이터셋이 몇 년이 지나도 확인이 될 수 있을 만큼 꼼꼼하게 관리가 되어야 하거든요.

그리고 사업에 따라서 다양한 문서들이 들어오고 이에 대한 도메인 지식이 필요할 수 있어요. 이러한 지식은 데이터 분석 및 라벨링 가이드라인 수립 시에도 필요합니다. 마지막으로 라벨링 된 gt에 대한 검증 시 어떤 부분이 잘못되었는지 파악하기 위해 데이터셋에 대한 이해가 있어야 해요. 이해도가 높아질수록 gt 퀄리티가 상승합니다.


업무를 하시면서 가장 보람이 있었던 순간은 언제였나요?

gt데이터를 제작 및 검수해 ML팀에 배포한 후, 전보다 모델의 성능이 올랐을 때 보람 있어요. 물론 배포 후 모델의 성능이 내려가는 일도 있었지만, 이럴 때 데이터의 문제점을 파악해서 개선해나가는 작업도 보람이 있는 부분 중 하나에요. 모델에서 일관되게 틀리는 내용이 있다면 그건 데이터 문제일 가능성이 높기 때문에 잘못된 부분에 대한 문제점을 분석한 후 gt 코드를 고치고 있습니다. 이런 작업 외에도 로민에서 취득할 수 있는 데이터를 활용하여 가치를 창출하는 부분에 대해서 보람을 느끼고 있어요.


주로 어떤 팀과 어떻게 협업하시나요?

고객의 사업분야와 고객이 주로 어떤 문서를 처리하고자 하는지에 따라 데이터 제작의 방향이 달라지기 때문에 고객의 접점에 있는 사업기획팀과 긴밀하게 커뮤니케이션하고 있어요. 그리고 데이터를 직접 사용하고 필요한 사항들에 대해서 요구사항을 정의하는 ML팀과 협의하여 어떻게 라벨링을 할지 협업하고요. 요구사항들이 정의되면 데이터를 함께 만들고 있는 라벨링팀이 이에 맞춰 라벨링 및 데이터 제작을 하고 있어요.

데이터 제작 후 문서 종류에 따라 달라지는 도메인 요구사항들을 반영하여 가공하는 데이터 파이프라인을 제작하여 ML팀 혹은 백엔드 팀에 배포합니다.


로민에 입사한 이유는 무엇이었는지 궁금해요.

입사하기 전 로민의 사업 및 투자, IP 등을 찾아 보았어요. 투자유치 전이었지만, 매출이 꾸준히 상승하고 있고 IP를 꾸준하게 내는 것을 확인할 수 있었어요. 또 무엇보다 실력 좋은 구성원들과 레퍼런스가 훌륭했기 때문에 입사를 결심했죠. 또 향후 투자유치가 되면 Series를 크게 받을 수 있겠다고 판단했어요.😄


구직자들에게 로민을 추천하신다면, 로민의 어떤 장점을 이야기하시겠어요?

주변에 자율출퇴근 이야기를 했을 때 가장 부러워했어요. 오전 6시부터 오후 1시까지(재택은 오전 8시~10시) 자율출퇴근이 가능하여 개인적인 약속이나 일정을 잡기 쉬워 좋고요. 상황에 따라서 취미가 있거나 일찍 일어난 경우에도 시간을 적절히 사용할 수 있어 좋아요.


로민에서의 앞으로의 계획, 포부를 알려주세요.

로민이 빠르게 성장하면서 앞으로 많은 사업들을 더 수행하게 되고, 이에 따라 대응해야 하는 프로젝트 수가 기하급수적으로 많아질 것으로 보여요. 저는 데이터 파이프라인을 보다 많은 케이스에 대해서 대응할 수 있도록 설계하고 처리하여 내부 데이터 사용자들에 대한 만족도를 크게 올리는 것을 목표로 삼고 있어요.


마지막으로 하고 싶은 말이 있다면?

세상에는 다양한 종류의 문서들이 있습니다. 각각의 문서들은 고유한 키와 값을 가지고 있고, 이것은 사람의 생각으로 만들어졌습니다. 다양한 문서들에 대해서 동일한 업무를 반복적으로 수행하는 것은 비효율적이기 때문에 이를 해결하기 위해 로민에서는 사람처럼 문서를 잘 읽을 수 있는 고성능의 문서 이해 기술을 개발 만들고 있어요.

수많은 종이 문서가 우리가 만드는 문서 이해 솔루션인 ‘텍스트스코프’를 통해 디지털 트랜스포메이션하는 과정을 거치게 될 거예요. 그 여정을 함께할 좋은 분들이 로민에 합류하시면 좋겠습니다. 😊

서울시 서초구 방배천로2길 10 JBI빌딩 7층

제품문의 및 기술 상담

T. 02 6289 0501

일반문의

T. 02 6331 1853

Copyright © 2024 Lomin.ai. All Rights Reserved

서울시 서초구 방배천로2길 10 JBI빌딩 7층

제품문의 및 기술 상담

일반문의

Copyright © 2024 Lomin.ai. All Rights Reserved