Jupyter notebook 분석 결과를 정기적으로 배포해보자.
안녕하십니까? 오랜만에 글을 올려 드리네요. NHN에서 Data를 수월하게 처리하고 분석하고 활용하는 플랫폼을 개발하고 이를 통해 여러 인사이트를 도출하는, 데이터 기반 비지니스 사업의 기술부분을 담당하고 있는 임지홍 입니다. 대부분의 업무가 그렇겠지만 저의 경우 데이터 모델링, 지표개발 등의 업무를 수행하다보면 갈림길에 직면하는 경우가 많은데요, 주로 내가 생각한 것이 보편적으로 타당한 것일까? 고객들의 니즈에 부합되는 정보일까? 어떻게 시각화해야 더 전달력이 좋을까? 등이 고민거리였던 것 같습니다. 웹서비스는 본격적인 개발 전에 목업이나 프로토타입을 만들어서 어느정도 피드백을 수집할 수 있었던 것에 반해 모델.......
2022-07-08 11:26:19 |
산소소년
Jupyter notebook 분석 결과를 정기적으로 배포해보자.
안녕하십니까? 오랜만에 글을 올려 드리네요. NHN에서 Data를 수월하게 처리하고 분석하고 활용하는 플랫폼을 개발하고 이를 통해 여러 인사이트를 도출하는, 데이터 기반 비지니스 사업의 기술부분을 담당하고 있는 임지홍 입니다. 대부분의 업무가 그렇겠지만 저의 경우 데이터 모델링, 지표개발 등의 업무를 수행하다보면 갈림길에 직면하는 경우가 많은데요, 주로 내가 생각한 것이 보편적으로 타당한 것일까? 고객들의 니즈에 부합되는 정보일까? 어떻게 시각화해야 더 전달력이 좋을까? 등이 고민거리였던 것 같습니다. 웹서비스는 본격적인 개발 전에 목업이나 프로토타입을 만들어서 어느정도 피드백을 수집할 수 있었던 것에 반해 모델.......
2022-07-08 11:26:19 |
산소소년
Jupyter notebook 분석 결과를 정기적으로 배포해보자.
안녕하십니까? 오랜만에 글을 올려 드리네요. NHN에서 Data를 수월하게 처리하고 분석하고 활용하는 플랫폼을 개발하고 이를 통해 여러 인사이트를 도출하는, 데이터 기반 비지니스 사업의 기술부분을 담당하고 있는 임지홍 입니다. 대부분의 업무가 그렇겠지만 저의 경우 데이터 모델링, 지표개발 등의 업무를 수행하다보면 갈림길에 직면하는 경우가 많은데요, 주로 내가 생각한 것이 보편적으로 타당한 것일까? 고객들의 니즈에 부합되는 정보일까? 어떻게 시각화해야 더 전달력이 좋을까? 등이 고민거리였던 것 같습니다. 웹서비스는 본격적인 개발 전에 목업이나 프로토타입을 만들어서 어느정도 피드백을 수집할 수 있었던 것에 반해 모델.......
2022-07-08 02:26:19 |
산소소년
Jupyter notebook 분석 결과를 정기적으로 배포해보자.
안녕하십니까? 오랜만에 글을 올려 드리네요. NHN에서 Data를 수월하게 처리하고 분석하고 활용하는 플랫폼을 개발하고 이를 통해 여러 인사이트를 도출하는, 데이터 기반 비지니스 사업의 기술부분을 담당하고 있는 임지홍 입니다. 대부분의 업무가 그렇겠지만 저의 경우 데이터 모델링, 지표개발 등의 업무를 수행하다보면 갈림길에 직면하는 경우가 많은데요, 주로 내가 생각한 것이 보편적으로 타당한 것일까? 고객들의 니즈에 부합되는 정보일까? 어떻게 시각화해야 더 전달력이 좋을까? 등이 고민거리였던 것 같습니다. 웹서비스는 본격적인 개발 전에 목업이나 프로토타입을 만들어서 어느정도 피드백을 수집할 수 있었던 것에 반해 모델.......
2022-07-08 02:26:19 |
산소소년
제대로 하기 전에 간단하게 모델을 서빙해보자.
AI, ML의 최종목적은 지속적으로 학습하는 모델을 서비스에 배포하여 새로운 데이터에 대한 예측을 런타임에 하기 위함일텐데요. 그러다보니 시스템 설계에 관심이 많은 저의 개인적인 관점에서는 학습된 모델을 서비스에 배포하는 이 “모델서빙"이야말로 AI기반 서비스의 핵심이 아닐까하는 생각을 갖고 있습니다. (모든 영역 하나하나가 다 중요하지만 아무래도 AI 기반 서비스의 대부분을 담당하기에 자연스럽게 스며든 화룡점정의 스탠스가 아닐까 싶네요 :) 이 영역이 연구의 단계(ML)에서 개발/운영의 단계(DevOps)로 넘어가는 경계이기도 하여서 이 부분을 원활하게 운영하기 위한 개념 및 조직인 MLOps를 구성한다거나 이 과정을 쉽.......
2022-06-24 16:59:55 |
산소소년
제대로 하기 전에 간단하게 모델을 서빙해보자.
AI, ML의 최종목적은 지속적으로 학습하는 모델을 서비스에 배포하여 새로운 데이터에 대한 예측을 런타임에 하기 위함일텐데요. 그러다보니 시스템 설계에 관심이 많은 저의 개인적인 관점에서는 학습된 모델을 서비스에 배포하는 이 “모델서빙"이야말로 AI기반 서비스의 핵심이 아닐까하는 생각을 갖고 있습니다. (모든 영역 하나하나가 다 중요하지만 아무래도 AI 기반 서비스의 대부분을 담당하기에 자연스럽게 스며든 화룡점정의 스탠스가 아닐까 싶네요 :) 이 영역이 연구의 단계(ML)에서 개발/운영의 단계(DevOps)로 넘어가는 경계이기도 하여서 이 부분을 원활하게 운영하기 위한 개념 및 조직인 MLOps를 구성한다거나 이 과정을 쉽.......
2022-06-24 16:59:55 |
산소소년
제대로 하기 전에 간단하게 모델을 서빙해보자.
AI, ML의 최종목적은 지속적으로 학습하는 모델을 서비스에 배포하여 새로운 데이터에 대한 예측을 런타임에 하기 위함일텐데요. 그러다보니 시스템 설계에 관심이 많은 저의 개인적인 관점에서는 학습된 모델을 서비스에 배포하는 이 “모델서빙"이야말로 AI기반 서비스의 핵심이 아닐까하는 생각을 갖고 있습니다. (모든 영역 하나하나가 다 중요하지만 아무래도 AI 기반 서비스의 대부분을 담당하기에 자연스럽게 스며든 화룡점정의 스탠스가 아닐까 싶네요 :) 이 영역이 연구의 단계(ML)에서 개발/운영의 단계(DevOps)로 넘어가는 경계이기도 하여서 이 부분을 원활하게 운영하기 위한 개념 및 조직인 MLOps를 구성한다거나 이 과정을 쉽.......
2022-06-24 07:59:55 |
산소소년
제대로 하기 전에 간단하게 모델을 서빙해보자.
AI, ML의 최종목적은 지속적으로 학습하는 모델을 서비스에 배포하여 새로운 데이터에 대한 예측을 런타임에 하기 위함일텐데요. 그러다보니 시스템 설계에 관심이 많은 저의 개인적인 관점에서는 학습된 모델을 서비스에 배포하는 이 “모델서빙"이야말로 AI기반 서비스의 핵심이 아닐까하는 생각을 갖고 있습니다. (모든 영역 하나하나가 다 중요하지만 아무래도 AI 기반 서비스의 대부분을 담당하기에 자연스럽게 스며든 화룡점정의 스탠스가 아닐까 싶네요 :) 이 영역이 연구의 단계(ML)에서 개발/운영의 단계(DevOps)로 넘어가는 경계이기도 하여서 이 부분을 원활하게 운영하기 위한 개념 및 조직인 MLOps를 구성한다거나 이 과정을 쉽.......
2022-06-24 07:59:55 |
산소소년
AI 데이터를 정보로 만드려면???
우리는 일상 중 판단하기 어려운 문제의 해답을 찾기 위해 AI를 이용하는 경우가 많습니다. 아래에서 말씀드릴 내 고객이 이탈했는가? 혹은 언제 이탈할까? 를 예측하기 위해 제가 시도해본 여러 방법 또한 이에 대한 좋은 예가 될 것 같습니다. 이번 글이서는 이 당시 저의 고민 과정을 설명 드리며 글을 이어나가 보겠습니다. 아마도 우리는 좋은 데이터를 준비하고 적합한 모델을 찾아 연구하는 과정을 반복 할텐데요. AI 과제를 많이 수행해보신 분들은 아시겠지만 이러한 여러 우여곡절 끝에 우리가 얻는 결과물은 고객별 이탈확률인 0~1.0까지의 값이 전부일 것 입니다. “A고객의 이탈확률은 0.7(70%) 입니다.” 고객사나 서비스에서 원하.......
2022-06-08 18:27:38 |
산소소년
AI 데이터를 정보로 만드려면???
우리는 일상 중 판단하기 어려운 문제의 해답을 찾기 위해 AI를 이용하는 경우가 많습니다. 아래에서 말씀드릴 내 고객이 이탈했는가? 혹은 언제 이탈할까? 를 예측하기 위해 제가 시도해본 여러 방법 또한 이에 대한 좋은 예가 될 것 같습니다. 이번 글이서는 이 당시 저의 고민 과정을 설명 드리며 글을 이어나가 보겠습니다. 아마도 우리는 좋은 데이터를 준비하고 적합한 모델을 찾아 연구하는 과정을 반복 할텐데요. AI 과제를 많이 수행해보신 분들은 아시겠지만 이러한 여러 우여곡절 끝에 우리가 얻는 결과물은 고객별 이탈확률인 0~1.0까지의 값이 전부일 것 입니다. “A고객의 이탈확률은 0.7(70%) 입니다.” 고객사나 서비스에서 원하.......
2022-06-08 18:27:38 |
산소소년
AI 데이터를 정보로 만드려면???
우리는 일상 중 판단하기 어려운 문제의 해답을 찾기 위해 AI를 이용하는 경우가 많습니다. 아래에서 말씀드릴 내 고객이 이탈했는가? 혹은 언제 이탈할까? 를 예측하기 위해 제가 시도해본 여러 방법 또한 이에 대한 좋은 예가 될 것 같습니다. 이번 글이서는 이 당시 저의 고민 과정을 설명 드리며 글을 이어나가 보겠습니다. 아마도 우리는 좋은 데이터를 준비하고 적합한 모델을 찾아 연구하는 과정을 반복 할텐데요. AI 과제를 많이 수행해보신 분들은 아시겠지만 이러한 여러 우여곡절 끝에 우리가 얻는 결과물은 고객별 이탈확률인 0~1.0까지의 값이 전부일 것 입니다. “A고객의 이탈확률은 0.7(70%) 입니다.” 고객사나 서비스에서 원하.......
2022-06-08 09:27:38 |
산소소년
AI 데이터를 정보로 만드려면???
우리는 일상 중 판단하기 어려운 문제의 해답을 찾기 위해 AI를 이용하는 경우가 많습니다. 아래에서 말씀드릴 내 고객이 이탈했는가? 혹은 언제 이탈할까? 를 예측하기 위해 제가 시도해본 여러 방법 또한 이에 대한 좋은 예가 될 것 같습니다. 이번 글이서는 이 당시 저의 고민 과정을 설명 드리며 글을 이어나가 보겠습니다. 아마도 우리는 좋은 데이터를 준비하고 적합한 모델을 찾아 연구하는 과정을 반복 할텐데요. AI 과제를 많이 수행해보신 분들은 아시겠지만 이러한 여러 우여곡절 끝에 우리가 얻는 결과물은 고객별 이탈확률인 0~1.0까지의 값이 전부일 것 입니다. “A고객의 이탈확률은 0.7(70%) 입니다.” 고객사나 서비스에서 원하.......
2022-06-08 09:27:38 |
산소소년
aws lambda 에서 glue를 호출하기
검색 실력이 부족해서인지 구글링을 해도 딱 이거다하는 howto를 찾기가 힘들어 기록 차 포스팅 합니다. lambda를 활용할 때 간단한 python 혹은 aws 작업은 handler 내에서 직접처리하도록 구성할 텐데요. 그러다 시간이 지나면 점점 lambda에서 하고싶거나 해야하는 것들이 늘어나게되고 이때 금방 lambda의 제약에 좌절하게 됩니다. 이 제약들 중 가장 아쉬운 것은 python의 풍부한 library를 사용하려면 패키지를 구성 해야하는데 이게 압축해서 50MB를 넘어가면 배포가 불가능하다는 것 입니다. numpy+scipy만 해도 압축 시 100MB정도가 나오거든요. 또 다른 방법으로는 컨테이너 이미지를 만든 후 배포하는 방법이 있는데 이건 lambda의 취.......
2022-05-11 23:08:57 |
산소소년
aws lambda 에서 glue를 호출하기
검색 실력이 부족해서인지 구글링을 해도 딱 이거다하는 howto를 찾기가 힘들어 기록 차 포스팅 합니다. lambda를 활용할 때 간단한 python 혹은 aws 작업은 handler 내에서 직접처리하도록 구성할 텐데요. 그러다 시간이 지나면 점점 lambda에서 하고싶거나 해야하는 것들이 늘어나게되고 이때 금방 lambda의 제약에 좌절하게 됩니다. 이 제약들 중 가장 아쉬운 것은 python의 풍부한 library를 사용하려면 패키지를 구성 해야하는데 이게 압축해서 50MB를 넘어가면 배포가 불가능하다는 것 입니다. numpy+scipy만 해도 압축 시 100MB정도가 나오거든요. 또 다른 방법으로는 컨테이너 이미지를 만든 후 배포하는 방법이 있는데 이건 lambda의 취.......
2022-05-11 23:08:57 |
산소소년
aws lambda 에서 glue를 호출하기
검색 실력이 부족해서인지 구글링을 해도 딱 이거다하는 howto를 찾기가 힘들어 기록 차 포스팅 합니다. lambda를 활용할 때 간단한 python 혹은 aws 작업은 handler 내에서 직접처리하도록 구성할 텐데요. 그러다 시간이 지나면 점점 lambda에서 하고싶거나 해야하는 것들이 늘어나게되고 이때 금방 lambda의 제약에 좌절하게 됩니다. 이 제약들 중 가장 아쉬운 것은 python의 풍부한 library를 사용하려면 패키지를 구성 해야하는데 이게 압축해서 50MB를 넘어가면 배포가 불가능하다는 것 입니다. numpy+scipy만 해도 압축 시 100MB정도가 나오거든요. 또 다른 방법으로는 컨테이너 이미지를 만든 후 배포하는 방법이 있는데 이건 lambda의 취.......
2022-05-11 14:08:57 |
산소소년
aws lambda 에서 glue를 호출하기
검색 실력이 부족해서인지 구글링을 해도 딱 이거다하는 howto를 찾기가 힘들어 기록 차 포스팅 합니다. lambda를 활용할 때 간단한 python 혹은 aws 작업은 handler 내에서 직접처리하도록 구성할 텐데요. 그러다 시간이 지나면 점점 lambda에서 하고싶거나 해야하는 것들이 늘어나게되고 이때 금방 lambda의 제약에 좌절하게 됩니다. 이 제약들 중 가장 아쉬운 것은 python의 풍부한 library를 사용하려면 패키지를 구성 해야하는데 이게 압축해서 50MB를 넘어가면 배포가 불가능하다는 것 입니다. numpy+scipy만 해도 압축 시 100MB정도가 나오거든요. 또 다른 방법으로는 컨테이너 이미지를 만든 후 배포하는 방법이 있는데 이건 lambda의 취.......
2022-05-11 14:08:57 |
산소소년
공공데이터를 이용한 간단 서비스 (상권검색, 주가예측)
딸아이 시험기간에 코시국이기도 하여 날좋은 주말인데 집안에만 몸사리고 있다 문득 예전부터 생각만 하고 있던, 세상이 오픈데이터, 공공데이터를 공을 들여가며 만들어 주고 있으니 우리같은 개발자가 여기에 조금만 더 공을보태서 많은 분들이 더 쉽게 활용할 수 있게해보자! 라는 다짐(?)을 실행해 봤습니다. 뭐가 있을까하다가 상권검색과 주가예측관련 간단한 서비스를 만들었는데요. "데이터베이스 없이 요청한 순간 런타임에 데이터 수집->처리->예측->차트 생성을 수행"하는 최소한의 리소스로 구동되는 알뜰한 점이 특징 입니다. 거창하게 말했지만 사실은 클라우드 환경을 최대한 활용해도 월급쟁이 입장에서는 비.......
2022-05-02 23:37:37 |
산소소년
공공데이터를 이용한 간단 서비스 (상권검색, 주가예측)
딸아이 시험기간에 코시국이기도 하여 날좋은 주말인데 집안에만 몸사리고 있다 문득 예전부터 생각만 하고 있던, 세상이 오픈데이터, 공공데이터를 공을 들여가며 만들어 주고 있으니 우리같은 개발자가 여기에 조금만 더 공을보태서 많은 분들이 더 쉽게 활용할 수 있게해보자! 라는 다짐(?)을 실행해 봤습니다. 뭐가 있을까하다가 상권검색과 주가예측관련 간단한 서비스를 만들었는데요. "데이터베이스 없이 요청한 순간 런타임에 데이터 수집->처리->예측->차트 생성을 수행"하는 최소한의 리소스로 구동되는 알뜰한 점이 특징 입니다. 거창하게 말했지만 사실은 클라우드 환경을 최대한 활용해도 월급쟁이 입장에서는 비.......
2022-05-02 23:37:37 |
산소소년
공공데이터를 이용한 간단 서비스 (상권검색, 주가예측)
딸아이 시험기간에 코시국이기도 하여 날좋은 주말인데 집안에만 몸사리고 있다 문득 예전부터 생각만 하고 있던, 세상이 오픈데이터, 공공데이터를 공을 들여가며 만들어 주고 있으니 우리같은 개발자가 여기에 조금만 더 공을보태서 많은 분들이 더 쉽게 활용할 수 있게해보자! 라는 다짐(?)을 실행해 봤습니다. 뭐가 있을까하다가 상권검색과 주가예측관련 간단한 서비스를 만들었는데요. "데이터베이스 없이 요청한 순간 런타임에 데이터 수집->처리->예측->차트 생성을 수행"하는 최소한의 리소스로 구동되는 알뜰한 점이 특징 입니다. 거창하게 말했지만 사실은 클라우드 환경을 최대한 활용해도 월급쟁이 입장에서는 비.......
2022-05-02 14:37:37 |
산소소년
공공데이터를 이용한 간단 서비스 (상권검색, 주가예측)
딸아이 시험기간에 코시국이기도 하여 날좋은 주말인데 집안에만 몸사리고 있다 문득 예전부터 생각만 하고 있던, 세상이 오픈데이터, 공공데이터를 공을 들여가며 만들어 주고 있으니 우리같은 개발자가 여기에 조금만 더 공을보태서 많은 분들이 더 쉽게 활용할 수 있게해보자! 라는 다짐(?)을 실행해 봤습니다. 뭐가 있을까하다가 상권검색과 주가예측관련 간단한 서비스를 만들었는데요. "데이터베이스 없이 요청한 순간 런타임에 데이터 수집->처리->예측->차트 생성을 수행"하는 최소한의 리소스로 구동되는 알뜰한 점이 특징 입니다. 거창하게 말했지만 사실은 클라우드 환경을 최대한 활용해도 월급쟁이 입장에서는 비.......
2022-05-02 14:37:37 |
산소소년