ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 23년엔 무조건 한다 - 숀의 새해목표
    Shawn 2022. 12. 31. 01:14

    ..벌써 신년이라고???” 이제 진짜 정말로 하루 뒤에는 해를 넘겨 2023년이 된다. 계묘년 검은토끼의 해. 보람있고 알찬 한 해를 보내기 위해 무엇을 할까? 이제는 정말로 고민할 때이다. 지켜질 지 안지켜질 지 모르는 계획들이지만 작년에 이어 또 다시 궁리하는 시간을 가져보았다. 숀의 신년 계획. 스타트.

    신년계획: Study

    데이터 분석가는 고된 직업이다. 해도해도 공부할게 잔뜩 쌓여 있어서 언제 어디서든 지식 습득할 준비가 되어 있어야 한다지만 조금씩 늙어가는 나의 뇌는 이를 거부하기만 한다. 진작 미리미리 열심히 공부할 걸 후회하면 뭐하랴. 어차피 공부할 운명이라면 게으름 피우지 말고 열심히 하는 수 밖에.

    이변 년도에 공부할 것들을 정리한다.

    1) ML/DL

    ML:

    요즘 이 분야에 약간의 관심이라도 있는 사람이라면 파이썬으로 머신러닝 모델 하나쯤 만들어 본 경험이 있을 것이다.

    당장 우리 회사만해도 생산 현장의 데이터를 업무에 적용해보고자 오퍼레이터 분들에게 몇 년 전부터 ML교육을 해왔으니 말이다. 데이터와 관련된 경험이라고는 엑셀 함수써서 간단한 집계 정도만 해보셨던 분들이라 사이킷런 가지고 모델링을 하려니 여간 어려움이 많을 수 밖에 없지만.. 그래도 올해는 여러 시도를 해보면서 어느정도 의미있는 성과를 보였다고 한다.

    솔직히 나도 Python을 그다지 잘 다루지는 못하는 편이라 그 분들보다 내가 더 코딩을 잘 한다! 라고 단언할 수는 없지만 그래도 머신러닝에 대한 이해도 만큼은 내가 조금이라도 더 낫지 않을까? (라고 생각해봄)

    어차피 데이터분석가라는 직업은 내가 선택한 길이니 악으로 깡으로 버티는 것은 물론이고 얼치기로 배운 사람들보다는 적어도 이론적인 측면에서 만큼은 월등히 앞설 필요가 있을 것이다.

    요즘은 특히 책도 잘 나오고 온라인에 정리된 자료들도 많으니까 요리조리 잘 모아서 내 안에 체득시키도록 하자.

    RL:

    나의 첫 번째 RL모델은 C사 인공지능 공기청정기에 탑재되었다.

    이 모델은 공기청정기가 설치 환경에서의 pm10농도를 일정 기간동안 학습하고 환경내에서의 미세먼지 패턴을 익힌다. 그 패턴을 통해 공기질을 예측하고 공기청정기 fan 속도를 선제적 조정하여 환경을 제어하는 기능한다.

    사실 내가 처음부터 끝까지 설계해서 짠 모델은 아니었고, 이 회사에 입사하기 전에 근무하셨던 박사님이 만들어 놓고 간 마지막 유산?을 내 입맛에 맞게 코드만 몇 줄 고쳐넣은 수준이었다. 그래도 기존 모델의 문제점을 보완할 수 있었기에 개인적으로는 만족스러웠지만 내심 처음부터 끝까지 내 힘으로 만든 모델이 아니었기에 조금은 미련이 남더라. 부족한 내 실력을 탓해야지.

    그래서 RL 기초를 쌓아야겠다는 생각을 늘 하고 있었고 서튼 교수님의 Reinforcement Learning: An Introduction을 번역한 책이 있다고 해서 이번 기회에 각 잡고 강화학습 공부를 해보려고 한다. 원문읽기엔 시간이 너무 오래 걸린다고… ㅠ

    처음부터 완벽하게 이해하려 하지 말고 다회독할 각오로 여유를 가지며 학습해 나가자.

    2) Time Series

    시계열은 요즘 부쩍 관심을 갖고 중요성도 인식하고 있는 분야이다.

    제조업에서는 설비에 이것저것 센서 잔뜩 달아놓고 “설비 예지보전, 이상탐지등의 업무에 활용하고 있다!”

    라고 뻥치면서 실상을 까보면 아무것도 하지 않고 있거나, 하지 못하는 수준이다.

    그 원인은 정말 다양한데…

    내가 지금까지 지켜본 바를 정리하자면 다음과 같이 정리할 수 있겠다

    1. 설비 노후정도가 심각해서 센서 달아서 유지보수 할 게 아니라 아예 설비 신규 투자를 해야 하는 상태인 경우
    1. 센서 데이터와 생산실적 데이터가 연동이 되지 않아 이 데이터가 어떤 제품을 생산했을 때의 데이터인지 매칭이 안되는 경우
    1. 센서에서 유의미한 내용을 찾아내기 힘든 경우

    (그 외에도 여러 원인이 있었는데 지금은 딱히 떠오르지 않는다..?)

    내가 지적하고 싶었던 부분은 3.센서에서 유의미한 내용을 찾아내기 힘든 경우 인데,

    이 경우는 주로 다음의 원인에 기인한다.

    3.1. 데이터의 질이 좋지 않아서 분석이 불가능한 경우

    3.2. 분석가가 적절한 분석기법을 모르는 경우

    3.1.의 경우처럼 데이터 자체가 문제라면 어쩔 수 없지만, 만약 3.2.의 경우라면… 솔직히 전문가라고 앉혀놨는데 분석 방법을 몰라서 퍼포먼스가 안나오는 것 만큼 부끄러운 일이 없다고 생각한다.더 쪽팔리는 일이 발생하기 전에 시계열분석처럼 업무에 직접적으로 적용가능한 내용은 열심히 학습해놔야겠다.

    3) Tableau

    우리팀에서는 주로 Tableau를 사용해서 분석 업무를 처리한다.

    아무래도 Tableau는 drag&drop으로 쉽고 빠르게 그래프를 그릴 수 있다는 점, 동적 필터링을 걸어서 인사이트를 찾는데 용이하다는 것이 가장 큰 장점이라 생각한다.

    활용 스킬에 따라 무궁무진한 가치가 있는 툴이지만… 솔직히 나는 너무나 초보자이기 때문에 갈길이 멀고 험난하다.. 세상에 태블로 고수는 왜이렇게 많은거지? 휴

    내년에는 올해보다 조금 더 능숙하게 사용할 수 있길 기대하며.. 매 달 주제 하나정도 잡고 피드를 올린다거나 강의 신청해서 듣거나 할 예정.

    뭐 별거 있나. 계속 배워 나가는거지.


    처음에는 운동계획, 독서습관이나 영상편집 같은 내용도 주저리주저리 적으려다가 블로그 컨셉이랑 좀 안맞나 싶어서 전면 수정하고 학습계획만 남겨두었다.

    부디 많은 깨달음이 있는 해가 되길 바란다.

    잘 부탁한다. 검은 토끼야. 🐰🖤

    'Shawn' 카테고리의 다른 글

    About Shawn  (0) 2022.12.25

    댓글

Designed by Tistory.