목차
- 왜 이 업무를 하게 됐는지
- 시각화와 대시보드?
- 스트림릿 샤이니의 차이
- 스트림릿 개발 과정
왜 이 업무를 하게 됐는가
데이터 직군 로드맵
dashboard
KPI를 검토할 수 있는 직관적인
- 반응형 -> 그룹, 직업별 , 성별, 연령별
- 시각화 모음
Visualization..?
= 단순히 자료를 보여주면 끝?
Visualization
정답은 없지만
의사결정에 도움이 돼야!!
무분별한 파이차트 이제 그만
스트림릿 vs shiny
공통점
장점
- 프론트엔드 개발자가 필요없다.
- 백엔드 개발자가 필요없다. 데이터를 올려놓고 작업할 수 있다.
- 빠르게 개발할 수 있다.
단점
- 웹사이트를 이대로 퍼블리싱하기엔 디테일한 부분을 손볼 수 없고, 결국 HTML CSS 를 뜯어서 원하는 디자인을 구현해야하기 때문에 바로 제품으로 사용하기엔 좀 어렵다!
- 반례 : 본담
개발 난이도
https://shiny.rstudio.com/gallery/
천하제일 샤이니 대회
샤이니로 할 수 있는것이 참 많다!
통계학의 근본 프로그래밍은 R
- R 기반으로 작동하는 웹앱을 만들어주는 패키지
회귀분석, 가설검정의 근본 -> R패키지
- (주관적인 저의 생각) 샤이니도 배우긴 쉬운데.. 근소한 차이로 스트림릿이 더 쉽다!
비슷비슷한데..
결국 샤이니와 스트림릿 모두 데이터를 보여주는 껍데기다!
따라서 파이썬에서 데이터를 다루는 것이 익숙하면 스트림릿으로, R에서 주로 데이터를 다루면 샤이니로
파이썬이라는 언어 자체가 개발 난이도가 더 낮다고 생각합니다!
streamlit skeleton code
import streamlit as st
import pandas as pd
st.write("""# My First app
Hello *world!*""')
df= pd.read_csv("My_data.csv")
st.line_chart(df)
왜 스트림릿을 썼는가?
개발 난이도
생태계
심미성
왜 스트림릿을 썼는가?
생태계
파이썬의 생태계
- DL/ML library
- Plotly
개발 과정
설문 데이터
전공의 2000여명의 80가지 설문에 대한 응답내용이 담긴 csv
남자인데 생리휴가 사용
폭력을 당하지 않았다고 응답했는데, 당한사람을 기록 등
-> 논리적 오류를 가진 데이터 전처리
(예,아니오), (Yes,No) 등 일원화
전처리 과정
찐막
찐찐막
찐 최종0118.csv
final 0118-2.csv
교 훈!
버전관리의 중요성
Github를 무조건 사용하자!
큰 틀 짜기
창우님이 작성한 큰 틀의 코드 안에서 세부적으로 모듈을 구현하거나,
케이스를 나눠서 나와야 할 게 잘 나오게 하는 업무를 진행했습니다
선택 : 없음
선택: 연차
문항에 맞게 시각화 하기
만족도-> horizontal bar graph로 표현하였습니다
유지보수 (~ing)
mean 글씨가 거슬리네요..
넵!!
언론에 보도된 대시보드
전공의들, 하루 평균 4시간 자면서 주 78시간 일해 <청년의사>
http://www.docdocdoc.co.kr/news/articleView.html?idxno=3001999
감사합니다
Citation
BibTeX citation:
@online{untitled,
author = {},
url = {https://blog.zarathu.com/posts/2023-02-01-streamlit/streamlit_slide.html},
langid = {en}
}
For attribution, please cite this work as: