Zarathu Blog Subscription
Outcome의 비정규성으로 인해 분석 모델 선택에 혼동을 겪게 될때, LMM과 GEE의 적절한 사용 방법과 데이터 상황에 맞는 최적의 상관구조 선택 전략에 대해 알아본다.
PDF 파일에 있는 테이블을 마우스 드래그로 쉽게 읽을 수 있는 tabulapdf 패키지를 소개합니다.
코호트 연구에서 치료군과 대조군의 Index Date를 설정하는 방법을 알아보자
AFROC 와 JAFROC의 차이점을 알고, JAFROC의 원리를 알아보자
나만의 R 패키지를 만들어보자
linear mixed effects model에서 사용했을 때 추정치들의 standard error가 모두 같아지는 상황에 대해 알아봅시다.
pkgdown 문서에 서버 없이 작동하는 shinylive 앱을 추가하는 방법을 소개합니다.
ggplot의 stat_compare_means()로는 그래프에 p < 0.001 같은 유의성을 깔끔하게 나타내기 어렵습니다. 이 글에서는 그래프에 원하는 형식으로 p-value를 직접 표시하는 방법을 소개합니다.
Breslow 방식을 이용해 baseline hazard를 구하는 법을 공부해봅시다.
FDA에서 발표한 RCT에서 공변량 보정 가이드라인을 공부해봅니다.
Step-by-step guide for creating CDISC ADaM-compliant ADSL datasets using R.
Competing risk model의 C-index, AUC, Brier score를 계산하고 비교하는 R 코드 소개
R로 생성한 Sankey plot에 JavaScript를 활용해 텍스트를 추가하는 방법을 알아보고, 이를 자동화한 Shiny App을 소개합니다.
Intraclass Correlation Coefficient에 대해 정리하였습니다.
여러 종류의 Kappa 분석 방법을 설명하고, R 코드 예제를 통해 실전에서 활용하는 방법을 정리하였습니다.
YAML Header, 마크다운(Markdown) 텍스트, R 코드 청크(chunk) 그리고 그림과 테이블을 중심으로, R 코드와 분석 결과가 포함된 문서를 작성하는 방법을 정리하였습니다.
Regression Analysis의 기본 Model인 Linear regression과 이의 robust한 (Co)variance Matrix Estimator인 HC Standard Errors(HCCCM), Wild Bootstrap에 대해서 공부합니다.
Data가 Independent하지 않고 Clustered되어 있을 때 Regression Analysis를 수행하기 위해 GLM에서 발전된 두 가지 모델 GEE와 GLMM의 개념을 공부하고, M-estimator와 Robust (sandwich) estimation을 통해 지금까지의 Robust한 Covariance Matrix을 generalize하게 살펴봅니다.
종속변수가 Non-Normal한 Data에서 Regression Analysis를 수행하기 위해 종속변수의 분포 조건을 Exponential Family로 확장하고 Link Function로 근사하는 Regression Model인 GLM의 수학적 원리에 대해서 공부합니다. 또, clustered data 버전의 robust 표준오차(Cluster-robust standard error)에 대해서 살펴봅니다.
RJafroc Package를 통해 Multi-Reader Multi-Case(이하 MRMC) 연구에서 표본 크기를 추정하는 방법에 대해 알아보자.
Effect size 중 하나인 Standardized Mean Difference의 개념을 살펴보고, SMD를 활용해 baseline covariate의 balance 평가를 해보자.
Competing Risk Analysis의 원리와 결과가 가지는 의미를 살펴봅니다
MRMC(Multi-Reader Multi-Case) 분석을 이해하고, iMRMC package를 통해 예시를 살펴본다.
data.table에서 제공하는 inequality join method 중 하나인 rolling merge에 대해 알아보자
tidyplots 패키지를 이용하여 주어진 데이터로 빠르게 그래프를 그려보자
ROC AUC와 관련된 통계; SE 추정과 이의 CI 구하기.
collapse; fast, flexible, parsimonoius code package for R.
Clone-Censor-Weight method를 이용한 Target trial emulation을 소개하고, 실습해 봅니다.
LLM을 이용하여 표 또는 그래프를 요약하는 Quarto 문서를 만들어 봅시다.
Survey design 모델에 대해 알아보고, 이를 직관적으로 표시할 수 있는 table을 만들어봅니다.
GLM, GLE, GLMM, COX 모델에 대해 알아보고, 이를 직관적으로 표시할 수 있는 table을 만들어봅니다.
Paired data에서 wald 신뢰 구간을 구하는 방법을 통해 민감도와 특이도의 신뢰 구간을 구하는 방법을 소개합니다.
competing risk가 존재할 때 생존 분석할 수 있는 fine-and-gray method와 multi-state model을 소개합니다
R의 dlnm 패키지를 이용해 the Extended DLNM을 적합시키는 방법을 소개합니다.
dlnm
Shiny app을 간단하게 꾸밀 수 있는 방법을 소개합니다.
ggplot2을 활용한 R 시각화의 결과물을 MS 파워포인트로 만들어내는 과정에서 쓰이는 R 패키지와 방법을 소개합니다.
rhub 패키지와 Github action을 사용해 R 패키지를 다양한 OS에서 정상적으로 설치, 실행할 수 있도록 확인 하는 R CMD CHECK 방법을 소개합니다.
bslib의 0.7.0에서 새롭게 추가된 input_task_button에 대해 소개합니다.
조절효과, 매개효과 분석을 위한 도구인 process macro를 소개합니다.
webR의 개선 버전인 shinylive 패키지를 사용하여 정적 페이지에 shiny application 추가하기
R&D 시험인증 및 R&D 관련 느낀점입니다.
RStudio Server에 2차 인증(OTP)를 도입한 후기입니다.
Quarto를 사용하여 R과 Python, Julia로 인터랙티브한 대시보드를 만드는 방법을 소개합니다.
Github 의 AI 서비스 Copilot을 Rstudio에 연동하여 자동 완성으로 코딩하는 방법을 소개합니다.
커뮤니티를 만들기 위한 오픈소스 무료 플랫폼인 Discourse와 만드는 과정을 소개합니다.
코드 블록을 포함한 학술 논문을 웹에 발행하고, PDF, docx등 다양한 형식으로 다운받을 수 있는 Quarto Manuscript를 소개합니다.
officer 패키지를 활용해 파워포인트로 저장한 이미지를 300DPI의 고해상도로 내보내기 (해상도 설정 변경 방법은 운영체제마다 다르며, 본 게시글은 Windows OS를 기준으로 합니다.)
electron forge라는 기술을 활용하여 사용자의 PC에서 R과 Rstudio를 설치하지 않고도 Shiny App을 사용할 수 있게 하는 (exe) 프로그램을 만드는 방법을 소개합니다. 단, 개발 과정은 OS에 따라 조금씩 다르며, windows를 기준으로 합니다.
webR이라는 기술을 활용하여 별도의 웹 서버를 사용하지 않고도 유저의 웹 브라우저(크롬)에서 Shiny App을 사용할 수 있게 하는 방법을 소개합니다.
webR이라는 기술을 활용하여 별도의 웹 서버를 사용하지 않고도 유저의 웹 브라우저(크롬)에서 R을 사용할 수 있게 하는 방법을 소개합니다.
R을 활용하여 만든 이미지를 PowerPoint에서 편집할 수 있도록, 벡터 그래픽을 만드는 법을 소개합니다.
RSQLite, shinyauthr 등 여러 R package를 이용한 웹 기반 방역관리 위험도 평가 대시보드 제작 과정
Analysis Data Model in CDISC, tidyCDISC 오픈소스 프로그램에 대해서 알아보자
sunburstr 패키지의 이용한 계층적 데이터 표시 방법에 대해 알아보자
R 패키지를 다른 사람들도 잘 활용할 수 있게 설명해주는 웹사이트를 pkgdown을 사용하여 만들어보자
likert 패키지를 사용하는 shiny apps 개발/ 배포 과정
python을 이용한 크롤링 검색결과 저장하기
Slack API를 이용하여 Python 기반 대나무숲 앱 만들기
문항별 만족/불만족을 한번에 표현하는 likert chart를 그려보자
streamlit 패키지의 사용방법을 알아보자
의료데이터분석가 성장기를 다시 정리했습니다. 본 내용은 보건산업진흥원이 지원하고 성균관대학교 의과대학에서 주관하는 “융합형 의사과학자 심포지엄” 에서 발표 예정입니다.
비선형모델인 GAM(Generalized Additive Model) 을 소개합니다. 본 강의는 성균관대 바이오헬스 규제과학과 강의자료로 쓰일 예정입니다.
Python으로 반응형 웹 어플리케이션을 만들수 있는 Shiny for Python에 대해 소개합니다.
collapse 패키지를 소개하고 data.table 패키지와 비교하여 파악해보겠습니다.
데이터를 빠르게 가공할 수 있는 data.table에 대하여 패키지 설치부터, 기본 구조 및 데이터를 가공하여 재구조화 하는 방법에 대해서 소개합니다.
의료분야 데이터과학자에 필요한 역량을 정리하였습니다. 본 내용은 성균관대학교 바이오헬스규제과학과 단기 교육 프로그램에서 발표할 예정입니다.
22년 각종 지원사업 선정, 탈락 후기를 공유합니다.
R 기본 함수, ggplot2 패키지, ggpubr 패키지를 활용해 의학논문에 필요한 그래프를 만들어보자.
제18차 대한이식학회 춘계학술대회 심포지엄에서 “리뷰어들을 위한 의학통계” 로 발표할 슬라이드를 미리 공유합니다.
대용량의 데이터를 분산 처리 시스템 없이 처리할 수 있는 data.table 데이터 구조와 이를 조작, 관리하는데 사용하는 data.table 패키지에 대해서 소개합니다.
Docker와 Traefik을 활용한 Reverse-Proxy 구현
효율적으로 의학 연구 논문에 들어갈 table1을 만들 수 있는 tableone 패키지에 대해 소개합니다.
데이터 셋의 변수를 하나의 테이블로 요약하여 효율적으로 논문에 들어갈 table1을 만들 수 있는 gtsummary 패키지에 대해 소개합니다.
성균관의대 “의사의 길” 학부 강의에서 창업 경험을 의대생들과 공유할 예정입니다. 발표 슬라이드를 미리 공유합니다.
MySQL 기반 DockerContainer에서 GitHub-Repository로의 주기적인 DB 백업 구현
숭실대학교 인턴십 프로그램을 통해 인턴으로 활동하게 된 차라투에서 1주차 동안 학습한 내용에 대해 공유합니다.
Notion과 Oopy를 사용해 개편한 당사 홈페이지의 구축 논의 사항과 장·단점을 설명하였습니다.
4월에 이어 삼성서울병원 심혈관중재실에 서비스중인 shiny 환자데이터 입력웹을 소개합니다. 본 내용은 차라투가 후원하는 Shinykorea 10월 밋업에서 발표할 예정입니다.
Zarathu 앱에 적용할 예정인 구글 로그인에 대해 소개합니다.
R 활용 웹기반으로 공공빅데이터 분석지원한 경험을 공유합니다. 본 내용은 “대한상부위장관 · 헬리코박터학회 주관 2021 위원회 워크숍” 에서 발표할 예정입니다.
R 활용 의학연구지원경험을 공유합니다. 본 내용은 “Be a data scientist - major actor in the future research” 라는 제목으로 사단법인 헬리코박터 마이크로바이옴 연구회 워크숍에서 발표할 예정입니다.
Follow up assignment of ShinyProxy lecture
지금까지 창업지원사업 도전했던 경험을 공유합니다. 본 내용은 차라투가 후원하는 Shinykorea 7월 밋업에서 발표할 예정입니다.
최근 Zarathu 공식 홈페이지에 추가한 channel.io 서비스 관련 적용 후기입니다.
삼성서울병원 심혈관중재실과 개발 중인 shiny 환자데이티 입력웹 개발 현황을 공유합니다. 본 내용은 Zarathu가 후원하는 Shinykorea 4월 밋업에서 발표할 예정입니다.
서울시 감염병연구센터 자문으로 코로나 수리모델링을 수행한 경험을 정리했습니다. 본 내용은 2월 Shinykorea 밋업에서 발표할 예정입니다.
Kaplan-meier curve, 비례위험가정 확인, Time-dependent analysis 그리고 모수적 생존분석을 중심으로 R 코드를 정리했습니다. 본 내용은 성균관의대 사회의학교실 특강에서 실습할 예정입니다.
RStudio와 Shiny-server 가 포함된 Docker image 이용, 새로 서버 구축할 때마다 재설치하는 번거로움을 없앴습니다. 본 내용은 Shinykorea 10월 밋업에서 발표할 예정입니다.
차라투 업무 소개입니다. 본 내용은 영남대학교 “의사과학자 역량 배가 프로젝트” 에서 발표할 예정입니다.
메타분석 ShinyApps 만든 후기를 정리하였습니다. 본 내용은 Shinykorea 8월 밋업에서 발표할 예정입니다..
의학 연구에서 사용하는 선형/로지스틱 회귀분석과 Cox 비례위험모형을 소개합니다. 본 내용은 삼성서울병원 정신건강의학과 교육에 이용될 예정입니다.
의학 연구에서 Table 1 에 활용되는 기술통계를 정리하였습니다. 본 내용은 삼성서울병원 정신건강의학과 교육에 이용될 예정입니다.
올해 만들었던 ShinyApps 를 간단히 정리하였습니다. 본 내용은 6월 shinykorea 밋업에서 발표할 예정입니다.
%>% 연산자와 dplyr 패키지를 중심으로, 최근 R 문법 트렌드인 tidyverse 스타일을 정리했습니다. 본 슬라이드는 서울대병원 진단검사의학과 선생님들의 교육에 쓰일 예정입니다.
R 기본 문법과, 보험공단 샘플 데이터를 이용한 데이터 매니지먼트 방법을 정리하였습니다. 본 내용은 서울대병원 진단검사의학과 선생님들의 교육에 쓰일 예정입니다.
일본 R 밋업 중 하나인 TokyoR 중 shiny 특집을 리뷰하였습니다. 본 내용은 차라투가 후원하는 Shinykorea 3월 밋업에서 발표할 예정입니다.
R과 shiny로 웹 애플리케이션을 만든 경험을 소개합니다. 본 내용은 디시인사이드가 후원하는 프로그래밍 갤러리 컨퍼런스 2020 에서 발표할 예정입니다.
RSelenium 으로 웹크롤링을 하면서 얻은 팁을 공유합니다. 본 내용은 Zarathu가 후원하는 Shinykorea 1월 밋업에서 발표할 예정입니다.
의료데이터 분석가가 되기까지의 경험을 슬라이드로 공유합니다. 본 내용은 동국대학교 의생명공학과 세미나에서 발표할 예정으로, 초청해주신 김진식 교수님께 감사드립니다.
Shiny 기초학습을 위한 강의 슬라이드와 실습파일입니다. 본 내용은 “서울IT직업전문학교 빅데이터 사이언스 실무자 양성과정” 에서 쓰일 예정입니다.
맞춤형 의학연구 앱을 만들고, 그것을 패키지로 만들어 CRAN에 배포한 경험을 슬라이드로 정리하였습니다. 본 내용은 R User Conference in Korea 2019(RUCK 2019)에서 발표하였습니다.
R을 이용, 공단/심평원 빅데이터와 국건영 자료를 분석한 경험을 슬라이드로 정리하였습니다. 본 내용은 을지의대 학술원 특강에서 발표할 예정입니다.
Shiny 의 로그인 기능 추가방법을 리뷰하고, useR! 2019 에서 소개된 shinymanager 패키지 사용법을 설명하였습니다. 본 내용은 Zarathu가 후원하는 Shinykorea 9월 밋업에서 발표할 예정입니다.
이전 글 “선형모형의 다차원공간으로의 확장” 의 추가 제안으로, 선형모형의 무대를 허수축(Imaginary Axis)을 포함한 휘어진 다차원공간으로 확장, Inverted U-shape 관계를 선형관계로 재해석하였습니다.
괴델(Kurt Gödel)의 불완전성 정리가 나온 배경을 소개하고 증명의 핵심 아이디어를 수학과 메타수학(meta-mathematics), 괴델수(Gödel number), 그리고 메타수학의 수학화 3가지로 나누어 설명하였습니다. 본 내용은 “제주대학교 경영정보학과 산업·직무 특화 전문가 특강” 에서 발표할 예정입니다.
의학연구를 지원하면서 다양하게 R을 활용했던 경험을 슬라이드로 정리하였습니다. 본 내용은 을지의과대학교 5월 EMBRI 세미나와 CRScube 6월 세미나에서 발표할 예정입니다.
Shiny와 R Markdown을 활용, 의학연구를 지원했던 경험을 슬라이드로 정리하였습니다. 본 내용은 차라투(주)가 후원하는 Shinykorea 5월 밋업에서 발표할 예정입니다.
법인 설립 후 세무기장 앱 머니핀(MoneyPin)을 활용, 직접 세무/회계를 처리하였습니다. 3월말 법인세까지 납부하면서 한 사이클을 경험했다고 생각하여 후기를 공유합니다.
개인 PC에서 직접 ShinyApps를 이용할 수 있도록, RStudio Addins을 포함한 R 패키지를 만들어 CRAN에 배포신청했으나 실패한 경험을 정리하였습니다. 본 내용은 Anpanman이 후원하는 Shinykorea 2월 밋업에서 발표할 예정입니다.
성균관의대 사회의학교실 주관 가습기 살균제 연구 세미나에 참석, 자기 자신을 대조군으로 이용하는 연구 방법론 중 하나인 self-controlled case series (SCCS)를 리뷰하고 R로 실습을 진행할 예정입니다. 강의 슬라이드를 미리 공유합니다.
성균관의대 “의사의 길” 학부 강의에서 진료실 밖 의사로서의 경험을 의대생들과 공유할 예정입니다. 발표 슬라이드를 미리 공유합니다.
파일을 읽는 readr, 읽기 쉬운 코드를 만드는 %>% 연산자, 데이터를 다루는 dplyr 그리고 반복문을 다루는 purrr 패키지를 중심으로 tidyverse 생태계에서 데이터를 다루는 방법을 정리하였습니다.
중앙보훈병원 정신건강의학과에서 강의한 내용으로, 의학 연구에 필요한 기술 통계(descriptive statistics)를 정리하고 웹 애플리케이션과 Rstudio Addins을 이용하여 실습하였습니다.
유전율(heritability)은 어떤 형질의 유전적인 측면을 정량적으로 설명하는 유용한 지표이나 이분형 형질의 경우 해석이 어렵습니다. 이 때는 Sibling recurrence risk가 직관적인 지표이나, 유병률 정보가 필요하고 다른 변수의 보정이 어려운 문제가 있습니다. 본 연구에서는 흔히 쓰는 OR scale을 이용, 이분형 변수에서 직관적이고 다른 변수의 보정도 가능한 유전율 지표를 제안합니다.
아인슈타인의 일반상대성이론은 태양 근처에서 빛이 휘어지는 현상을 빛이 아닌 시공간이 휘어지는 것으로 해석합니다. 비슷한 아이디어를 통계학에 적용하여 U-shape 관계를 휘어진 다차원 공간에서의 선형모형으로 재해석하였습니다.
R User Conference in Korea 2018(RUCK 2018)에서 발표했던 내용입니다.
P value의 가장 큰 문제는 샘플 숫자만 늘리면 아무리 작은 차이라도 유의미한 결과로 만들 수 있다는 것입니다. 이는 대부분의 연구에서 차이가 정확히 0이라는 비현실적인 귀무가설을 사용하기 때문에 생기는 문제인데, 실제 차이가 정확히 0이라고 생각하는 사람은 아무도 없으며 아무도 주장하지 않는 것을 반박해 봐야 유용한 결론을 얻지 못합니다. 본 연구에서는 귀무가설에 uncertainty 개념을 추가하여 가설검정방법을 재정의하였습니다.
Welcome to Anpanman!