" />
class: center, middle, inverse, title-slide .title[ # 의료데이터분석가 성장기 ] .subtitle[ ## 절대 쓸모있는 사람이 되지 마라 ] .author[ ### 김진섭;
<i class="fab fa-github faa-float animated "></i>jinseob2kim
] .institute[ ### 차라투(주) ] --- layout: true <div class="my-footer"><span><a href="https://www.zarathu.com">Zarathu Co.,Ltd</a>                             <a href="https://github.com/jinseob2kim">김진섭</a></span></div> --- # Executive summary - 수학올림피아드 + 의대 = 의학통계(예방의학) - 의학통계 + IT기업(삼성전자 무선사업부) = 창업(의학통계) - 연매출 1.5억 + 파트타임 job = 소상공인(투자없이생존) - 소상공인 + 정부지원(사업비, 사무실) = 스타트업 - 의학연구지원 `\(\rightarrow\)` 임상시험분석시장 진출 -- - 천하3분지계: 법학, 의학, 종교 - 사람을 살리고 널리 인간을 이롭게하는 **홍익인간** - 김옥균, 맹상군, 유비 -- - 문제해결 `\(\rightarrow\)` 문제정의 `\(\rightarrow\)` **아름다움** `\(\rightarrow\)` **신내림** --- class: center, middle # 창업하기까지 --- # 수학올림피아드 수학과만 생각했는데 의대 입학 - 1학기 수시: 올림피아드 전형 -- 의대 적응 못함 - 6년內 면허취득 마지노선 - 인턴 탈락 -- 학원강사 - 본과 2학년말부터 대치 위OO. - 30살까지 수원 프OOOO, 대치 위OO. --- # 1학기 수시 > 지금은 없어졌는데 학부 입학전형 중에 2001년부터 올림피아드 경시대회 특기자 전형이 있었어요. 당시 제가 2000년에 입학하고 부학장님께 올림피아드 경시대회 수상자들 중 의과대학에 와서 재능을 발휘하면 굉장한 시너지를 낼 인재들이 숨어있다고 건의를 했었는데, 좋게 받아들여져서 처음으로 해당 제도가 생겼고 그때 들어왔던 친구들이 좋은 성과를 내서 인원이 늘어나기도 했던 기억이 있어요. 제 의견이 정책으로 이어지는 과정을 직접 경험하며, 지금의 예방의학 정책 자문에 대한 꿈이 생겨났을 수도 있겠네요.(웃음, 성균관의대 사회의학 김종헌 교수) --- # 예방의학 전공의 - [서울대 보건대학원](http://health.snu.ac.kr/node/104) 예방의학교실 - **임상의학 아님**. 관악캠퍼스 소속으로 타 과와의 연계가 장점. 석사 및 박사 수료 - 서울대 보건대학원 [유전체역학 연구실](http://snugepi.snu.ac.kr/) - 유전체 데이터 분석 방법론 연구. [R](https://www.r-project.org/), [python](https://www.python.org/), 리눅스 이용 시작. 지인 상대로 통계 자문 시작. --- # [삼성전자](http://health.chosun.com/news/dailynews_view.jsp?mn_idx=165897) 박사과정과 응급실 당직 병행 중, 지도교수님 통해 우연히 제의받음. - 면접 후 2년 3개월 계약직으로 입사. DMC 연구소로 입사 10개월만에 무선사업부로 이동. - 연구소에서는 디지털헬스 선행 기술 개발팀, 사업부에서는 **삼성헬스** 앱 개발팀. <center> <a href="https://newsimg.sedaily.com/2018/08/05/1S38RAKVMO_1.jpg/"><img src="https://newsimg.sedaily.com/2018/08/05/1S38RAKVMO_1.jpg" width=50%></a> </center> --- # 삼성전자에서 만난 의사. .large[ - 중앙의대卒, 진단검사의학 전문의, 現 근무 - 연세의대 03학번(WELT 대표), 인턴中 무선사업부 입사, 사내벤처 1호. - 美 소아과 의사 ] --- # 사내벤처 C-lab .large[ 사내 우수 아이디어 선발, 1년 과제 진행後 스핀오프 결정. ] .center[  ] 거북목관리 안경테, 1day 통계지원 서비스로 지원했으나 광탈. --- # 퇴사 .large[ 2년차 중반 퇴사 결심. - 한국수력원자력 탈락. - 한국투자파트너스, 스틱인베스트먼트 VC 탈락. 의료 쪽 일을 병행하며 의대 입시컨설팅에 도전하기로 함. ] -- .large[ 의대 입시 컨설팅은 시작도 못함, 박사과정을 마치기로 결정. ] --- # 박사과정 .large[ 물리학에 빠짐. 일반상대성이론과 양자역학에 감명받음. - 이론연구자가 되기로 결심하고 통계이론 논문을 작성. - 해외 논문 게재 실패. 박사 학위도 어려움. - 결국 자체 [블로그](https://blog.zarathu.com/posts/2018-11-08-mdlm/)에 게재. ] --- <center> <img src="Untitled design (1).png" width=80%></a> </center> --- # 법인설립 연구는 안되는데 창업 공모전은 선정되기 시작. - ['18년 창업선도대학 (예비)창업팀](https://www.k-startup.go.kr/homepage/businessManage/businessManageFunction.do?sid=111&itemSeq=1060): 블록체인 기반 유전체-건강 빅데이터 구축 및 정밀 의학 솔루션. - [심평원, 보험공단 주최 보건의료빅데이터를 활용한 창업아이디어 공모전](http://www.hira.or.kr/bbsDummy.do?brdBltNo=9598&brdScnBltNo=4&pageIndex=1&pgmid=HIRAA020041000100): 맞춤형 의학연구 애플리케이션 -- 창업하기로 결심, 블록체인은 엄두가 나지 않음. - 배운게 도둑질, 원래 하던 통계지원을 하기로 결정하고 1인 법인 설립. - 처음엔 선배, 동기들과 그들의 지인들이 주 고객. - 現 맞춤형/공개 통계웹, 통계컨설팅, 공공빅데이터 분석이 주 업무 --- class: center, middle # 창업 후 ~ 現 --- # 맞춤형 통계웹  --- <img src="openstat.png" width=100%> --- # [공개 통계웹](https://openstat.ai)  --- # 주요 계약 - 대한심혈관중재학회 [COBIS III 레지스트리](https://clinicaltrials.gov/ct2/show/NCT03068494) 분석: [추가계약](http://pf.kakao.com/_XsuxgC/48388190) - 서울성모병원 [COREA-AMI II 레지스트리](https://clinicaltrials.gov/ct2/show/NCT02806102) 분석: [10개 연구 계약](http://pf.kakao.com/_XsuxgC/48043955) - 삼성서울병원 [공통데이터모델(CDM)](http://www.feedernet.org/html/?pmode=cdmdrn) 분석: [심평원 코로나데이터](https://hira-covid19.net/) 분석 중 - 강동성심병원 CDM 분석지원: 공단표본데이터 분석 중 - 경기도감염병관리지원단 코로나 대시보드 with Shinykorea: [최종보고](https://shinykorea.github.io/corona-activityrecord) - 삼성서울병원 이식외과 육종(sarcoma) 데이터 분석: [5개 연구 계약](http://pf.kakao.com/_XsuxgC/51701089) - 해운대백병원 정신질환 네트워크분석: [논문 5편](http://pf.kakao.com/_XsuxgC/52664370) 게재 - 성균관의대 환경역학연구실 [미세먼지 대시보드](http://pf.kakao.com/_XsuxgC/43627405) - [삼성서울병원 정신과 통계자문계약](http://pf.kakao.com/_XsuxgC/55192190) - [서울대병원 순환기내과 통계자문계약](http://pf.kakao.com/_XsuxgC/55577702) - 기타: 제약/바이오, 임상시험SW, 디지털치료기기 스타트업 등 --- # 주요 논문 성과 .large[ SCI 논문 200건 지원 ] <center> <img src="https://jinseob2kim.github.io/lecture-general/statreview/paper.png" width=80%></a> </center> --- # NEJM .large[ 심혈관중재시술 전략비교 > 삼성서울병원 이주명, 최기홍 교수님을 도와 두 심혈관중재시술(PCI) 전략을 비교, 다기관 고려한 stratified cox 와 competing risk analysis 를 수행하고 관련 통계자문을 제공하였습니다. 본 연구는 New England Journal of Medicine(NEJM, IF 176.079) 에 게재되었습니다. ] <center> <img src="https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fbf058199-3a3a-49ab-990b-66dc135fb739%2FUntitled.png&blockId=5f2b13d8-6953-411a-a245-73e0e8d1afc7" width=80%></a> </center> --- # LANCET .large[ Statin 병용요법 비열등성검정 > 연세의료원 심장내과 홍명기교수 팀을 도와 high-intensity statin 단일요법과 ezetimibe + moderate-intensity statin 병용요법을 비교, (1)비열등성검정 샘플수 계산 및 통계검토와 (2)리비전 통계분석을 지원하였습니다. 본 연구는 The Lancet(IF 202.731) 에 게재되었습니다 ] <center> <img src="http://k.kakaocdn.net/dn/boaUap/btrHDQhI2j1/zVeZ4Mv3DkybiLejdtJ5D1/img_xl.jpg" width=80%></a> </center> --- # JAMA Statin 치료전략 비교 > 연세의료원 심장내과 홍명기교수 연구팀을 도와 LODESTAR (Low-Density Lipoprotein Cholesterol-Targeting Statin Therapy Versus Intensity-Based Statin Therapy in Patients With Coronary Artery Disease) Trial 을 분석, statin 치료전략을 비교하고 리비전에 필요한 통계자문을 제공했습니다. 본 연구는 JAMA(IF 157.3) 에 게재되었습니다. <center> <img src="https://oopy.lazyrockets.com/api/v2/notion/image?src=https%3A%2F%2Fs3-us-west-2.amazonaws.com%2Fsecure.notion-static.com%2Fdbaf5241-d562-4c7c-a957-d73fd34983da%2Fimg_l.jpg&blockId=b3ecef97-63d8-4f32-b8dc-dfd392734543" width=80%></a> </center> --- # 병원고객 <center> <img src="customer1.png" width = 100%></a> </center> - 강동/동탄성심, 상계/일산백, 길, 고대안암병원과 연단위 계약 체결 --- # 임상시험시장 진출 - 신라젠과 연단위 계약 체결, EverEX 확증임상시험 승인 지원 <center> <img src="customer2.png" width = 80%></a> </center> --- # 정부지원사업 선정 <center> <img src="gv.jpg" width=100%></a> </center> --- # 22년 IITP 연구개발과제 선정 .large[ 2년 10.5억 with 앤틀러, 파이디지털헬스케어 ] <center> <img src="http://k.kakaocdn.net/dn/bsgueW/btrzkqLQ3H2/qQBLFHw769HWkRJyeRWRG1/img_l.jpg" width=70%></a> </center> --- # R&D: statgarten .large[ 총괄책임자 - with 파이디지털헬스케어, 앤틀러 ] <center> <img src="https://jinseob2kim.github.io/lecture-general/APPFGH2022/statgarten.png " width=80%></a> </center> --- # 22년 창업도약패키지 선정 .large[ 1억 ] <center> <img src="http://k.kakaocdn.net/dn/cQa4s2/btrESX34HXo/GJZOCzNJwzo4B4czmb2tKk/img_xl.jpg" width=50%></a> </center> --- # 심평원 공통데이터모델 변환 용역 <center> <img src="http://k.kakaocdn.net/dn/0lm3Q/btrL5xcRF86/3NMzYiiKRwq14HUhDKqXG0/img_l.jpg" width=80%></a> </center> --- # 23년 공개SW기술확산사업 (의학연구위한) 오픈소스 SaaS 의료데이터 분석서비스 - NIPA(7개월, 2억) <center> <img src="nipa.png" width=60%></a> </center> --- # 창업성장기술개발 디딤돌 .large[ 의학 연구를 위한 의료 데이터 분석 웹 - 중기부(1년, 1.2억) ] <center> <img src="didim.png" width=90%></a> </center> --- # 가상환경 의료기술 개발사업 "더 나은 환자 경험을 위한 클라우드 기반 디지털 의료서비스 모델 개발 및 실증" - 보건복지부(5년 50억원) - 주관: 연세대학교 산학협력단 - 공동: 분당차병원, 원주 연세대학교, 레몬헬스케어, 월드버텍, 차라투 - 차라투는 "AI 챗봇기반 사전 예진실 서비스" 담당 <center> <img src="ys.png" width=60%></a> </center> --- # 24년 글로벌협업프로그램 "마중" "신약 임상시험 특화 분석서비스" - 중기부 및 마이크로소프트 (최대 2억, 평균 1.25억) - Azure 이용 SaaS 전환, 생성형AI 보고서 생성기술, 일본진출 <center> <img src="スクリーンショット 2024-04-18 午前11.55.45.png" width=60%></a> </center> --- # 재무 & 팀 .large[ 최근 2년간 평균 매출 성장률 100% - 21년 1.45억 -> 22년 2.74억 -> 23년 5.82억(원) - 창업 후 투자, 대출 없이 운영중 팀원 8명(평균나이 27세), 인턴 4명(의사 2명) - R 패키지 개발자 2명, 백엔드 개발자 1명, 분석가 3명, 의사 1명, 마케팅 1명 - 100% 원격근무, 재량근로제 계약 ] --- class: center, middle # 핵심기술 R --- # 프로그램 개발, 블로그 운영 .large[ [R](https://www.r-project.org/) packages - [jstable](https://github.com/jinseob2kim/jstable): 논문용 테이블 만들기 - [jskm](https://github.com/jinseob2kim/jskm): 생존분석 그림 만들기 - [jsmodule](https://github.com/jinseob2kim/jsmodule): 웹에서 하는 통계분석 ] -- .large[ 데이터 분석용 가상머신([docker](https://www.docker.com/) image) - [rshiny](https://github.com/jinseob2kim/docker-rshiny): [Rstudio](https://www.rstudio.com/)와 [shiny server](https://www.rstudio.com/products/shiny/shiny-server/) 가 설치된 이미지. ] -- .large[ [블로그](https://blog.zarathu.com/), 카카오톡 오픈채팅방- 프로그래밍 갤러리 R 유저 모임 ] --- <center> <img src="blogetc.png" width=100%></a> </center> --- # 150,000 다운로드 <center> <img src="CRAN20241011.png" width=80%></a> </center> --- # 발표: 개발환경구축 <center> <img src="RUCK2018.jpg" width=80%></a> </center> --- # 발표: R패키지 개발 후기 <center> <img src="RUCK2019.jpg" width=80%></a> </center> --- # 공부모임: Shiny 밋업 .large[ https://github.com/shinykorea/Meetup - 월 1회 공부내용 공유. 42회 진행 - 의료/유전학/축산/반도체/게임/IPTV/회계 등 다양한 분야 사람들이 모임. - **경기도 코로나 대시보드 공동작업** - 21년 공개SW기반 **커뮤니티** 지원사업, **韓中日 공개SW** 국제협력 강화 TASK 선정 ] --- # 경기도 코로나 [병상관리 대시보드](https://github.com/shinykorea/corona-sickbed)  --- # 프로그래밍갤러리 R 유저모임 .large[ 디시인사이드 프로그래밍 갤러리 고정닉 활동: **[김옥균](https://gallog.dcinside.com/jinseob2kim)** 카카오톡 오픈채팅방 운영: 닉네임 大逆不道玉均 ] <center> <img src="kakao_open.jpg" width=25%></a> </center> --- class: center, middle # R 데이터분석 --- # [data.table](https://blog.zarathu.com/posts/2022-02-11-datatable/) .large[ 가장 빠른 스피드, 빅데이터용 필수패키지 - 심평원/공단분석 필수. - 파일 가장 빨리 읽고 쓰는 [fst](https://www.fstpackage.org/)와 찰떡궁합 - 멀티코어 지원 ] <center> <a href="https://github.com/fastverse/fastverse"><img src="https://pbs.twimg.com/media/E8mHra4VgA0vnY_.jpg" width=100%></a> </center> --- # [R plot](https://blog.zarathu.com/posts/2022-03-25-graph/) .large[ [ggplot2](https://ggplot2.tidyverse.org/) > Base: 사실상 표준 - [ggpubr](https://partrita.github.io/posts/ggpubr/) : 연구용 그림 + p-value 최적화 - [highcharter](https://jkunst.com/highcharter/): 반응형 그림, 상업용은 유료 - [jskm](https://github.com/jinseob2kim/jskm): 자체 개발 kaplan-meier 패키지 ] <center> <a href="https://github.com/jinseob2kim/jskm"><img src="https://github.com/jinseob2kim/jskm/blob/master/man/figures/README-unnamed-chunk-4-2.png" width=50%></a> </center> --- # PPT export: [officer](https://davidgohel.github.io/officer/) .large[ 그림 직접수정위해 반드시 PPT with 벡터그래픽 필요 ] ```r library(rvg);library(officer) editable_graph <- dml(ggobj = gg_plot) doc <- read_pptx() doc <- add_slide(doc) doc <- ph_with(x = doc, editable_graph, location = ph_location_type(type = "body") ) print(doc, target = "reports/rvg.pptx") ``` <center> <a href="https://ardata-fr.github.io/officeverse/reports/rvg.pptx"><img src="https://ardata-fr.github.io/officeverse/static/reports/rvg.png width=40%></a> </center> --- # 공단/심평원분석 전략 .large[ 공단/심평원은 SAS 파일, 그러나 R로 대부분 가능 - [haven](https://haven.tidyverse.org) 패키지로 sas7bdat 읽기, but 느림 - csv 또는 fst로 변환하여 R로 빨리 읽기 - SAS는 R서버 RAM보다 큰 데이터 다룰 때만: 크게크게 쳐냄 - 반출 테이블: xlsx 하나에 탭들로 저장, [openxlsx](https://github.com/ycphs/openxlsx) 패키지 이용 - 반출 그림: pptx 하나에 여러 슬라이드로 저장. [officer](https://davidgohel.github.io/officer/) ] --- # [openxlsx](https://github.com/ycphs/openxlsx) ```r # create workbook wb <- createWorkbook() addWorksheet(wb = wb, sheetName = "htwt") writeData(wb = wb, sheet = "htwt", x = htwt) addWorksheet(wb = wb, sheetName = "smk") writeData(wb = wb, sheet = "smk", x = smk, rowNames=T) saveWorkbook(wb, "tables.xlsx", overwrite = T) ``` .large[ [반출 파일 실습](https://github.com/jinseob2kim/R-skku-biohrs/blob/main/lecture/dataexport.pptx?raw=true) ] --- # CDM(OMOP) with R .large[ CDM 분석 모든과정은 [R패키지](https://github.com/OHDSI)로 구현됨. ] <center> <img src="https://www.ohdsi.org/wp-content/uploads/2020/06/methodsLibrary.png" width=70%></a> </center> --- # 분석코드, 결과도 R패키지 .large[ 연구설계, 분석방법이 포함된 자체 R패키지가 코드공유 표준. - R패키지를 여러 기관에서 실행 ] https://github.com/zarathucorp/RanitidineCancerRisk -- .large[ 분석결과는 R Shiny로 - 실행결과를 R기반 웹애플리케이션으로 표현 - 분석코드에 웹코드도 포함되어있음. ] --- # 통계 .large[ 데이터 형태에 따라 - 일반, 반복측정, 표본추출, Propensity/IPTW 생존분석: Time-dependent analysis, landmark analysis 메타분석: [meta](https://bookdown.org/MathiasHarrer/Doing_Meta_Analysis_in_R/), [자체 개발앱](https://openstat.ai/app/meta-analysis/) 시계열분석: [fpp3 교과서](https://otexts.com/fpp3/)- ARIMA, [prophet](https://facebook.github.io/prophet/) ML general: [caret](https://topepo.github.io/caret/index.html) Non-linear(GAM) model: [mgcv](https://www.maths.ed.ac.uk/~swood34/mgcv/) ] --- # 분석(X), 결과테이블(O) ```r tb <- jstable::CreateTableOneJS(c("sex", "age", "status", "time"), strata = "rx", data = colon, nonnormal = "time") kable(tb$table[, 1:6]) ``` | |level |Obs |Lev |Lev+5FU |p |test | |:-------------------|:-----|:-------------------------|:-------------------------|:-------------------------|:------|:-------| |n | |630 |620 |608 | | | |sex (%) |0 |298 (47.3) |266 (42.9) |326 (53.6) |0.001 | | | |1 |332 (52.7) |354 (57.1) |282 (46.4) | | | |age | |59.45 ± 11.96 |60.11 ± 11.64 |59.70 ± 12.25 |0.608 | | |status (%) |0 |285 (45.2) |287 (46.3) |366 (60.2) |<0.001 | | | |1 |345 (54.8) |333 (53.7) |242 (39.8) | | | |time (median [IQR]) | |1506.00 [496.75, 2231.00] |1562.50 [498.75, 2332.00] |2066.00 [700.75, 2450.00] |<0.001 |nonnorm | --- # 표본추출(국건영) ```r nhanesSvy <- svydesign(ids = ~ SDMVPSU, strata = ~ SDMVSTRA, weights = ~ WTMEC2YR, nest = T, data = nhanes) tb <- jstable::svyCreateTableOneJS(c("HI_CHOL", "agecat"), strata = "RIAGENDR", data = nhanesSvy) kable(tb$table[, 1:5]) ``` | |level |1 |2 |p |test | |:-----------|:--------|:------------------|:------------------|:-----|:----| |n | |134944553.9 |141591892.0 | | | |HI_CHOL (%) |0 |112307738.4 (89.9) |114402926.5 (87.7) |0.010 | | | |1 |12579208.9 (10.1) |16056036.4 (12.3) | | | |agecat (%) |(0,19] |29299546.1 (21.7) |28150760.5 (19.9) |0.001 | | | |(19,39] |40497613.1 (30.0) |40640361.5 (28.7) | | | | |(39,59] |41053579.4 (30.4) |42817044.0 (30.2) | | | | |(59,Inf] |24093815.3 (17.9) |29983725.9 (21.2) | | | --- # 회귀분석류 table 만들기 ```r glm_gaussian <- glm(mpg~cyl + disp, data = mtcars) jstable::glmshow.display(glm_gaussian, decimal = 2)$table %>% kable ``` | |crude coeff.(95%CI) |crude P value |adj. coeff.(95%CI) |adj. P value | |:----|:-------------------|:-------------|:-------------------|:------------| |cyl |-2.88 (-3.51,-2.24) |< 0.001 |-1.59 (-2.98,-0.19) |0.034 | |disp |-0.04 (-0.05,-0.03) |< 0.001 |-0.02 (-0.04,0) |0.054 | ```r glm_binomial <- glm(vs~cyl + disp, data = mtcars, family = binomial) jstable::glmshow.display(glm_binomial, decimal = 2)$table %>% kable ``` | |crude OR.(95%CI) |crude P value |adj. OR.(95%CI) |adj. P value | |:----|:----------------|:-------------|:----------------|:------------| |cyl |0.2 (0.08,0.56) |0.002 |0.15 (0.02,1.02) |0.053 | |disp |0.98 (0.97,0.99) |0.002 |1 (0.98,1.03) |0.715 | [더 살펴보기](https://github.com/jinseob2kim/jstable) --- # Propensity score .large[ 그룹간의 baseline 맞춰주는 방법 - **Matching**: 적당한 사람들을 뽑음, N loss - **IPTW(Inverse probability treatment weighting)**: 사람마다 가중치를 다르게 줌, N loss 無 - [MatchIt](https://cran.r-project.org/web/packages/MatchIt/vignettes/MatchIt.html): 2그룹 PS matching, IPTW - [twang](https://cran.r-project.org/web/packages/twang/index.html) : 3그룹 이상 IPTW ] --- # [생존분석 심화](https://blog.zarathu.com/posts/2020-10-29-survivalpractice/) **Time-dependent coefficients** - 비례위험가정 깨질 때, Landmark analysis **Time-dependent covariate** - 관찰 시작 후 covariate 상태가 바뀔때 (ex: 약물복용) 예: 피부질환 진단 후(Indexdate) 약물치료 여부에 따른 Outcome - **Indexdate ~ 약물치료일, 약물치료일 ~ F/U 마지막날** 한 사람의 데이터를 2개로 나눔. Competing risk analysis: 최신 `survival` 패키지 기본옵션. - 심혈관질환 발생할 사람이었는데 죽어서 못본다? - 심혈관질환: outcome, 사망: competing risk --- # Landmark analysis ```r fit <- survfit(Surv(time,status)~rx, data=colon) jskm::jskm(fit, mark = F, surv.scale = "percent", pval =T, table = T, cut.landmark = 500, showpercent = T) ``` <img src="index_files/figure-html/unnamed-chunk-6-1.png" width="50%" style="display: block; margin: auto;" /> --- # Meta analysis .large[ [meta](https://github.com/guido-s/meta/) 패키지가 표준 - Forest/Drapery plot, Sub-group analysis - Random/Fixed effect - Publication bias: Funnel plot/Trim & fill ] [자체 개발앱](https://openstat.ai/app/meta-analysis/) --- # 시계열 .large[ [fpp3](https://otexts.com/fpp3/) 교과서 추천 - [tsibble](https://tsibble.tidyverts.org/): 시계열 데이터전처리 - [fable](https://fable.tidyverts.org/): ARIMA 계수 자동추정, 간단한 시계열 인공신경망 - [prophet](https://facebook.github.io/prophet/): Meta 가 개발한 Additive model 기반 패키지 ] <center> <a href="https://www.youtube.com/watch?v=6v3_AsbhqrE"><img src="https://i.ytimg.com/vi/6v3_AsbhqrE/maxresdefault.jpg" width=40%></a> </center> --- # ETC .large[ Non-linear(GAM) model - [mgcv](https://www.maths.ed.ac.uk/~swood34/mgcv/) 패키지가 표준 - [강의자료](https://jinseob2kim.github.io/R-skku-biohrs/gam/#/title-slide) ML general - [caret](https://topepo.github.io/caret/index.html) ] --- # [Github](https://github.com/) .large[ 코딩하는 사람은 무조건 써야함. R보다 더 중요 - 코드 관리, 모든 중간기록 보관 - 오픈소스 SW(예: R패키지) 는 대부분 Github 프로젝트 - 포트폴리오 관리: 사실상의 이력서 - 간단한 홈페이지 운영 가능: 본 슬라이드도 Github 호스팅 ] --- class: center, middle # 서비스 --- # [R](https://www.r-project.org/)의 확장 .large[ [R](https://www.r-project.org/)은 이제 단순한 통계프로그램이 아님. * [Quarto](https://quarto.org): 논문과 발표자료를 [R](https://www.r-project.org/) 에서 직접 만듦. [과거 정리 내용](https://blog.zarathu.com/posts/2019-01-03-rmarkdown/) ] -- .large[ * [blogdown](https://github.com/rstudio/blogdown): 홈페이지도 만들 수 있음. 당사 홈페이지도 이것과 [Quarto blog](https://quarto.org/docs/websites/website-blog.html) 로 제작. * [Quarto book](https://quarto.org/docs/books/): 책도 직접 만들 수 있음. ] -- .large[ * [Shiny](https://shiny.rstudio.com/), [Shiny Server](https://www.rstudio.com/products/shiny/shiny-server/): 서버 구축하고 웹기반 앱을 만들 수 있음. 간단한 Shiny 앱들은 Shinyapps.io 에서 무료호스팅. ] -- 법인 설립 후 모든 작업에 [R](https://www.r-project.org/)을 이용함. --- # 논문 .large[ [R](https://www.r-project.org/)에서 글, 그림, 테이블, 참고문헌까지 직접 작성. * [rticles](https://github.com/rstudio/rticles): 대부분 학술지의 템플릿을 포함. <img src="https://bookdown.org/yihui/rmarkdown/images/rticles-templates.png" width="50%" style="display: block; margin: auto;" /> ] [준비하던 박사논문](https://blog.zarathu.com/posts/2018-11-08-mdlm/) --- # 발표 슬라이드 .large[ 논문쓸 때 이용했던 R 코드 활용, 빠르게 발표 슬라이드 제작 가능. * [기본 템플릿](https://rmarkdown.rstudio.com/lesson-11.html), [xaringan](https://github.com/yihui/xaringan) 패키지: 이 슬라이드도 [xaringan](https://github.com/yihui/xaringan)으로 제작. <img src="https://user-images.githubusercontent.com/163582/53144527-35f7a500-3562-11e9-862e-892d3fd7036d.gif" width="70%" style="display: block; margin: auto;" /> 포스터: [posterdown](https://brentthorne.github.io/posterdown_html_showcase/), [pagedown](https://pagedown.rbind.io/poster-relaxed) ] --- # 발표 슬라이드: revealjs .large[ 22년 10월 현재, 새로만드는 슬라이드는 [revealjs](https://quarto.org/docs/presentations/revealjs/)로 작업 <iframe src="https://jinseob2kim.github.io/lecture-general/APPFGH2022" width="100%" height="300px"></iframe> ] --- # 홈페이지 .large[ [blogdown](https://github.com/rstudio/blogdown), [Quarto blog](https://quarto.org/docs/websites/website-blog.html): [깃허브](https://pages.github.com/) 통해 무료 웹호스팅 가능. <img src="https://www.storybench.org/wp-content/uploads/2019/05/blogdown-new-site-e1557149319624-730x457.png" width="80%" style="display: block; margin: auto;" /> [홈페이지](https://github.com/zarathucorp/zarathu), [블로그](https://github.com/zarathucorp/blog) ] --- # 웹 앱 .large[ [Shiny](https://shiny.rstudio.com/): [R](https://www.r-project.org/) 코드만으로 웹앱 제작 ] <img src="ps.png" width="1764" style="display: block; margin: auto;" /> --- class: center, middle # Real World data --- # Why RWD? 기존 임상시험은 RCT - 연구를 위해 세팅된 환경에서 환자를 새로 모집하여 **랜덤**분배 - 인과성 인정받을 수 있으나, 비싸고 오래걸림 <center> <img src="FLAVOUR.png" width=80%></a> </center> --- # RWD, RWE 존재하는 데이터로 RCT만큼의 인과성을 얻을 수 있을까? - N수가 크다는 장점이 있음(심평원/공단데이터, 다국가데이터) - Propensity score 매칭, IPTW <center> <img src="bmj.png" width=100%></a> </center> --- # PS matching .large[ Propensity score란? - 치료군 vs 대조군 연구에서, age/sex/기저질환 등의 변수를 이용하여 치료군에 속할 확률을 계산한 값 - 같은 PS 면 치료군에 속할 확률이 동일 - 같은 PS면 age/sex/기저질환 이 비슷 - 치료군/대조군을 1/0으로 코딩하여 로지스틱 회귀분석, ML 따라서, **치료군의 PS와 비슷한 사람을 대조군에서 뽑으면** 두 그룹의 Baseline이 비슷해지겠군! - 여기까지 알면 50점 - 이럴거면 치료군에 속할 확률을 굳이 계산할 필요가 없음. 그냥 두군의 baseline 비슷한 사람 뽑으면 됨 ] --- # 인과추론 .large[ RCT: 어떤 사람이 두 군에 배정될 확률이 50:50 PS matching: PS가 0.7인 사람이 두 군에 배정될 확률? 50:50 - PS 0.7인 사람이 치료군에 있다면, 대조군에서도 맞춰서 뽑았을 것임 - 여기까지 알면 90점 ] -- .large[ **그럼 PS matching하면 RCT만큼 인정받을 수 있다?** - **No** - 치료군과 동일 특성을 가진 대조군이 매칭되므로, 연구집단 전체가 치료군의 특성을 가짐(예: 더 고령/ 남자가 많다 등) - ATE(average treatment effect)를 추정할 수 없음, **ATT(average treatment effect on the treated)** 임. ] --- # IPTW .large[ Inverse probability of treatment weighting - 매칭 안하고 모든 샘플을 씀. 단 각 사람마다 가중치가 다름 - A는 1명이지만 2명처럼 간주, B는 1명이지만 10명처럼 간주 - 사람별 가중치를 조절하면 Baseline을 동일하게 맞출 수 있음 - 치료군엔 `\(1/PS\)`, 대조군엔 `\(1/(1-PS)\)` 로 가중치 부여 - 여기까지 알면 50점 ] --- # 인과추론 .large[ PS 0.7인 사람이 각 군에 속할 확률은? - PS 0.7인 사람은 치료군에 속할 확률이 0.7, 대조군에 속할 확률이 0.3 `$$0.7 * 1/0.7 = 0.3 * 1/0.3 = 1$$` - 따라서 PS 0.7인 사람이 치료군과 대조군에 동일하게 분포 ] -- .large[ 그럼 IPTW는 ATE vs ATT? ] --- # RWD 뜨는 이유? .large[ 임상시험 비용, 기간 절감 - 3상은 안되더라도 4상은..? N수가 크므로 희귀질환연구 가능 ] --- class: center, middle # 꿈 --- # 지금만으로도 행복 .large[ - 수학 적성 살리면서 일할 수 있어서 행복 - 사람을 살리는 일이어서 행복 - 연구지원하며 동기, 선후배, 교수님 많이 만날 수 있어 행복 - R을 매개로 의학 외 다양한 분야 사람들과 교류할 수 있어 행복 - 학원강사 본능도 만족시킬 수 있어 행복 ] --- # 바이오헬스 규제과학과 .large[ 겸임교수로 [R빅데이터분석](https://github.com/jinseob2kim/R-skku-biohrs) 3학점 강의(월 19-21시) 같은 내용으로 현재 길병원 매주 교육 진행 ] <center> <a href="https://github.com/jinseob2kim/R-skku-biohrs"><img src="biohrs.jpg" width=80%></a> </center> --- # [SW마에스트로 멘토](https://www.swmaestro.org/sw/main/contents.do?menuNo=200034) .large[ - 과기정통부, 정보통신기획평가원 주관 SW인재양성사업 - 기술멘토 60인 선발: 23년까지 임기 <center> <img src="https://img1.daumcdn.net/thumb/R800x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FdDeAvB%2FbtrqOgDFlcX%2FLvib9Ieq3ftZwbAIyPMRl1%2Fimg.jpg" width=50%></a> </center> ] --- # 목숨바칠만한 일 .large[ 이식외과 희귀암환자 췌장절제여부 데이터 - 최악과 차악뿐인 선택지를 두고 눈물흘리는 환자들과 의료진이 떠오름 - 나도모르게 눈물이 남. - 의학연구자 = 어벤저스, 차라투 = 어벤저스지원 ] --- # 지금 목표 .large[ - 올해도 무사히 - 일본어, 일본 진출 - 인턴쉽 유망주 육성 - 의대생, 의사 인턴십을 공식 프로그램으로 - 사주 ] --- <img src="japan.png" width=90%></a> --- # 장기 목표 <center> <img src="planl.jpg" width=100%></a> </center> --- # Load to 天下 <center> <img src="vv.jpg" width=100%></a> </center> --- # 롤모델 <center> <img src="roll.jpg" width=100%></a> </center> --- # 수학에 대한 생각 .large[ - 난제해결(~20대): 페르마 마지막, 푸앵카레추측, 괴델불완전성 - 문제정의(30대초): 타니야마-시무라, 써스턴 기하화 추측, 힐베르트 23문제 - 아름다움(現): 갈루아 군, 파인만 다이어그램 - 신내림(꿈): 라마누잔 ] <center> <img src="ss.jpg" width=50%></a> </center> > 나마기리 여신으로부터 수식에 대한 계시를 받았다 --- # 수학에 대한 생각(2) .large[ - 10대: 유일한 진실이다. 물리하면 더럽혀지는거다! - 20대: 통계는 가짜수학이다. 허나 의대에선 이것밖에.. - 30대: 수학은 세계관이다 `\(0.999... = 1\)` 일수도 아닐수도, 아름다운것이 선택받는다 - 40대: 수학이 날 버렸다.. ] [2+2=4 강요는 인종차별적? 수학 꼴찌권 미국은 지금 이런 논쟁 중](https://www.chosun.com/international/us/2021/11/09/DHP6ZKS2WFCVTL7TJVJPRPCD4U/) --- # 수학에 대한 생각(3) .large[ 허준이 교수 > "개인적으로 수학은 저 자신의 편견과 한계를 이해해가는 과정이고, 일반적으로는 인간이라는 종(種)이 어떤 방식으로 생각하고 또 얼마나 깊게 생각할 수 있는지 궁금해하는 일입니다" ] --- # 비즈니스에 대한 생각 .large[ - 문제해결: 통계지원요청 도와준다 - 문제정의(現): 쉽게 분석할 수 있어야 - 아름다움(목표): 美를 판매 - 신내림(과연..): 세계관 판매, 없는걸 판매 ] <center> <img src="https://th.bing.com/th/id/OIP.7lniNST3KZfY_EGh2QFbjgHaHa?rs=1&pid=ImgDetMain" width=30%></a> </center> --- <center> <img src="logo.png" width=100%></a> </center> --- # Goyard <center> <img src="https://i.balaan.io/images/71/71eba3/71eba30a3774c845db57949c3b350c46eea4a2b4a2f563257ecf85944952e1f6.jpg" width=60%></a> </center> --- # Baobao  --- # Trinity  --- # 아름다운 연구 [클림트를 해부하다](http://www.bosa.co.kr/news/articleView.html?idxno=2215247) <center> <img src="cl.png" width=60%></a> </center> --- # 쓸모있는 사람 No .large[ **쓸모있다 = 값을 평가할 수 있다 ** - 쓸모로 승부보려면 기적까지 일으켜야 **아름다움**을 다루는 사람: 美 - 아름다움은 값을 평가할 수 없다 - 값을 제대로 평가하지 못해 패닉바잉 유도 **도덕**을 다루는 사람: 善 - 한국은 도덕 쟁탈전을 벌이는 하나의 거대한 극장 **세계관**을 만드는 사람: 眞 - 도덕, 아름다움을 스스로 정의한다. - 신 ] --- .large[ > 오직 하나의 완전무결한 이(理)만이 대접받는 사회이기 때문에 “자신의 삶이 얼마나 도덕적인가를 소리 높여 다른 사람들에게 끊임없이 표현하지 않으면” 안 된다. 이런 곳에서 권력 투쟁이란 곧 “도덕을 내세워 권력을 잡는 세력이 얼마나 도덕적이니 않은가를 폭로하는 싸움”이 된다. 상대의 도덕을 싸잡아 비난할수록 ‘훌륭한 선비’가 된다. ] <center> <img src="https://mblogthumb-phinf.pstatic.net/MjAyMjEyMzBfMjI1/MDAxNjcyMzg4NzYyMDk1.CNEvr3WoxDq9FvIRV9Kn0WAeBOikp0KvKLA6Ux-HWxQg.MJYtfRmTu-liCbCAj7x65lY8bpGHjVy7Q11m8MVK8Egg.JPEG.quixcha/027_%EB%8F%84%EB%8D%95%EC%9F%81%ED%83%88%EC%A0%84.jpg?type=w800" width=70%></a> </center> --- # 헬스케어 업계에서 의사란? .large[ 劉(유) 씨 - 삼국지 유비: 한황실 재건 명분, 유황숙 대접, 천하통일까지? ] --- <center> <img src="yubi.png" width=70%></a> </center> <center> <img src="yubi2.jpg" width=50%></a> </center> --- # 철강왕 박태준 우향우정신 .large[ > 선조의 피값(대일 청구권 자금)으로 짓는 포항제철, 실패하면 우향우해서 영일만에 빠져 죽자 ] <center> <img src="https://pds.joongang.co.kr/news/component/htmlphoto_mmdata/201511/29/htm_2015112912557808759.jpg" width=40%></a> </center> --- # 醫俠(의협: 의학 + 의로울 협) 정신 .large[ > 환자 희생으로 만들어진 데이터, 실패하면 한강에 빠져 죽자 - 최선의 결과를 내야하는 의료진, 최선의 결과를 원하는 환자 - But, 최악과 차악뿐인 선택지 - 선택과 사투과정이 담긴 데이터 - 이 데이터를 헛되게 쓰는건, 환자의 희생과 의료진의 노력을 헛되게 만드는 것. ] --- # 아뿔사 단월드 선배님 <center> <img src="https://blog.jinbo.net/attach/2520/191030581.jpg" width=100%></a> </center> --- # 사이비교주의 핵심 역량 .large[ 의술: 사람을 살린다 - 차라투? 점술: 미래를 예측한다 - 사주? ] --- <center> <img src="ss1.png" width=50%></a> </center> <center> <img src="ss2.png" width=50%></a> </center> <center> <img src="ss3.png" width=50%></a> </center> --- # 종교인 가능? <center> <img src="merged_image.jpg" width=100%></a> </center> --- # 그동안 제시한 세계관 **올림피아드: 모든 도형문제를 삼각함수로 ** - 신프신은 두신코, 코마코는 마두신신, 신신은 마코마코반 **통계: 아름다움에 기반한 개념** - 모델이 휘어진게 아니다, 데이터가 휘어진거다 - 얍샵(?)하지 않은 P, 복소수 P(P + 파동함수) - 선형모델을 가능한 모든 모델들의 경로적분으로 해석 **창업: 의학연구로 사람을 살리는 홍익인간 ** - 글로벌 최고인재 의대생을 아티스트로 육성 - 이들이 제2 반도체신화를 이끈다 -- **종교: 쓸모있는 사람 No** - 아름다움을, 선악을, 세계를.. - 우주를..? --- # 근성론(김성모) > 이세상 인간들은 다 사실 외롭고 쓸쓸하다. 겉으로는 행복한척 잘난척 하지만, 대다수의 인간은 자기 스스로가 밑에서부터 고장 나고 있다는것을 자각하며 살아간다. <center> <img src="https://image.yes24.com/goods/108837585/XL" width=30%></a> </center> 미친듯이 성장한다는 느낌이 들어야 간신히 본전. -- .large[ 홍익인간: 결국 인간중심 세계관을 벗어나지 못했다. ] --- # MLBPARK 현자 > 나이가 들어가니 세상을 보는 통찰력이 생기는거 같나? 그게 당신의 정신이 늙어간다는 증거다. 다시 거울속의 남자를 잘 봐라. 거울속의 남자가 당신 회사의 신입으로 들어왔다고 생각해 봐라. 세상을 보는 통찰력이 있는 훌륭한 신입사원이 들어왔으니 쾌재를 불러야 하는 상황인가? 아니면 답도없는 "싸가지론" 을 웅얼거리는 꼰대가 무려 신입으로 들어왔으니 앞으로 고생문이 열린 것인가? 두 눈을 부릅뜨고 또 다시 거울속의 신입사원을 잘 봐라. > 나이를 먹는다는것은 통찰력이 생기는 것이 아니라 감각이 붕괴되는 것이다. 통찰력이 생겼다고 자부하지 말고 당신의 감각이 하나 더 붕괴됬음을 슬퍼해라. 늙어감에 예외는 없다. > 늙는다는 것이 통찰력이 생긴다는 것이라면 고령화는 축복이겠지? 하지만 고령화를 축복이라 생각하는 사람은 없고, 거울속의 신입사원 보고 남감해 하지 않을 사람은 없다. --- # 蒼天航路 <center> <img src="https://t3.daumcdn.net/thumb/R720x0.fjpg/?fname=http://t1.daumcdn.net/brunch/service/user/6vVP/image/DbyP51-cNVXNmf1_SXMHVwJgfds" width=80%></a> </center> --- class: center, middle # END