医学研究のためのオープンソースR統計パッケージ

Zarathu Co., Ltd

キム·ジンソプ

2024-12-07

自己紹介

会社: チャラトゥ株式会社(Zarathu Co.,Ltd)

  • Rを利用した医学研究支援
  • Rパッケージ開発, 教育

キャリア

  • Medical Doctor, ソンギュングァン大学, 韓国 (~2009)
  • 予防医学専門医、ソウル大学保健大学院 (~2013)
  • エンジニア、Samsung health service group (~2016)
  • 創業, Zarathu Co.,Ltd (2018~)

jinseob2kim@gmail.com, github.com/jinseob2kim

医学研究のためのR統計パッケージ

CRAN(計17万回ダウンロード)

  • jskm: 生存分析 kaplan-meier plot
  • jstable: 分析結果(記述統計、回帰、サブグループ分析)テーブル生成
  • jsmodule: Shiny module & ローカルコンピュータでopenstat.aiを実行

日本ブログレビュー

Survey data, Landmark, Competing risk analysis support

## Gaussian
glm_gaussian <- glm(mpg~cyl + disp, data = mtcars)
glmshow.display(glm_gaussian, decimal = 2)
$first.line
[1] "Linear regression predicting mpg\n"

$table
     crude coeff.(95%CI)   crude P value adj. coeff.(95%CI)    adj. P value
cyl  "-2.88 (-3.51,-2.24)" "< 0.001"     "-1.59 (-2.98,-0.19)" "0.034"
disp "-0.04 (-0.05,-0.03)" "< 0.001"     "-0.02 (-0.04,0)"     "0.054"

$last.lines
[1] "No. of observations = 32\nR-squared = 0.7596\nAIC value = 167.1456\n\n"
## Binomial
glm_binomial <- glm(vs~cyl + disp, data = mtcars, family = binomial)
glmshow.display(glm_binomial, decimal = 2)
$first.line
[1] "Logistic regression predicting vs\n"
 
$table
     crude OR.(95%CI)   crude P value adj. OR.(95%CI)    adj. P value
cyl  "0.2 (0.08,0.56)"  "0.002"       "0.15 (0.02,1.02)" "0.053"     
disp "0.98 (0.97,0.99)" "0.002"       "1 (0.98,1.03)"    "0.715"     

$last.lines
[1] "No. of observations = 32\nAIC value = 23.8304\n\n"

Subgroup analysis

TableSubgroupMultiGLM(status ~ sex, var_subgroups = c("kk", "kk1"), data = lung, family = "binomial")
    Variable Count Percent           OR Lower Upper P value P for interaction
sex2  Overall   228     100         3.01  1.65  5.47  <0.001              <NA>
1          kk  <NA>    <NA>         <NA>  <NA>  <NA>    <NA>             0.476
2           0    38    16.9            7   0.7 70.03   0.098              <NA>
3           1   187    83.1         2.94  1.55  5.57   0.001              <NA>
4         kk1  <NA>    <NA>         <NA>  <NA>  <NA>    <NA>             0.984
5           0     8     3.6 314366015.19     0   Inf   0.997              <NA>
6           1   217    96.4         2.85  1.55  5.25   0.001              <NA>
TableSubgroupMultiCox(Surv(time, status) ~ sex, var_subgroups = c("kk", "kk1"), data = lung)
    Variable Count Percent Point Estimate Lower Upper sex=1 sex=2 P value P for interaction
sex  Overall   228     100           1.91  1.14   3.2   100   100   0.014              <NA>
1       <NA>  <NA>    <NA>           <NA>  <NA>  <NA>  <NA>  <NA>    <NA>              <NA>
2         kk  <NA>    <NA>           <NA>  <NA>  <NA>  <NA>  <NA>    <NA>             0.525
3          0    38    16.9           2.88  0.31 26.49    10   100    0.35              <NA>
4          1   187    83.1           1.84  1.08  3.14   100   100   0.026              <NA>
5       <NA>  <NA>    <NA>           <NA>  <NA>  <NA>  <NA>  <NA>    <NA>              <NA>
6        kk1  <NA>    <NA>           <NA>  <NA>  <NA>  <NA>  <NA>    <NA>             0.997
7          0     8     3.6           <NA>  <NA>  <NA>     0   100    <NA>              <NA>
8          1   217    96.4           1.88  1.12  3.17   100   100   0.018              <NA>

中国での動画やブログレビュー

1~2行のコードだけで分析ウェブを作れるよう、各分析機能をmoduleとして開発

論文支援実績

SCI論文200編以上サポート

  • 医学分野 トップジャーナル NEJM、LANCET、JAMAを含む
  • 6つの大学病院と年単位研究支援契約、10ヶ所の製薬会社の臨床試験分析をサポート

無料統計ウェブ

  • よく利用される分析機能を無料で分析できるopenstat.ai 公開
  • jskm/jstable/jsmoduleの分析moduleを適用

openstat.ai: free

Openstat QR code

国家R&D選定

3件の国家R&D支援事業を通じて技術開発および医学研究用の高度化を遂行

`22 (韓国)科学技術情報通信部「公開SW基盤のクラウド統計パッケージSW開発」(2年1億円)

  • 統計非専攻者及び一般向け

`23 (韓国)情報通信産業振興院公開SW技術拡散支援事業(7ヶ月2000万円)

  • 医学研究用

`23 (韓国)中小ベンチャー部 (1200万円)

  • 医学研究用&臨床試験

著作権登録

オープンソース管理

https://statgarten-issue.streamlit.app/

Github action

  • テスト、ホームページアップデート、ライセンス同意、コードstyle

オープンソースライセンス検証

R package: Shiny -> exe

R必要なくexeファイルにしてローカル環境で実行 - executablePackeR

要約

  • 医学研究用Rパッケージの開発、日本/中国で活用

  • 国家R&D選定

  • 最新オープンソース管理技術

  • ライセンス検証

ご清聴、ありがとうございました。