在資料處理與分析過程,我們常常會需要從龐大的原始資料中,擷取一部分符合分析條件的資料後,再做後續的分析或統計計算。如果擷取條件簡單,例如只留下男性,或是例如只留下接受特定科別治療的病人,簡單直觀的方法可以使用IF 條件式或WHERE條件式來達成。但是如果擷取條件比較複雜,例如你手上有一個上千人的ID列表,要擷取出這個ID列表中的人的資料用以後續分析;或是例如要擷取有特定藥物治療的病人資料,而符合分析的藥品代碼有上百個。這個時候使用IF或WHERE條件式就不是一個好的選擇,一方面程式會是一長串IF或WHERE條件式而非常冗長,冗長的程式就很可能有輸入/打字錯誤;另一方面一但擷取的條件有些微的修改,就必需從冗長的程式中找到要修改的地方,不利於程式的管理。所以在這個情況下,比較好的策略是將符合條件的ID例表或藥品代碼列表儲存成一個資料檔,將原始資料檔與條件列表資料利用 “SORTED BY MERGE” 的方式,從原始資料內篩選出與條件列表資料一致的部分,即可達成擷取資料的目的。除了上述使用IF或WHERE條件式或 “SORTED BY MERGE” 的方法,本篇將介紹另一種擷取資料的方法。這個方法是使用PROC FORMAT來達成,尤於這個方法不需要SORT原始資料,預期會較使用 “SORTED BY MERGE” 節省時間。
生物統計研究中心 嚴友君 助理研究員
本期eNews與各位討論如何使用R進行相對風險、勝算比與邏輯斯迴歸分析。相對風險(Relative Risk)與勝算比(Odds Ratio)是流行病學與醫療領域之中經常使用的風險測量方式,透過列聯表的方式,通常計算暴露於某種情況下,罹患特定疾病的風險;而透過邏輯斯迴歸分析,我們能夠估計風險因子與特定疾病間的風險關係。以下我們就逐一進行介紹並說明R程式步驟。
生物統計研究中心 林怡諄 副統計分析師
講者 : Dr. S. Stanley Young Adjunct professor of statistics at North Carolina State University
時間 : 2019. 06. 25 (二) 13:30~15:00
地點 : 臺北醫學大學大安校區B201會議室(台北市大安區基隆路二段172-1號)
•時間:108年7月4日(四) 1:30PM
•地點:大安校區B201會議室
•講師:Dr. Chih-Hung Chang Professor, Occupational Therapy, Medicine, and Orthopaedic Surgery, Washington University,School of Medicine in St. Louis
需求條件
詳情請上 : https://www.104.com.tw/job/?jobno=6j427&jobsource=n104bank2
快加入我們吧 ! !
http://biostat.tmu.edu.tw/consult/Reserve/
醫院駐點服務 | 時間 | 聯絡窗口 |
北醫附設醫院 | 請洽附設醫院聯絡窗口 | Tel: 2737-2181 #3748 |
萬芳醫院 | 請洽醫院之研究部 | Tel: 2930-7930 #7206 |
雙和醫院 | 每週二 08:30-11:30 每週四 14:00-17:30 (需先預約) |
Tel: 2249-0088 #8861 |