Proč bych se měl právě já učit R
Z WikiSkript
R je volně dostupný programovací jazyk určený (nejen) pro statistickou analýzu dat. Díky své relativní jednoduchosti si získává stále větší oblibu i mezi zájemci mimo obory počítačových věd. Je velmi oblíben na akademické půdě, ale i v byznysu či ekonomických aplikacích. R jako vývojové, programovací nebo analytické prostředí úspěšně používají jak profesionálové v exaktních oborech včetně teoretické informatiky a intenzivně-výpočetních aplikací matematiky, tak nadšenci se zcela netechnickým backgroundem jako biologové, lékaři, sociologiové a mnozí další.
Důvody, proč začít s R
- S vědou (nejen) v biomedicíně to myslím vážně.
- Jsem medik a jednou bych se chtěl věnovat postgraduálnímu doktorskému studiu, kde jistojistě statistiku potřebovat budu.
- Jsem čerstvý absolvent a rád bych se dostal na postgraduální doktorské studium, k čemuž jistojistě statistiku potřebovat budu..
- Jsem postgraduální student a jednou bych chtěl dokončit postgraduální doktorské studium, k čemuž tu zatracenou statistiku opravdu potřebuji.
- Jsem lékař a hledám konečně efektivní nástroj pro analýzy svých výzkumů. I když nemám ambice si počítat všechnu statistiku do svých prací sám, chci se na data sám „podívat“ již během jejich sbírání.
- Komerční statistické programy nejsou dostupné, nebo nejsou dobře použitelné.
- Sbírám opakovaně data stejného charakteru a rád bych si jejich (před)zpracování automatizoval.
- Publikuji v odborných časopisech a rád bych do statě článku s Methodology and Statistical Analysis pravdivě psal, že „... all statistical analyses were performed using R language for statistical computing and graphics...“, protože existuje evidence, že citování R či jiných volných statistických nástrojů mnohdy zvyšuje pravděpodobnost citování takového článku.[1]
- Tuším, že věda 2.0 v biomedicíně se bude provozovat nejen formou experimentů na živém (in vivo) či v laboratořích (in vitro), ale budou ji tvořit ze značné části počítačové modely a simulace (in silico), a chci na to být připraven.
- Uvědomuji si, že MS Excel v základním rozhraní neumí doteď vykreslit krabicový diagram. Zpracování dat v tabulkových procesorech a spoléhání se jen na ně je spjato s různými problémy, chybné výstupy z tabulkových procesorů dokonce vyvolaly některé vědecké skandály.[2]
- Data již nějakou dobu (sám) analyzuji a přemýšlím, který nástroj pro analýzu (s kvalitní dokumentací a živou podporou a komunitou) se začít učit.
Odkazy
Externí odkazy
- Domovská stránka jazyka R
- Potřebuji se učit R? Čtyři dobré důvody zkusit open-source platformu pro analýzu dat, anglicky
Literatura
- ZVÁRA, Karel. Základy statistiky v prostředí R. 1. vydání. Praha : Karolinum, 2013. Biomedicínská statistika; sv. 4. ISBN 978-80-246-2245-3.
Reference
- ↑ POISOT, Timothée. Nb. citations of @PLOS papers using free (#rstats, python) vs. non-free (matlab, mathematica, SAS, SPSS) software [online]. [cit. 16. 8. 2016]. <http://twitter.com/tpoi/status/413806794129948672>.
- ↑ HUTSON, Stu. Data handling errors spur debate over clinical trial. Nature Medicine [online]. 2010, roč. 16, vol. 6, s. 618-618, ISSN 10788956. DOI: 10.1038/nm0610-618a.