Proč bych se měl právě já učit R: Porovnání verzí
Z WikiSkript
(zakládám článek o motivaci k učení se R) |
m (infobox tu není nutný, upravuji vnitřní odkazy) |
||
Řádek 1: | Řádek 1: | ||
__NOTOC__ | |||
[http://www.r-project.org/ R] je volně dostupný programovací jazyk určený (nejen) pro statistickou analýzu dat. Díky své relativní jednoduchosti si získává stále větší oblibu i mezi zájemci mimo obory počítačových věd. Je velmi oblíben na akademické půdě, ale i v byznysu či ekonomických aplikacích. R jako vývojové, programovací nebo analytické prostředí úspěšně používají jak profesionálové v exaktních oborech včetně teoretické informatiky a intenzivně-výpočetních aplikací matematiky, tak nadšenci se zcela netechnickým backgroundem jako biologové, lékaři, sociologiové a mnozí další. | [http://www.r-project.org/ R] je volně dostupný programovací jazyk určený (nejen) pro statistickou analýzu dat. Díky své relativní jednoduchosti si získává stále větší oblibu i mezi zájemci mimo obory počítačových věd. Je velmi oblíben na akademické půdě, ale i v byznysu či ekonomických aplikacích. R jako vývojové, programovací nebo analytické prostředí úspěšně používají jak profesionálové v exaktních oborech včetně teoretické informatiky a intenzivně-výpočetních aplikací matematiky, tak nadšenci se zcela netechnickým backgroundem jako biologové, lékaři, sociologiové a mnozí další. | ||
Řádek 7: | Řádek 7: | ||
* Jsem lékař a hledám konečně efektivní nástroj pro analýzy svých výzkumů. <b>I když nemám ambice si počítat statistiku do svých prací sám, chci se na data sám „podívat“ již během jejich sbírání.</b> | * Jsem lékař a hledám konečně efektivní nástroj pro analýzy svých výzkumů. <b>I když nemám ambice si počítat statistiku do svých prací sám, chci se na data sám „podívat“ již během jejich sbírání.</b> | ||
* Vadí mi nutnost platit za licence komerčních statistických programů. | * Vadí mi nutnost platit za licence komerčních statistických programů. | ||
* Nejsem spokojen například s tím, že <b>žádný komerční statistický software neumí spočítat [ | * Nejsem spokojen například s tím, že <b>žádný komerční statistický software neumí spočítat [[Fisherův přesný test (R)|Fisherův přesný test]] nad kontingenční tabulkou obecně větších rozměrů</b>, mnohdy dokonce ani o něco větších než <math>{2}\times{2}</math>, třeba jen <math>{4}\times{4}</math>. Oproti tomu R dokáže [[Fisherův přesný test (R)|Fisherův přesný test]] spočítat nad smysluplnou kontingenční tabulkou libovolných konečných rozměrů. | ||
* Sbírám opakovaně data stejného charakteru a rád bych si jejich (před)zpracování automatizoval. | * Sbírám opakovaně data stejného charakteru a rád bych si jejich (před)zpracování automatizoval. | ||
* Publikuji v odborných časopisech a rád bych do statě článku s <i>Methodology and Statistical Analysis</i> pravdivě psal, že „... all statistical analyses were performed using R language for statistical computing and graphics...“, protože <b>existuje evidence, že citování R či jiných volných statistických nástrojů mnohdy zvyšuje pravděpodobnost citování takového článku.</b><ref> | * Publikuji v odborných časopisech a rád bych do statě článku s <i>Methodology and Statistical Analysis</i> pravdivě psal, že „... all statistical analyses were performed using R language for statistical computing and graphics...“, protože <b>existuje evidence, že citování R či jiných volných statistických nástrojů mnohdy zvyšuje pravděpodobnost citování takového článku.</b><ref> |
Verze z 16. 8. 2016, 14:50
R je volně dostupný programovací jazyk určený (nejen) pro statistickou analýzu dat. Díky své relativní jednoduchosti si získává stále větší oblibu i mezi zájemci mimo obory počítačových věd. Je velmi oblíben na akademické půdě, ale i v byznysu či ekonomických aplikacích. R jako vývojové, programovací nebo analytické prostředí úspěšně používají jak profesionálové v exaktních oborech včetně teoretické informatiky a intenzivně-výpočetních aplikací matematiky, tak nadšenci se zcela netechnickým backgroundem jako biologové, lékaři, sociologiové a mnozí další.
Důvody, proč začít s R
- S vědou (nejen) v biomedicíně to myslím vážně.
- Jsem medik a jednou bych se chtěl věnovat postgraduálnímu doktorskému studiu, kde jistojistě budu při vyhodnocování dat používat statistiku.
- Jsem lékař a hledám konečně efektivní nástroj pro analýzy svých výzkumů. I když nemám ambice si počítat statistiku do svých prací sám, chci se na data sám „podívat“ již během jejich sbírání.
- Vadí mi nutnost platit za licence komerčních statistických programů.
- Nejsem spokojen například s tím, že žádný komerční statistický software neumí spočítat Fisherův přesný test nad kontingenční tabulkou obecně větších rozměrů, mnohdy dokonce ani o něco větších než , třeba jen . Oproti tomu R dokáže Fisherův přesný test spočítat nad smysluplnou kontingenční tabulkou libovolných konečných rozměrů.
- Sbírám opakovaně data stejného charakteru a rád bych si jejich (před)zpracování automatizoval.
- Publikuji v odborných časopisech a rád bych do statě článku s Methodology and Statistical Analysis pravdivě psal, že „... all statistical analyses were performed using R language for statistical computing and graphics...“, protože existuje evidence, že citování R či jiných volných statistických nástrojů mnohdy zvyšuje pravděpodobnost citování takového článku.[1]
- Tuším, že věda 2.0 v biomedicíně se bude provozovat nejen formou experimentů na živém (in vivo) či v laboratořích (in vitro), ale budou ji tvořit ze značné části počítačové modely a simulace (in silico), a chci na to být připraven.
- Uvědomuji si, že MS Excel v základním rozhraní neumí doteď vykreslit krabicový diagram. Zpracování dat v tabulkových procesorech a spoléhání se jen na ně je spjato s různými problémy, chybné výstupy z tabulkových procesorů dokonce vyvolaly některé vědecké skandály.[2]
- Data již nějakou dobu (sám) analyzuji, ale vnímám již zmíněné nebo jiné nedostatky komerčních statistických software, a přemýšlím, který programovací jazyk s kvalitní dokumentací a živou podporou a komunitou se začít učit.
Odkazy
Externí odkazy
- Domovská stránka jazyka R
- Potřebuji se učit R? Čtyři dobré důvody zkusit open-source platformu pro analýzu dat, anglicky
Literatura
- ZVÁRA, Karel. Základy statistiky v prostředí R. 1. vydání. Praha : Karolinum, 2013. Biomedicínská statistika; sv. 4. ISBN 978-80-246-2245-3.
Reference
- ↑ POISOT, Timothée. Nb. citations of @PLOS papers using free (#rstats, python) vs. non-free (matlab, mathematica, SAS, SPSS) software [online]. [cit. 16. 8. 2016]. <http://twitter.com/tpoi/status/413806794129948672>.
- ↑ HUTSON, Stu. Data handling errors spur debate over clinical trial. Nature Medicine [online]. 2010, roč. 16, vol. 6, s. 618-618, ISSN 10788956. DOI: 10.1038/nm0610-618a.