Pokud někdo není kovaný matematik, tak obvykle ke vzorcům a výpočtům chová uctivý respekt, který se blíží uctívání něčeho nadpřirozeného. Jenže jak říkají Jan Lepš s Petrem Šmilauerem z Přírodovědecké fakulty Jihočeské univerzity, dnešní biologie je do značné míry kvantitativní vědou a biologové vlastně pořád něco počítají. Proto tito dva rostlinní ekologové se statistickou náturou sepsali moderně pojatou učebnici statistiky, kterou uvítají biologové a mnozí další, jejichž osudem je zpracovávat nějaká data nebo přinejmenším o takových věcech občas číst.
Jak se dočteme hned na začátku Biostatistiky, statistika to dělá opačně než přísně deduktivní Sherlock Holmes. Je skvělým nástrojem induktivního myšlení – v případech, kdy je ve hře náhodná variabilita. Samotná učebnice je orientovaná prakticky, což ani snad nelze dostatečně vynachválit. Autoři kladou důraz na pochopení principu metod a zásad jejich použití, nikoliv na jejich odvození. Nejde přitom jenom o to, že autoři používají příklady ze života. Cennou součást prakticky každé kapitoly Biostatistiky představuje popis zpracování dat ve dvou odlišných typech software, v našich končinách běžně užívaných. Jedním z nich je uživatelsky příjemná Statistica, druhým uživatelsky náročnější, ale po obsahové stránce úplnější a hlavně volně dostupný program R.
Ještě snad cennější je, že autoři ke každé kapitole zahrnuli i konkrétní ukázky, jak mohou být výsledky získané v obou zmíněných statistických programech prezentovány v odborných publikacích, a rovněž jak použitou statistickou metodu popsat v metodice takové publikace. Odborným jazykem světa je dnes jednoznačně angličtina, takže autoři, ačkoliv jde o publikaci v češtině, zařadili tyto pasáže anglicky, za což jim náleží neskonalý dík.
Biostatistika je díky tomu mnohem více manuálem pro přežití (bio)statistika, nežli suchopárnou učebnicí, na které se rychle usadí prach. Samozřejmostí jsou i data ke všem příkladům použitým v učebnici, která jsou dostupná na webu Jihočeské univerzity.
Asi je poněkud zbytečné propagovat knížku, která mizí v internetovém obchodu Kosmas během pár dní po vydání rychleji, než stačí doplňovat zásoby. A kterou tam mají mezi bestsellery, což je na knihu plnou vzorců naprosto obdivuhodné. Ale jistě by byla škoda, kdyby si ji někdo, koho by zajímala, nechal ujít. Internetový obchod Academia ji má zřejmě ještě na skladě. A hlavně, podle dobře informovaného zdroje je dotisk Biostatistiky jenom otázkou času, řekněme týdnů.
Lepš, J., Šmilauer, P. (2016). Biostatistika. Episteme/edice Natura, 440 stran.
Diskuze:
Musím se ozvat
Ivo Formánek,2016-10-03 09:01:35
Bylo by mi líto, kdyby na základě slov pana Moravce to odradilo ty, kteří se hodlají ve statistice zpelšit a zpracovávat si data sami...
Knihu už mám, a z těch, co jsou v češtině k dispozici, patří pro mírně pokročilé ve statistice, k těm nejlepším. A hlavně neodrazuje ty, kteří nejsou schopni sednout a hned psát skripty.
Naopak oceňuji dostupnost dat na kterých si člověk může zkoušet, zda pochopil. Ostatně vytýkaný program R panem Moravcem je v knize rovněž, takže moc nechápu ....kdo chce, má volbu (i srovnání). V česku je hodně pracovišť, která nabízejí své výpočetní služby, třeba v Biomedicinské centrum v Plzni, Augur Consulting,…. Ale žádné z nich se do učebnice nepustilo. Otázkou je, zda za kritikou spíš nejsou obavy o ztrátu kšeftů :) Ale to bych se pouštěl do spekulace. Možná mají zakázek tolik, že je nepotřebují. Ale to by je zase na svých stránkách nepropagovali.... Nicméně, kdo není zrovna z matfyzu, kniha je supr. Z výtky, že screenshot je přeplácaný, si nic nedělejte. Někdo holt rád plácá.
Re: Musím se ozvat
Milan Krnic,2016-10-03 13:00:31
Taková skvělá publikace by si zasloužila, aby na ní zdatný čtenář napsal recenzi.
http://www.kosmas.cz/knihy/219811/biostatistika
Předtím doporučuji publikaci: Spousta, V. Jak psát recenze. Pedagogická orientace 2003, è. 1, s. 101{109. ISSN 1211-4669.
Škoda je, že jste nereagoval na výtky pana Moravce.
Kritiky v žádném případě škoda není, a je zcela jedno, zda zvýší, či sníží prodej publikace.
Omlouvám se
Miroslav Formánek,2016-10-03 14:21:21
Mně připadá, že pan Ivo ví, co říká. A jestli pan Moravec skutečně nabízí služby statistického zpracování výsledků (jak jsem si vyhledal, tak pán toho jména na plzeňské fakultě ve statistice pracuje a zpracování výsledků inzeruje), tak by jeho kšeftům šíření této knihy asi moc po chuti nebylo. Přesněji to, že kdybychom si pouhým "klikáním", bez znalostí psaní skriptů, řadu věcí do publikace spočítali sami. Myslím, že nám pan Ivo dal tak trochu na srozuměnou, co by lidem, živícím se statistikou, mohlo na knize vadit.
Možná směrodatnější, než moje plkání a oslí deníček pána, kterého Google přečetl jako znalce pokemonů, je fakt, že když jsem po knize pátral, ukázalo se, že je vyprodaná :( To je asi její nejlepší vizitka.
Osobně bych další vydání uvítal a se mnou asi mnozí, kteří se chtějí obejít bez těch, které je pak potřeba připisovat na publikaci, prakticky za nic.
Re: Omlouvám se
Milan Krnic,2016-10-03 16:56:13
Klasika. Každého, kdo se nám nějak nezdá, je potřeba hodit do nějakého pytle, což nám pomůže ho zcela nekriticky soudit, tj. i zavrhnout jeho názory, případně kritiku, a máme klid.
Tedy je zcela fuk, co pan Moravec píše, protože on je přeci ten, kdo chce prodeji knihy uškodit!
To samé se znalcem pokémonů, princip fungování reklamního systému (pravděpodobně) neznaje.
Re: Musím se ozvat
Jiří Moravec,2016-10-03 22:08:50
Ale no tak pane Formánku, pokud už na mne reagujete, je tu to tlačítko "odpověděd" a pokud se do toho pustíte, bylo by vhodné si přečíst, na co to vlastně reagujete.
1. Nekritizoval sem R, ale vyučování v Ms Statistica. Protože Statistica není jediným programem svého typu na světě, a existují free open-source alternativy, není nutné vyučovat Statistiku ve Staticica. Naopak, dochází tak zbavování uživatele možností, protože je to systém placený a dostupný pouze pro Windows. Navíc nemá takové možnosti jako R, které zmíním v dalším bodě.
2. Kde jste přišel na to, źe kritizuju R? Kritizoval jsem toliko přeplácaný screenshot, který ukazuje ne-zrovna ideální pracovní prostředí. Kdybych byl neznalý a měl se rozhodovat mezi Statisticou a R podle screenshotu, vybral bych si Statisticu, COŽ JE ŠPATNĚ.
Naopak, kdyby jste se trochu začetl do mého příspěvku, zjistil by jste, že jsem fanouškem R a doporučuju ho všem na potkání (no, ok, tohle přesně v tom příspěvku nebylo...). Každopádně, oproti oné Statistice má R množství výhod, jako je něco, co by se ve vědě prostě mělo dělat:
repeatability
Zkrátka a jednoduše, neděláte analýzu "interaktivně, ale napíšete si skript se všemi příkazy, který po spuštění načte a vyhodnotí data. Toto můžete KDYKOLIV A JEDNODUŠE zopakovat. Pak není problém někomu poslat skript a data, aby analýzu ověřil (a zkontroloval správnost postupu). Navíc, pokud člověk umí skriptovat, otvírají se mu další obrovské možnosti, jako je vytváření si vlastních nástrojů k analýze dat, například závisí-li vaše analýza na výsledcích Nějakého programu, je pak jednoduché načíst, vyfiltrovat a zesumarizovat dané výsledky pomocí nějakých scriptíků. A pak je i sdílet. Z R pak člověk může přejít na Python (obecný programovací jazyk, R je někdy moc specializovaný na statistiku + má často problémy s pamětí) či C++, pokud potřebuje zdroje.
Navíc R umí hezké grafíky.
Má kritika ke grafické podobě je taková, že z vlastních zkušeností hromada autorských publikací je psaná ve wordu, má to pak hnusný kerning a vůbec nepěknou grafickou úpravu. V momentě, kdy někdo dělá s R, není problém šáhnout po KnitR:
http://yihui.name/knitr/
což je "parser" napsaný v R, který najde R kód obalený speciálními znaky, vyhodnotí ho a vyplivne výsledek buď v Markdownu (který člověk může převést do HTML, případně využít Pandoc) nebo v LaTeXu. S minimálním úsilím tak znalý člověk může mít profesionálně vypadající dokument (tedy něco, co na první pohled nekřičí "Jsem ve Wordu") se všemi výhodami, které KnitR poskytuje, jako je syntax highlighting nebo to, že kód skutečně funguje (protože je taky spuštěný). Viz Advanced R or Hadley Wickhama (taková R superstar):
http://adv-r.had.co.nz/
doporučuji i jiné jeho knihy (volně k dispozici, například Packages pro psaní balíků, což je taky jednodušší, než se zdá)
Re: Re: Musím se ozvat
Jan Taufer,2016-10-03 23:16:22
Jsem jen středoškolský kantor, ale myslím, že jste nám tu právě dokázal, že formát, ne jen Formánek. Nestačíme žasnout, kolik toho umíte. Mezi námi linuxáky, jste zapomněl na jednu podstatnou věc. Pan Microsoft, proti kterému tady tak brojíte, kdysi udělal jeden zajímavý tah. Dal programy školám zadara.... no a tak se nám mezi vědátory táhne používání wordu jako červená nit. Pokud mají dělat svou práci poctivě, nemají čas se učit to s čím nás tu omračujete. Ale když už tady tak lamentujete nad prací jiných a jejich neskonale škodlivým výběrem screenshotů, co kdybyste nám tu napsal zda jste také prvním autorem nějaké publikace, případně zda sám také napsal něco užitečného pro zpracování statistických dat, aby se v tom našli jak ti, co pracují s tím Wordem i ti, co si troufají na "R". Prosím odpovědět na jasné dvě otázky stručně, bez odboček, jak kód obalený speciálními znaky plive...
Děkuje Kantor z Veselí n. L.
Re: Re: Re: Musím se ozvat
Jiří Moravec,2016-10-04 01:21:47
Nelíbí se mi, že to vidíte jako pissing context a mně jako někoho, kdo se vytahuje "že toho tolik umí", místo příležitosti se dozvědět, že takové věci existují, je celkem triviální naučit se základy, využít je a dělat věci lépe.
"Mezi námi linuxáky, jste zapomněl na jednu podstatnou věc. Pan Microsoft, proti kterému tady tak brojíte, kdysi udělal jeden zajímavý tah. Dal programy školám zadara.... no a tak se nám mezi vědátory táhne používání wordu jako červená nit."
Ne? Nezapomněl? Jen nenapsal? Podobně je to s Matlabem, který se často vyučuje na matice (místo npř. Pythonu, takže se celkem běžné věci dělají v Matlabu místo toho, aby se ten Matlab pouźil na věci, na které je skutečně dobrý) nebo AutoCadem (tam do nedávné doby, možná stále ještě je ten problém, že nejsou moc jiné alternativy).
"Pokud mají dělat svou práci poctivě, nemají čas se učit to s čím nás tu omračujete."
Jeden pohled. Druhý pohled je "There must be a better way!" a že udělat věci pořádně stojí jen o málo víc energie než dělat věci.
Re: Re: Re: Re: Musím se ozvat
Petr Pikal,2016-10-07 23:58:00
Dobrý den
asi s křížkem po funuse ale nebrousím Osla každý den. Zato program R používám přibližně 15 let takže vím, že má své výhody a nevýhody(výhody převažují) a rozhodně bych ho nenazval triviálním. Nejsem statistik ani matematik, ale používám R pro zpracování dat a jejich grafickou prezentaci. Samozřejmě můžete ho používat jako programovací jazyk a studovat jak naprogramovat to či ono případně realizovat výsledek v latexu či se učit ESS (emax speaks statistics). Na druhou stranu ale je možné použít R jako super přerostlou kalkulačku a vypracovat si soubor procedur ke kterým je možné se snadno vracet a používat je pro řešení statistických a dalších problémů. Oproti jakýmkoliv jiným programům má obrovskou výhodu v komunitě ochotných lidí po celém světě,kteří radí při problémech a poskytují hotová řešení, která lze snadno upravit tak aby vyhovovala vašim potřebám, stačí zadat problém do vyhledávače s doplněný o písmeno R. Jediná nevýhoda může být, že musíte klást své dotazy anglicky. Asi nejlepší je začít na https://cran.r-project.org/, stáhnout R, nainstalovat (nemusíte být admin) a strávit pár hodin čtením manuálu a testováním příkladů. Pak se můžete podívat na Task View na uvedené stránce, zjistit která oblast je pro vás nejlepší a začít seriózně pracovat.
Například z oboru chemie
install.packages("titrationCurves")
library(titrationCurves)
ppt_analyte(pksp = 16, eqpt = TRUE)
ppt_analyte(pksp = 14, overlay = TRUE, col="red")
ppt_analyte(pksp = 12, overlay = TRUE, col="blue")
A výhodou je, že si můžete snadno zobrazit jak je funkce naprogramována pouze tak že zadáte
ppt_analyte
Suma sumárum, R není pouze statistický program ale díky 2000+ modulům nástroj pro řešení rozmanitých problémů
Zdravím
MS: Statistica? Uh...
Jiří Moravec,2016-10-03 03:43:09
Big minus za MS: Statistika. Tyhle předpotopní systémy by se už ani neměly vyučovat. Navíc to stojí prašulky.
R je na tom mnohem lépe, zdarma, dostupné všude a navíc si tam člověk může jednoduše všechno napsat do skriptů a zazálohovat si tak postup (a nemusí každou chvilku hledat "kde že to mám kliknout? Které menu?" eh...)
Navíc R dá studentům mnohem silnější nástroj pro řešení drtivé většiny problémů. Parsing output z programů budiž jedna věc (načtu si ten output, vyfiltruju věci, co nepotřebuju a spočítám si různé statistiky na tom).
Ale... ten obrázek "Screenshot z programu R", autore, styď se. Postnout něco tak odpudivého a přeplácaného (asi to bude tím Macem...:) mimo to, u mě R vypadá takhle: https://www.ibm.com/developerworks/community/blogs/jfp/resource/BLOGS_UPLOADED_IMAGES/irkernel28.png )
Btw. není k téhle knížce nějaké demo? Juknul sem se na stránky autorů a podle těch powerpointových prezentací nebo materiálů pro R dost pochybuju, že kniha vypadá jakkoliv hezky a profesionálně. Přijde mi, že autoři se vůbec nedrží moderních postupů, například úžasný Knitr, který by se jim moc hodil k zobrazování R kódu (a outputu) v Markdown/LaTeX (což je něco, co by moderní vědec taky měl ovládat)
Re: MS: Statistica? Uh...
Milan Krnic,2016-10-03 06:37:30
Ne nadarmo mi reklamní banner pod článkem nabízí "příručku pro lovce pokémonů".
Doufám, že v hned v úvodu autoři knihy Biostatistika uvedli faktickou poznámku, tj. že náhoda neexistuje.
Re: Re: MS: Statistica? Uh...
Lenka Matyasova,2016-10-03 18:06:08
My blondýny bychom se pánům neměli plést do řemesla, ale z diskusí na všechna temata, která se tu kdy objevila, se mi pan Krnic jeví být vševědem. Případně osobou zapšklou se stihomamem dělat si tu deníček ze svých momentálních pocitů několikrát denně. Jen doufám, že to první bude správně.
Diskuze je otevřená pouze 7dní od zvěřejnění příspěvku nebo na povolení redakce