R software

R je open-source matematický software specializovaný na statistiku a grafické výstupy. Používá programovací jazyk podobný S. R funguje na široké škále UNIX platforem, Windows a MacOS a je možné analyzovat data z veškerých lidských oblastí (zemědělství, astrofyzika, atd.).

Ke stažení je zdarma jako Free Software Foundation´s GNU General Public licence na stránkách samotné organizace http://www.r-project.org/, CRAN Mirrors, zde jsou také návody, informace o R, volně stažitelné balíky (Packages), které pomáhají zlepšit práci. R software má i českou lokalizaci http://www.r-project.cz/, ale informace byly čerpány z anglické verze.

R je jazyk a prostředí pro výpočet a grafické znázornění statistických úloh. Byl vyvinut Johnem Chmabersem a kolegy v laboratořích Bell Laboratories (Lucent Technologies). Jazyk R nabízí zapojení se i do samotného vytváření lineárních a nelineárních modelů po klasifikaci, clustering či jen můžeme provádět klasické statistické testování to vše lze zakončit grafickými výstupy. R software je také schopné dalšího rozšíření.


Prostření R software

Prostředí R je charakteristické plně plánovaným a logickým systémem, jeho vybavení zahrnuje manipulaci s daty, výpočty a grafická zobrazení jako
1. efektivní zacházení s daty a jejich uskladnění,
2. příhodné pro výpočetní operace v sadách, jednotlivých maticích,
3. pomocné nástroje pro datové analýzy,
4. grafické zobrazení analýz na obrazovku, do kopie,
5. rozvinuté, jednoduché a efektivní programování s podmínkami, cykly, uživatel
může nadefinovat funkce a použít vstupy či výstupy,
o uživateli je dovoleno přidat další funkce jejich přímým definováním.



r_prostredi.png, 24kB

Packages (rozšiřující balíčky)

Schopnosti R softwaru se mohou rozšířit skrze packages (rozšiřující balíčky), které dovolují specializovat statistické techniky, grafická zařízení či import/export (vstup/výstup) velkého množství datových formátů. Packages vyvinuli v R, LaTeX, Java, C a Fortan. Základní packages zahrnuje prvotní instalace, jak již bylo řečeno. Nalezneme více než 2 000 dostupných rozšiřujících balíků v kompletní síti R archivu CRAN (Comprehensive R Archive Network). Oficiální shrnutí veškerých R balíků (packages) naleznete http://cran.r-project.org/web/packages/.



r_knihovna.png, 24kB

STATA Software

STATA je není jen složeninou dvou slov statistika (statistic) a slova data, v plném znění: Data Analysis and Satistical Software, tedy lze provádět analýzy nad daty pomocí statistických pravidel. Softwarový balík pro statistické výpočty, autor Bill Gold a zdokonalený StataCorp (1985). Jako SAS Systém je částečně psán v C jazyku, multiplatformní a s propriety licencí. Najdeme jej v obchodních i akademických institucích zabývajících se jak výzkumem v oblasti ekonomie, ale také v sociologii a jiných vědních oborech.

Umožňuje
1. Spravovat data
2. Provádět statistické analýzy
3. Grafy
4. Simulace
5. Uživatelské programování

Verze STATA
1. STATA/MP, pro multiprocesní počítače
2. STATA/SE, pro velké databáze
3. STATA/IC, standardní verze
4. Small STATA, studentská verze


stata.png, 24kB

Příklad psaní kódu

## načti data, zde pomocí webu
use http://www.ats.ucla.edu/stat/stata/
webbooks/logistic/apilog, clear

## použil regresi
regress hiqual avg_ed

##předpovídej y a ukaž v grafu
predict yhat
(option xb assumed; fitted values)
(42 missing values generated)
twoway scatter yhat hiqual avg_ed, connect(l .) symbol(i O) sort ylabel(0 1)