R je open-source matematický software specializovaný na statistiku a grafické výstupy. Používá programovací jazyk podobný S. R funguje na široké škále UNIX platforem, Windows a MacOS a je možné analyzovat data z veškerých lidských oblastí (zemědělství, astrofyzika, atd.).
Ke stažení je zdarma jako Free Software Foundation´s GNU General Public licence na stránkách samotné organizace http://www.r-project.org/, CRAN Mirrors, zde jsou také návody, informace o R, volně stažitelné balíky (Packages), které pomáhají zlepšit práci. R software má i českou lokalizaci http://www.r-project.cz/, ale informace byly čerpány z anglické verze.
R je jazyk a prostředí pro výpočet a grafické znázornění statistických úloh. Byl vyvinut Johnem Chmabersem a kolegy v laboratořích Bell Laboratories (Lucent Technologies). Jazyk R nabízí zapojení se i do samotného vytváření lineárních a nelineárních modelů po klasifikaci, clustering či jen můžeme provádět klasické statistické testování to vše lze zakončit grafickými výstupy. R software je také schopné dalšího rozšíření.
Prostředí R je charakteristické plně plánovaným a logickým systémem, jeho vybavení zahrnuje manipulaci s daty, výpočty a grafická zobrazení jako
1. efektivní zacházení s daty a jejich uskladnění,
2. příhodné pro výpočetní operace v sadách, jednotlivých maticích,
3. pomocné nástroje pro datové analýzy,
4. grafické zobrazení analýz na obrazovku, do kopie,
5. rozvinuté, jednoduché a efektivní programování s podmínkami, cykly, uživatel
může nadefinovat funkce a použít vstupy či výstupy,
o uživateli je dovoleno přidat další funkce jejich přímým definováním.
Schopnosti R softwaru se mohou rozšířit skrze packages (rozšiřující balíčky), které dovolují specializovat statistické techniky, grafická zařízení či import/export (vstup/výstup) velkého množství datových formátů. Packages vyvinuli v R, LaTeX, Java, C a Fortan. Základní packages zahrnuje prvotní instalace, jak již bylo řečeno. Nalezneme více než 2 000 dostupných rozšiřujících balíků v kompletní síti R archivu CRAN (Comprehensive R Archive Network). Oficiální shrnutí veškerých R balíků (packages) naleznete http://cran.r-project.org/web/packages/.
STATA je není jen složeninou dvou slov statistika (statistic) a slova data, v plném znění: Data Analysis and Satistical Software, tedy lze provádět analýzy nad daty pomocí statistických pravidel. Softwarový balík pro statistické výpočty, autor Bill Gold a zdokonalený StataCorp (1985). Jako SAS Systém je částečně psán v C jazyku, multiplatformní a s propriety licencí. Najdeme jej v obchodních i akademických institucích zabývajících se jak výzkumem v oblasti ekonomie, ale také v sociologii a jiných vědních oborech.
Umožňuje
1. Spravovat data
2. Provádět statistické analýzy
3. Grafy
4. Simulace
5. Uživatelské programování
Verze STATA
1. STATA/MP, pro multiprocesní počítače
2. STATA/SE, pro velké databáze
3. STATA/IC, standardní verze
4. Small STATA, studentská verze
## načti data, zde pomocí webu
use http://www.ats.ucla.edu/stat/stata/
webbooks/logistic/apilog, clear
## použil regresi
regress hiqual avg_ed
##předpovídej y a ukaž v grafu
predict yhat
(option xb assumed; fitted values)
(42 missing values generated)
twoway scatter yhat hiqual avg_ed, connect(l .) symbol(i O) sort ylabel(0 1)
ArGIS je profesionální geografický informační systém (GIS software) spadající do rodiny ESRI produktů. Usnadňuje prohlížení, tvorbu a správu prostorových dat. Operační systém je koncipován pro Windows.
Desktop ArcGIS může zahrnovat ArcReader, ArcView (tvorba map a analýzy) a jeho rozšíření v podobě ArcEditor.
Ostatní ESRI produkty jsou například MapObjects (mapové objekty), programovací knihovny pro vývojáře a ArcSDE (relační řízení databáze).
ArcGIS 9.x obsahuje prostředí pro geoprocesing (zpracování prostorových dat), vizuální programování (Phyton, VB Script, Perl). Pracuje s formátm shapefile (.shp), geodatabáze ukládá data pomocí objektivně relační databáze i s topologickými informacemi. Třídy prvků jsou body linie a polygony, jedna třída prvků je uložena samostatně ve vrstvě, tedy nemohou být body a polygony v jedné vrstvě. Geodatabáze ukládá i vícenásobné třídy prvků třemi možnými způsoby (.gdb), a to souborová (file) geodatabáze, osobní (personal) geodatabáze a relační ArcSDE geodatabáze
ArcGIS Desktop 9.3 je přístupný ve třech licenčních úrovních, lišících se funkcionalitou:
Základní: ArcView
prohlížení dat, editace, analýzy nad daty a tvorbu grafických výstupů (map). Dovoluje také pracovat s daty uloženými v systému relačních databází přístupných přes ArcSDE.
Rozšířené: ArcEditor
zvyšuje funkcionalitu ArcView možnostmi práce s geodatabázemi, včetně tvorby, editace a kompilace.
Nejvyšší: ArcInfo
rozšíření možností pro prostorové operace, tvorbu map a navýšení funkcionality Geoprocessingu.
K programům skupiny ArcGIS 9.x byla přidána extenze Geostatistical Analyst, přístupná přes menu Tools. Určená pro práci vyšetřování statických dat, identifikaci nepřesností a jiných zvláštností dat. Díky tomu je možné předpovědět a vyhodnotit přesnost předpovědí a tvořit z nich výsledné povrchy.
Síla Geostatistical Analyst je tedy v samotných nástrojích pro tvorbu spojitého povrchu z naměřených hodnot rozptýlených bodů. Pomůže odhadovat hodnoty povrchu použitím interpolace kriging. Nástroje pro analýzu prostorových dat umožňují pochopit podstatu dat (rozložení, globální a lokální odchylky, globální trendy, úroveň prostorové autokorelace). Předpovědi obsahují i stupeň nejistoty.
SAS System (Statistical Analysis System) je integovaný softwarový systém vyráběný firmou SAS Institute Inc. Slouží běžně ve firmách pro databázové účely, ale je také nástroj pro analýzu a obchodní využití dat. Využívaný pro statistickou analýzu dat také nepochybně ve vědě. Vytvořen Anthony J. Barr (1966) na universitě Severní Karolína, Sas je tvořen z mnoha komponentů jako SAS Add-In pro Microsoft Office, Base SAS, Data Integration Studio, SAS Web OLAP Viewer for Java, SAS/GIS, SAS/STAT a mnoho dalších. Jedná se o modulární software, takže si lze pronajmout jen potřebné části, využitelného konkrétní účely. SAS obsahuje vlastní programovací jazyk, označovaný rovněž jako SAS, ale i jazyk C. Nezávislý na platformě.
Vstup a zprávu dat, Statistické analýzy, Obchodní plánování, předpovídání a podporu, Skladování dat. Zahrnuje Procedury, Macro jazyky.
Míto tabulek (tables), řídků (rows) a sloupců (columns), SAS užívá termíny datasetu (datasets), pozorování (observation) a proměnné (variable), které jsou numerické nebo zakové (string).
## načti data a proveď
data hsb2;
hiwrite = write =52;
run;
proc means data = hsb2 mean std;
run;
## použij logistickou logisticou funkci
roc logistic data = hsb2 ;
model hiwrite (event='1') = female ;
ods output ParameterEstimates = model_female;
run;
Bohužel neumí tak dobré grafické výstupy jako R software, a pro dopočet úloh je například velice vhodný ArcGIS 9.x.