Úvod do statistického programování s R

Obsah
R. je statistický programovací jazyk, je bezplatný a otevřený. Používá se hlavně pro operace dolování dat nebo statistiky, to vše s cílem vytvořit aplikace pro analýzu velkého množství dat.
Rozhraní příkazového řádku R. Zpočátku to může být trochu zastrašující, ale toto je zastíněno poté, co jsme ocenili sílu a možnosti, které nám jazyk nabízí ke sdílení a reprodukci informační analýzy.
R. Lze jej stáhnout zdarma pro všechny bezplatné platformy, které dnes existují, máme možnost jej nainstalovat Okna, Linux a dokonce Mac.
Pro účely tohoto tutoriálu použijeme verzi pro Okna které můžeme najít na oficiální stránce projektu v následujícím odkazu. Po stažení a instalaci budeme mít funkční kopii R., pokud jej spustíme, budeme mít úvodní obrazovku R. který by měl vypadat takto:

R. Umožňuje nám pracovat s daty rychle a efektivně, ale jeho výchozí rozhraní není pro tento úkol ideální. Jedním z problémů je, že se vše otevírá v samostatných oknech, což ztěžuje práci, a také rozhraní příkazového řádku není ve všech operačních systémech stejné.
Ačkoli existuje mnoho rozhraní k vyřešení tohoto problému, v tomto kurzu použijeme RStudio který je k dispozici pro všechny platformy, ale je důležité zmínit, že je nutné mít R. nainstalován před instalací, abyste získali verzi Okna přejdeme na následující odkaz a stáhneme si odpovídající verzi.
Po instalaci spustíme RStudio a měli bychom vidět hlavní rozhraní:

RStudio nám dává organizaci všech oken R. v rámci jednoho panelu a navíc nám poskytuje přístup k funkcím, které lze obtížně najít, kromě toho můžeme zmínit další další výhody:
  • Rozdělíme naši práci na Projekty kde každý z nich bude mít svůj pracovní adresář, historii a zdrojové soubory.
  • Integrace s GitHub.
  • Umožňuje uložit příběh graficky.
  • Grafiku můžete exportovat v různých formátech a velikostech.
  • Umožňuje nám doplnit kód pomocí tabulkového klíče.
  • Díky určitým balíčkům můžete vytvářet interaktivní grafy.
Jak vidíme RStudio je to docela optimální způsob práce R.Na trhu jsou však i jiná řešení, je na každém, aby je prozkoumal a vyhodnotil, zda jsou lépe přizpůsobeny potřebám každého člověka.
Existuje několik způsobů práce R. kde první věc, kterou budeme řešit, je R konzoleNavzdory skutečnosti, že zde nemůžeme uložit provedenou práci, je docela užitečné vyzkoušet některé funkce a začít se s jazykem seznamovat.
Práce s konzolou je celkem jednoduchá, zadáme příkaz a pak nám R dá výstup, zkusme jednoduchou operaci sčítání, jako je následující:
> 10 + 7

Tlačíme Vstupte a automaticky R. V následujícím řádku nám dává odpověď na naši operaci:

Jak vidíme na obrázku, první řádek obsahuje příkaz s naší operací, je důležité to zmínit R. nevyžaduje použití středníku k ukončení řádku ani jiného ukončujícího operátora. Ve druhém řádku před odpovědí vidíme [1] toto udává způsob jakým R. provádí aritmetické operace a používá vektor, ten znamená index prvního prvku vektoru, kde můžeme zdůraznit, že mnoho dalších jazyků zpracovává indexy od začátku, ale R. dělá to z jednoho.
Jak jsme zmínili dříve, konzole je docela užitečná, ale není nejlepší s ní pracovat, hlavně proto, že nemá možnost ukládat naše příkazy a schopnost zadávat pouze jeden příkaz najednou, něco podobného se stane s Krajta, ale od té doby bychom si neměli dělat starosti RStudio dává nám okno skriptu nachází se v horní části naší konzoly, pokud ji nenajdeme, jdeme na Soubor> Nový soubor> R skript nebo stiskněte Shift + Command + N..
Skript R je v zásadě prostý text s příponou .R. Abychom zjistili, jak to funguje, můžeme znovu vytvořit naši aritmetickou operaci z předchozího příkladu vytvořením nového skriptu a přidáním několika dalších příkazových řádků, podívejme se:
 Tisk 10 + 7 1:50 („Hello World“) 

A R skript můžete spustit řádek po řádku s možností, kterou máme v horním menu s názvem Běh a uvidíme výstup stejného v konzole, podívejme se na odpověď pro každý řádek našeho skriptu:

Jak můžeme vidět, že první řádek nám dává výsledek, který jsme získali dříve, druhý řádek vytvoří seznam čísel od 1 do 50, kde číslo v závorkách je prvním indexem pro tento řádek a nakonec máme dojem klasického Ahoj světe.
Poté, co se podíváme na způsoby, kterými můžeme s jazykem pracovat, přejdeme k více teoretickým konceptům, abychom lépe porozuměli tomu, co máme v jazyce k dispozici pro práci a realizaci našich projektů.
Jako ve všech programovacích jazycích, proměnné jsou jedním z nejdůležitějších aspektů, ve kterých je vytvořit R. Stačí, když napíšeme jeho název bez definování typu. Používáme operátor přiřazení dát hodnotu proměnné.
DůležitéMůžeme přiřadit hodnotu proměnné se znaménkem rovnosti, ale toto je špatná praxe R.Chcete -li provést správné přiřazení, použijte operátor <-.
Podívejme se, jak přiřazení hodnoty proměnné a její tisk vypadá takto:
 x <- 58 x 

Pomocí funkce zřetězení můžeme našim proměnným také přiřadit několik hodnot:
y <- c (5, 2, 11, 28, 17)

Pokud spustíme příklad, uvidíme v pravém panelu, jak máme hodnotu X a číselný seznam přiřazený k Y:

ZVĚTŠIT

Navíc, abychom odstranili proměnnou z pracovního prostoru, stačí použít tuto funkci rm, můžeme dokonce vyčistit celý pracovní prostor, podívejme se, jak to děláme:
 rm (x) rm (seznam = ls ()) 

Prvním řádkem odstraníme proměnnou a druhým řádkem celý prostor.
V jazyce máme čtyři datové struktury, které jsou rozpoznávány R.:
Kreslené vektorovéVektor je jednorozměrné pole, kde všechna data v něm obsažená musí být stejného typu, celé číslo, znak atd., Navíc je důležité si uvědomit, že toto je základní datový objekt v R..
Pole a maticeMatice je podobná vektoru, kde musí být data stejného typu, avšak matice má dvě dimenze a informace jsou uspořádány do řádků a sloupců. Pole je podobné poli, ale může mít více než dvě dimenze.
Datové rámceDatové rámce jsou sbírkou vektorů stejné délky, jsou podobné maticím, ale zvláštností tohoto typu struktury je, že mohou být smíšených datových typů, kde vektory mohou mít dokonce názvy.
SeznamyNejobecnější typ struktury v R, seznam je sbírka prvků jakékoli třídy, délky nebo struktury, dokonce můžeme mít i jiné seznamy.
Dále, R. Má několik funkcí, které nám umožňují převést jeden typ struktury na jiný, podívejme se:
as.vector ()Tato funkce vám umožňuje převádět matice na jednorozměrné vektory.
as.matrix ()Datové struktury můžete převést na pole.
as.data.frame ()Datové struktury můžete převést na datové rámce.
as.list ()Datové struktury můžete převést na seznamy.
Jedna ze silných stránek R. je, že můžete přidat balíčky, které nám umožňují rozšířit funkce jazyka. V jiných jazycích tyto pluginy přicházejí do knihoven, ale v R je knihovna místem, kde jsou uloženy všechny balíčky.
The balíčky z R. mohou pocházet ze dvou různých míst, některá přicházejí s R. ve výchozím nastavení ale nejsou aktivní a další lze nalézt v online úložištích.
Chcete -li zobrazit balíčky, které jsou aktuálně nainstalovány nebo načteny, můžeme spustit následující funkce:
 knihovna () hledat () 

Funkce knihovna () přináší nám seznam balíčků, které jsou aktuálně nainstalovány, podívejme se na část toho, co na nás hodí, když spustíme tento řádek:

Funkce Vyhledávání () Na druhou stranu nám to pomocí konzoly ukazuje balíčky, které jsou aktuálně načteny, podívejme se na následujícím obrázku, které balíčky máme načtené:

Navíc k instalaci balíčků to můžeme provést několika způsoby, první je prostřednictvím možnosti v horním menu Nástroje> Instalovat balíčky a pak máme prostřednictvím funkcí jazyka, druhý je ten, který doporučujeme, protože může být tedy součástí našeho skriptu.
K instalaci balíčku používáme install.packages, poté to musíme zahrnout, můžeme použít knihovna nebo vyžadovat K tomu je však nejlepší použít ten druhý, aby nedošlo k záměně s rozsahem funkcí, podívejme se, jak balíček nainstalujeme a zahrneme ggplot2:
 install.packages ("ggplot2") vyžadují ("ggplot2") 

Nakonec můžeme odstranit balíček, který můžeme použít remove.packages, pojďme se podívat, jak se používá:
remove.packages ("ggplot2")

Tímto ukončujeme tento tutoriál, se kterým již máme představu, jak s ním pracovat R., kromě vyjasnění bodů, jako jsou proměnné a datové struktury, základní aspekty, které musíme znát, abychom mohli plně využívat výhody tohoto silného a efektivního jazyka.Líbil se vám tento návod a pomohl mu?Autora můžete odměnit stisknutím tohoto tlačítka, čímž mu dáte kladný bod

Vám pomůže rozvoji místa, sdílet stránku s přáteli

wave wave wave wave wave