Python - vzdálené soubory

Obsah

Krajta nám umožňuje pracovat se vzdálenými soubory, možná to takto nezní logicky, ale vzdálené soubory v tomto případě nejsou nic jiného než dotazy na webové stránky z našeho programu Python, důvodem může být dotazování na REST Web Services které nám umožňují získat hodnoty pomocí DOSTAT nebo přímo dotazovat stránky a manipulovat s jejich obsahem.

Abychom toho dosáhli, použijeme některé z mnoha knihoven, které nabízí Krajta pro práci se sítěmi, čímž odstraníme technické překážky a soustředíme se pouze na to, jak je to důležité v naší programovací logice.

urllib a urllib2
Tato dvě knihkupectví urllib Y urllib2 Umožňují nám provádět práci s přístupem k souborům prostřednictvím sítě, jako by se nacházeli v našem místním prostředí, pomocí jednoduchého volání funkce nám to může sloužit k mnoha věcem, například k tomu, že můžeme používat web a jeho obsah dělat zprávy v našem programu o tom, co v něm můžeme najít.

Tyto dvě knihovny jsou si podobné, jejich rozdíl je v tom, že urllib2 může to být trochu sofistikovanější, kde pokud chceme jednoduše provést dotaz bez dalších důsledků, můžeme použít urllib, ale pokud chceme provést nějaký ověřovací proces nebo použít cookies, pak urllib2 může to být správná volba pro náš program.

Protože teoreticky víme, co potřebujeme a proč to potřebujeme, podívejme se na malý příklad kódu, aby nám bylo jasné, co můžeme dělat, v následujícím příkladu se chystáme otevřít web z našeho programu a poté pomocí regulárních výrazů extrahujeme odkaz na jeho obsah, který použijeme urllib:

 >>> z urllib import urlopen >>> webpage = urlopen ('http://www.python.org') >>> import re >>> text = webpage.read () >>> m = re.search ( 'Tutorial', text, re.IGNORECASE) >>> m.group (1) 

Jdeme krok za krokem, nejprve z knihovny urllib, kterou importujeme urlopen, pak vytvoříme proměnnou s názvem webová stránka což je ten, který bude obsahovat výsledek urlopen Co uděláme s oficiálním webem Krajta, s tímto již importujeme re Abychom mohli pracovat s regulárními výrazy, říkáme, že text je proměnná, která bude mít obsah čtení stránky, provedeme vyhledávání s regulárním výrazem a nakonec seskupíme výsledek, který by měl vytisknout následující:

http://docs.python.org/

Je to díky metodě urlopenTo, co děláte, je, že nám to umožňuje pracovat s webovou stránkou, jako by to byl souborový objekt. Tímto způsobem můžeme použít mnoho funkcí, které můžeme s tímto typem objektů použít, i když chceme, abychom si stránku mohli stáhnout a zpracovat to z našeho lokálního velmi jednoduchým způsobem pomocí metody urlretrieve jak následuje:

 urlretrieve ('http://www.python.org', 'C: \ python_webpage.html')
Jediné, co děláme, je předat jako druhý parametr cestu v našem lokálním prostředí, kam by měl být soubor s kopií stránky uložen bez větších obtíží.

Tímto tento tutoriál dokončujeme, protože vidíme, že provádění složitějších prací, jako je používání stránek v našich programech, je díky knihovnám Krajta.

Líbil se vám tento návod a pomohl mu?Autora můžete odměnit stisknutím tohoto tlačítka, čímž mu dáte kladný bod
wave wave wave wave wave