Jak klonovat jakýkoli web pomocí HTTrack

Obsah

HTTrack je bezplatný a bezplatný a multiplatformní software, jehož účelem je zachytit web, tj. Stáhnout si celý web nebo jeho část, aby bylo možné jej později navigovat offline. Existuje verze pro Linux s názvem WebHTTrack, a jeho verze pro Windows se nazývá WinHTTrack. Software HTTrack si můžeme stáhnout z jeho oficiálních webových stránek:

V případě Linuxu jej také můžeme nainstalovat z repozitářů pomocí následujícího příkazu.

 sudo apt-get install httrack

Tento software používá se hodně ke kopírování webových stránek a poté je nahrajte na jiný server a použijte je k přesměrování provozu na stránku kopírování a posílání návštěvníků na falešnou stránku. Používají ho také ti, kteří chtějí vidět kód nebo provoz konkrétního webu. Podívejme se na příklad s webem httrack.com, kde je aplikace hostována.

 httrack "httrack.com"
Tento příkaz stáhne soubory z webu do složky www.httrack.com, které můžeme vidět lokálně.

HTTrack vezme jakýkoli web a vytvoří kopii ve složce nebo na disku, kde jsme umístěni. To může být užitečné při hledání dat na webu offline, jako jsou e -mailové adresy, užitečné informace pro seo nebo struktura webu. HTTrack přichází jak ve Windows, tak ve verzi pro Linux a použití je stejné pouze v tom, že ve Windows má vizuální intergaz.

Můžeme použijte Httrack pro penetrační testování a testování zabezpečení, protože při vytváření repliky webové stránky umožňuje analyzovat kompletní obsah a soubory, které jsou staženy, určit, že útočník nevidí žádný kritický soubor. Když shromažďujeme data a informace, můžeme provádět testy, vyhledávat a analyzovat kód nebo klíčová slova, můžeme také shromažďovat data, která lze později použít.

Také tímto způsobem lhackeři používají kopie vytvořené k jejich nahrání na server s webovou doménou zkopírovanou k emulaci webových stránek a poté je použít prostřednictvím phishingu ke krádeži dat nic netušících uživatelů nebo k provádění útoků sociálního inženýrství. Httrack má mnoho možností a parametrů, které lze použít ke zlepšení stahování, proto se používá tento příkaz:

 httrack -pomoc

Některé důležité parametry, které můžeme s nástrojem Httrack použít, jsou:

  • -m: udává například maximální velikost souboru v bajtech ke stažení -m 20000000 odpovídá 20 mb.
  • -mim: slouží ke stažení pouze určitého typu souboru, který označíme jeho příponou, například příkazem
 httrack www.WEB.com -mime: application / * + mime: application / pdf
Použití httrack je jednoduché, musíme přidat doménu webové stránky, kterou chceme zkopírovat, a poté spustit skenování umístěné v adresáři na našem pevném disku, kam budeme web ukládat. Vzhledem k množství informací ke stažení musíme vzít v úvahu, kolik odkazů nebo obsahu může mít web. Prozkoumání kopie webu lze použít k hledání nedostatků a zranitelností, které mohou ohrozit procházení, a také k určení, které části je vhodné šifrovat nebo zvýšit zabezpečení.

Pokud je cílem stahování najít informace o společnosti nebo seznamy uživatelů, telefonů nebo jiných údajů, zejména pro sociální inženýrství nebo se snažíte zfalšovat web nebo se přihlásit k získání uživatelských dat, je HTTrack vynikajícím nástrojem pro oba úkoly.

Grafické rozhraní s WebHTTrack
WebHTTrack je grafické rozhraní pro httrack, které se používá z webového prohlížeče a umožňuje kopie celých webových stránek pro offline přístup a automaticky upravuje odkazy. Nástroje jako WebHTTrack mohou pomoci a umožňují aktualizaci kopie, aniž byste si museli pamatovat parametry pro stažení nebo kopírování webové stránky a jejího obsahu. Můžeme jej nainstalovat pomocí příkazu:

 sudo apt-get install webhttrack
Pak do spusť to napíšeme stejný příkaz:
 webhttrack
Na spusťte grafické rozhraní, můžeme jít přímo přes nabídku aplikací a hledáme aplikaci Browse Mirrored Websites.

Další možností je jednoduše, jak jsme již řekli z okna terminálu, napsat příkaz webhttrack pro spuštění místního webového serveru na portu 8080, poté otevřeme prohlížeč s přihlédnutím k tomu, že není v anonymním nebo soukromém režimu a do prohlížeče napíšeme adresu localhost: 8080.

To nám ukáže grafického průvodce, který nám pomůže pracovat s httrack, pro začátek budeme muset nakonfigurovat jazyk a kliknout na Další. Dále nakonfigurujeme nový projekt, přičemž výhodou grafického rozhraní je, že můžeme uložit data stažených webů a parametry použité v textovém souboru.

Dále přiřadíme web, který budeme kopírovat:

Poté v možnostech Definovat nakonfigurujeme parametry a filtry pomocí průvodce:

Poté po konfiguraci filtrů na další obrazovce začneme skenováním.

Nevýhody používání HttrackPoužití nástroje Httrack k provádění tohoto typu skenování a stahování z webu má některé nevýhody, například následující:

  • Nezachycuje dynamický obsah ani skriptované stránky.
  • Stahování stránek, které jsou příliš velké nebo obsahují velké soubory, může způsobit zhroucení serveru.
  • Pokud použijeme httrack v příliš mnoha simultánních připojeních ke stejné webové stránce, můžeme zpomalit server nebo jej vyřadit z provozu.

Mohl by vás zajímat tutoriál, kde je vytvořen kód pro sledování odkazů:

Sledujte webové odkazy pomocí Pythonu

Líbil se vám tento návod a pomohl mu?Autora můžete odměnit stisknutím tohoto tlačítka, čímž mu dáte kladný bod
wave wave wave wave wave