Jak na stažení webu pro procházení v offline režimu

  1. Stáhnout nástroj WinHTTTrack website copier
  2. Spustit, zahájit projekt, zadat adresu vč. http(s) a v options nastavit:
    • limits/max transfer rate = 250000
    • scan rules:
      • jestli to je hlavní web (tzn. na dané doméně jediný, tak nic)
      • pokud se jedná o podadresu (např. kisk.phil.muni.cz/kpi), tak nastavit:
        -*
        +*/kpi/*
        +*/media/*
        +*/DependencyHandler.axd*
        +*.woff2 +*.woff +*.ttf +*.png +*.gif +*.jpg +*.jpeg +*.css +*.js -ad.doubleclick.net/* -mime:application/foobar
  3. Spustit stahování
  4. Pokud se nepodaří, nebo např. chybí CSS/JS, spustit znouv v módu *update existing site, případně smazat a celé znova
  5. Odstranit srcset atribut na obrázcích pomocí tohoto PowerShell skriptu (jako parametr předat skriptu relativní cestu k webu) – kód vložte do souboru remove_srcset.ps1 ve složce se staženým webem a spusťte ho z příkazové řádky příkazem
    powershell .\remove_srcset.ps1 -path="."
param (
    [string]$path
 )

Get-ChildItem $path -Recurse -Filter *.html | 
Foreach-Object {
    (Get-Content $_.FullName) -replace ' srcset=".*?"', '' | Set-Content $_.FullName
}