Netzflut

Webdesign, Webentwicklung, Drupal & Zeuchs

Cache warmer/Boost ideen

Inhaltsverzeichniss

    Boost ist ein Drupal Modul das seiten extrem schnell macht. Es cached Seiten und liefert diese direkt aus. Nachteil ist das wenn man einen node editiert, der anonyme user noch die alte Seite sieht bis der cache neu erzeugt wird.

    Die Idee

    Per chron über den root server: cache löschen und neu erzeugen mit einem crawler.

    Crawler Ansätze

    http://www.zyxware.com/articles/2655/simple-script-to-pre-warm-boost-cache-on-a-small-site
    http://www.metaltoad.com/blog/how-drupals-cron-killing-you-your-sleep-simple-cache-warmer
    http://tomroelandts.com/articles/how-to-ensure-that-visitors-always-see-cached-pages-in-drupal-7
    http://erikriffs.com/web-server-cache-warming-by-crawling-sitemaps/
    WGET
    http://www.kossboss.com/linux---wget-full-website
    http://www.linuxforums.org/forum/applications/145133-get-complete-webpage-wget-curl.html

    https://www.drupal.org/node/1576686
    https://www.drupal.org/node/2229743

    Vorhandene Sitemap crawlen

    wget --quiet http:∕∕example.com∕sitemap.xml --output-document - |\
    perl -n -e 'print if s#</?loc>##g' | wget -q --delete-after -i -
    wget -r -R jpg,php,JPG,gif,png,ico,js,css -nd -l80 -nv --delete-after http://www.example.com/
    wget -r -l4 –spider -D site.com http://www.site.com

    -r = rekursiv
    -l = crawltiefe
    -spider = no download
    -D domains to spider

    Es eicht eigendlich nur die Seite zu requesten, ohne Bilder

    Wget Spider the whole page

    http://www.linuxjournal.com/content/downloading-entire-web-site-wget
    http://beeznest.wordpress.com/2012/07/01/spider-a-website-with-wget/ | gut beschrieben

    Remote Drupal cache löschen

    http://nadeausoftware.com/node/98

    <?php
    <?php
    // define static var
    define('DRUPAL_ROOT', getcwd());
    // include bootstrap
    include_once('./includes/bootstrap.inc');
    // initialize stuff
    drupal_bootstrap(DRUPAL_BOOTSTRAP_FULL);
    // clear cache of core and views
    drupal_flush_all_caches();
    views_invalidate_cache();
    ?>

    Problem Multisite

    Das Script funktioniert so nicht mit einer Multisite. Man muss ein paar Sachen beachten. Also hier:
    http://drupal.org/node/684734
    http://david.narrabilis.com/node/39

    Tagging: 
    Drupal: