Technik, Gothic und Anderes

Technik ist Spiel, Gothic ist ernst und Zeit hat man zuviel

Archiv für 'Web' Kategorie


Ausschliessen von Repositories bei WebSVN

Geschrieben von skaldrom am 30. August 2007

hiddenWie schon ein paar mal erwähnt: Websvn ist ein geniales Tool! Es ermöglicht das Browsen von verschiedenen Repositories übers Web mit dem Browser. Manchmal möchte man aber nicht alle Verzeichnisse freigeben und anzeigen.

Ich habe einen Patch erstellt, der eine neue Option in /etc/websvn/config.inc erlaubt: $config->excludeRepository(”name”);. Diese Option kann mehrfach angegeben werden und alle excludeten Repositories werden nicht mehr dargestellt…

Beispiel:

// Select Repositories to exclude
$config->excludeRepository("Geheime-Codes");
$config->excludeRepository("Jokes");

Und hier der Patch: Websvn exclude Repositories Patch.

Viel Spass… Eine Rückmeldung bei Anwendung würde mich freuen…

Teile und geniesse:
  • Technorati
  • del.icio.us
  • MisterWong
  • Digg
  • StumbleUpon
  • blogmarks
  • Furl
  • Simpy
  • Spurl
  • YahooMyWeb

Eingeordnet in Web | 1 Kommentar »

Tote Links in einem Blog oder einer Website finden

Geschrieben von skaldrom am 25. August 2007

Tote Links sind ärgerlich und unprofessionell. Sogar der Überblogger schlägt vor, seine Blogs ab und zu zu entrümpeln. Um sie zu vermeiden gibt es ein paar Lösungen, zum Beispiel keine Links machen :-D . Oder Online, wie die Google Webmaster Tools und Ähnliche. Als Kontrollfreak habe ich es gerne unter Kontrolle und möchte die Geschichte lokal auf meinem Rechner betreiben.

Eigentlich hätte ich nichts gegen klickibunti gehabt, aber leider kann zum Beispiel KLinkStatus keine Einstellungen speichern. Nundenn, dann muss halt die gute alto Kommandozeile ran. Ich habe mich für LinkChecker entschieden, weil er vielfältige Einstellungsmöglichkeiten und Ausgabeformate anbietet. Ausserdem ist er für Windows und Lunix erhältlch und die Entwicklung ist aktiv. Ebenso beachtet er robots.txt, was sehr hilfreich ist.

Ich kenne mich, ich kann mir die Kommandozeilenoptionen keine 18 Minuten merken und darum sei wohlgemut eine Konfigurationsdatei geschrieben und auf den Namen blogcheck.conf getauft. Es kann auch heruntergeladen werden: Beispielkonfiguration für linkchecker um ein Blog zu checken.

html Ausgabe von Linkchecker CSV Auswertung in Openoffice (Excel kann das auch)

Zuerst die Ausgabe. Ich hätte gerne html und zur besseren Auswertung noch in csv. Während des Durchgangs hätte ich gerne ein Bisschen was an Rückmeldungen (habe ich schon erwähnt das ich ein Kontrollfreak bin?). Bei voller Lautstärke pustet mich linkchecker zu mit Info, status reicht also.

[output]
# print status output
status=1
# turn on/off --verbose
verbose=0
# turn on/off --warnings
warnings=0
# additional file output
fileoutput=html,csv

Nun noch die Logger konfigurieren:

#
# Loggers
#
[csv]
filename=linkchecker-out.csv
separator=,
quotechar="
parts=all

[html]
filename=linkchecker-out.html
# colors for the various parts
colorbackground=#fff7e5
colorurl=#dcd5cf
colorborder=#000000
colorlink=#191c83
colorwarning=#e0954e
colorerror=#db4930
colorok=#3ba557
parts=all

Noch ein Bisschen das Checkverhalten beeinflussen:

[checking]
# number of threads
threads=5
# connection timeout in seconds
timeout=60
# check anchors?
anchors=1

Und nun wirds interessant. Wir wollen folgendes vermeiden:

  • Der Linkchecker soll keine Ads anklicken.
  • Der Linkchecker soll uns nicht bei Partnerprogrammen eintragen.
  • Der Linkchecker soll uns nicht bei Social Bookmarkingdiensten eintragen.
  • Er soll uns keine Kommentare posten und auch das Blog nicht administrieren.

Das kann einfach so und mit Regular Expressions erreicht werden. Interessant ist, das der Syntax der URLs trotzdem geprüft wird.

[filtering]
ignore=
ignore=
# ignore google ads
 googlesyndication.com
 google # Just to get sure!
#ignore affiliates
 amazon\.com
 trigami\.com
 linklift
 zanox\.com
# ignore social bookmarking
 technorati\.com
 del\.icio\.us
 mister-wong\.com
 digg\.com
 stumbleupon\.com
 blogmarks\.net
 de\.lirio\.us
 furl\.net
 simpy\.com
 spurl\.net
 yahoo\.com
# ignore administrative links
 wp-comments-post\.php

Und nun: Starten *froi*:

linkchecker --config=blogcheck.conf http://blog.oncode.info

Nach dem Durchlauf kann linkchecker-out.csv in eine Tabellenkalkulation importiert oder linkchecker-out.html im Browser geöffnet werden.
Viele weitere Ausgabeformate wie SQL oder XML lassen andersweitige Auswertungen zu.

LinuxUser hat einen sehr schönen, einführenden Artikel zu linkchecker.

Nachtrag:
Bei Fehlern wie: had no anchor support oder url-anchor-not-found kann die Suche nach Anchors in der Konfigurationsdatei ausgeschaltet werden:

[checking]
...
# check anchors?
anchors=0

Wenn der Server überfordert ist und Timeoutet kann beim Aufruf der Parameter -P1 übergeben werden, welcher zwischen den Aufrufen eine Sekunde einschiebt. Wahlweise kann auch das Timeout in der Abteilung [checking] nach oben geschraubt werden.

Wenn der Fehler WARNING Could not start a new thread. Check that the current user is allowed to start new threads. auftreten sollte, dann könnte es sein dass der Parameter timeout im Config zu gross gefwählt wurde.

Teile und geniesse:
  • Technorati
  • del.icio.us
  • MisterWong
  • Digg
  • StumbleUpon
  • blogmarks
  • Furl
  • Simpy
  • Spurl
  • YahooMyWeb

Eingeordnet in Blogging, Web | Keine Kommentare »

Websvn mit Repositories in verschiedenen Verzeichnissen

Geschrieben von skaldrom am 15. August 2007

Websvn in AktionWebsvn kann mehrere Repositories in verschiedenen Unterverzeichnissen darstellen, allerdings muss man sich entscheiden: Alle Repositories aller Unterverzeichnisse aufs mal oder nur Repositories eines einzelnen Unterverzeichnisses.
Bei uns im Betrieb hat jede Abteilung (Informatik, Physik, …) ihre Repositories in eigenen Verzeichnissen auf dem Server. Websvn unterstützt zwar mehrere parentPath und stellt alle SVN-Repositories in diesen Verzeichnissen dar, will man aber auch noch einzelne Ansichten für die Abteilungen machen wird es schwer. Lösung: Der parentPath wird an Hand der URL gesetzt.

Unter Debian kann die Datei /etc/websvn/svn_deb_conf.inc direkt missbraucht werden. In anderen Distributionen muss eventuell am Schluss der Datei config.inc folgendes Codesnippet eingefügt und danach für die Änderungen gebraucht werden:

<?php
if ( file_exists("/etc/websvn/svn_sup_conf.inc") ) {
  include("/etc/websvn/svn_sup_conf.inc");
}
?>

Nun soll an Hand des Pfades der /etc/websvn/svn_deb_conf.inc parentPath gesetzt werden:

/websvn
Alle Repositories
/websvn/informatik
Alle Repositories der Abteilung Informatik
/websvn/physik
Alle Repositories der Abteilung Physik

Dafür muss man in der oben konfigurierten Datei folgendes zum Besten geben (bei mehr Abteilungen einfach intelligent erweitern):

<?php
  $repository=dirname($GLOBALS['HTTP_SERVER_VARS']['PHP_SELF']);
  // echo "::: $repository :::";
  switch($repository) {
    case "/websvn/informatik":
    case "/websvn/physik":
          $reppath="/data/svn/repositories/".substr(dirname($GLOBALS['HTTP_SERVER_VARS']['PHP_SELF']),8)."/"; // "/websvn/" entfernen
          //print "::: $reppath :::"; exit(1);
          $config->parentPath($reppath);
    break;
    default:
        $config->parentPath("/data/svn/repositories/informatik");
        $config->parentPath("/data/svn/repositories/physik");
    break;
  }
?>

Der Apache muss dies natürlich auch noch mitkriegen. Die /websvn/ URL-Teile müssen dort konfiguriert werden (site-available oder .htaccess) und das wärs dann:

# Websvn is installed in /usr/share/websvn
Alias /websvn /usr/share/websvn

Alias /websvn/informatik /usr/share/websvn
Alias /websvn/physik /usr/share/websvn

<Location /websvn>
  # DO FUNKY (AUTHENTICATION) STUFF HERE
  <IfModule mod_php4.c>
    php_flag magic_quotes_gpc Off
    php_flag track_vars On
  </IfModule>
</Location>
Teile und geniesse:
  • Technorati
  • del.icio.us
  • MisterWong
  • Digg
  • StumbleUpon
  • blogmarks
  • Furl
  • Simpy
  • Spurl
  • YahooMyWeb

Eingeordnet in Linux, Web | Keine Kommentare »

Vereinfachtes Bloggen

Geschrieben von skaldrom am 13. October 2006

Gerade wenn man viele Codebeispiele hat wie dieses Blog und darum ausgedehnt den <pre> Tag verwendet und zudem noch mit Firefox unterwegs ist, ist der eingebaute Wordprozessor von Wordpress.com suboptimal. writetomyblog.com verspricht etwas Besserung und dieser Artikel wird gerade mit diesem Service erstellt.
Er hat zwar auch Macken, sieht aber 1337 aus :) und hat eine Rechtschreibeprüfung auf Deutsch…

Scribefire in ActionEbenfalls sehr empfehlenswert ist die Scribefire Extension für den Firefox. Sie kann mit einem kleinen Icon am unteren Rand des Browsers aufgerufen werden und erlaubt zum Beispiel bei Wordpress das Erstellen von Blogeinträgen auf sehr komfortable Art und Weise. WYSIWYG und für uns Puristen auch im Quellcode. Einfach nett und genial.

Teile und geniesse:
  • Technorati
  • del.icio.us
  • MisterWong
  • Digg
  • StumbleUpon
  • blogmarks
  • Furl
  • Simpy
  • Spurl
  • YahooMyWeb

Eingeordnet in Web | Keine Kommentare »

Internet und Spass

Geschrieben von skaldrom am 10. October 2006

Ich habe wieder Internet *freu*. Und nun weiss ich dank dem Cyborg Name Decoder auch, was Michael bedeutet:

Mechanical Intelligent Construct Hardwired for Assassination and Efficient Learning

Teile und geniesse:
  • Technorati
  • del.icio.us
  • MisterWong
  • Digg
  • StumbleUpon
  • blogmarks
  • Furl
  • Simpy
  • Spurl
  • YahooMyWeb

Eingeordnet in Privat, Web | Keine Kommentare »