Es geht mal wieder ein Stöckchen herum. Diesmal zum Thema Blogtraffic, also was so mein Blog an kostbarem Verkehr im weltweiten Internet verursacht. [zugeworfen via .mactomster]

Ok, nichts leichter als das – muss man ja nur einen Blick in die aufbereiteten Webserverstatistiken werfen. Nun, das Feature haben wir noch nicht auf dem Server – aber dafür die puren Apache Access-Log Files. Also auf die Schnelle ein Script mit cut&grep zum Parsen geschustert und voilà ein brauchbares Ergebnis:

$ ./simplequickstats.sh /path/to/blog_access_log
start parsing ... done
2665110247 B
2602646.72 KB
2541.64 MB
2.48 GB

Mein Blog erzeugt somit ungefähr 2,5 GB Traffic pro Monat und da es sich ja um ein Stöckchen handelt, schicke ich es gleich mal an Sven (blog.daemonized.de) weiter.

Falls jemanden das quick&dirty cut&grep gewurschtel auf ein Apache Access-Log File interessiert, hier das Script:

#!/bin/sh

file=$1*
total=0

echo -n "start parsing ..."
for DATA in $(cat $file | cut -d' ' -f10 | grep -v - | grep -v +)
do
  total=$(($total + $DATA))
done
echo " done"

echo "$total B"
total=$(echo "scale=2; $total/1024" | bc -l)
echo "$total KB"
total=$(echo "scale=2; $total/1024" | bc -l)
echo "$total MB"
total=$(echo "scale=2; $total/1024" | bc -l)
echo "$total GB"

Die Brauchbarkeit hängt natürlich von der Struktur und dem Zeitraum des Logfiles ab. In meinem Falle waren das die geloggten Daten über den Zeitraum eines Monats. Die Verwendung des Scripts geschieht natürlich auf eigenes Risiko. :)

Ein Hinweis zu „file=$1*„. Durch das Sternchen werden neben dem blog_access_log auch mit die rotierenden Dateien blog_access_log.1, blog_access_log.2 usw. erfasst.