Réifier le futur

18 décembre 2007

Bête et méchant

Classé dans : Eau chaude, Perl — Olivier Schwander @

Un petit uniligne faux dans la plupart des cas pour extraire les urls des cibles des liens présents dans une page hml.

perl -ne "/2007-2008/ && /href=\"(.*pdf)\"/ && print \"http://www.google.fr/\".\$1, \"\n\""

Ici on ne prend que les urls qui contiennent 2007-2008, qui se terminent par pdf et on rajoute une une url de base avant si on doit traiter des liens relatifs.

Je répète, c’est crade, c’est faux, et c’est laid mais ça marchouille à peu près.

N’empêche, c’est rapide à faire.

Propulsé par WordPress