Perl è un linguaggio di programmazione che viene comunemente utilizzato dai programmatori per la sua facilità d'uso per scopi generali. Programmatori che sono stati di programmazione per un po ', ma sono nuovo Perl troveranno facile da imparare, da quando è stato influenzato da altri linguaggi di programmazione. Il programma utilizza funzioni analoghe a quelle di altri linguaggi di programmazione. Sviluppato da Larry Wall nel 1987, era originariamente un programma di manipolazione del testo, ma le versioni successive hanno superato di gran lunga il suo scopo originale. Perl, conosciuto come un linguaggio di reporting e di un pratico programma di estrazione, è ora utilizzato nella programmazione di rete, videogiochi, sviluppo web e molto altro ancora.
Metadati si riferisce alle informazioni che descrivono gli elementi di dati o attributi come nome, tipo, dimensioni, ecc Queste informazioni vengono utilizzate per comprendere meglio il tipo di contenuti che vengono presentati. HTML facilita l'uso dei dati di Meta di codifica e la strutturazione di un sito web. I meta dati trovati nel codice HTML vengono utilizzati per descrivere quello che il sito web è di circa, e consente di robot dei motori di ricerca a scansione per queste informazioni quando viene fatta una ricerca per una parola chiave specifica. Perl può essere utilizzato per estrarre queste informazioni o HTML Meta dati da un sito web scrivendo un piccolo programma per la ricerca e fornire un rapporto che mostra i dettagli meta-dati.
Estrarre i dati HTML Meta tramite HTML:: HeadParser
Aprite il vostro editor di codice Perl e si preparano a scrivere il codice per estrarre i metadati trovato tra le <head> e </ head> tag HTML.
#! / usr / bin / perl
contenuti "print-Type: text / html \ n \ n";
Si comincia con l'ausilio di due moduli.
Il LWP:: Simple; scarica il modulo della pagina web si sta per estrarre i dati da meta, poi seguito dal codice HTML:: HeadParser; modulo:
use LWP:: Simple;
use HTML:: HeadParser;
Il $ url = ottenere obiettivi di comando l'indirizzo del sito web:
$ Url = get ( "http://www.somesite.com");
$ Head = HTML:: HeadParser-> new;
$ Head-> parse ( "$ url");
I comandi seguenti estrarre i metadati da titolo, descrizione, parole chiave, tipo di contenuto e lingua del contenuto:
print $ head-> header ( 'Titolo'). "\ n \ n";
print $ head-> header ( 'X-Meta-Description'). "\ n \ n";
print $ head-> header ( 'X-Meta-Keywords'). "\ n \ n";
print $ head-> header ( 'Content-Type'). "\ n \ n";
print $ head-> header ( 'Content-Language'). "\ n \ n";
exit;
Eseguire il programma, poi le informazioni dei metadati sarà visualizzato.
Perl è un semplice linguaggio di programmazione che è pratico ed efficiente. Un compito di estrarre i metadati da un sito web è reso facile con un programma Perl semplice, come si può vedere dal codice. Le informazioni estratte dai metadati consentono di analizzare come un particolare sito web è stato ottimizzato per i motori di ricerca. I metadati trovato tra le <head> e </ head> tag HTML posso dire quali parole chiave il sito è per la classifica e per aiutarvi a decidere quali parole chiave si può nicchia per.

Delicious
Digg
Google
Yahoo