HtDig ***** Besoin d’un moteur de recherche pour votre site web, HtDig est là !!! Installation ============ Il faut au préalable installer apache, sous une ubuntu 6.10: .. code-block:: bash apt-get install apache2 puis installer htdig: .. code-block:: bash apt-get install htdig htdig a partir d’une url va suivre tout les liens (image, pdf, html, ...) et indexer chaque éléments. Création du repository ====================== Il faut ensuite créer l’index de la base de recherche. Pour cela il faut d’abord modifier le fichier de config /etc/htdig/htdig.conf. Les principaux paramètres sont: * database_dir: lieu de stockage de l’index * start_url: le site a indexer * limit_urls_to * common_url_parts * exclude_urls: les urls non indexer * bad_extensions: les liens a ne pas suivre Puis il faut lancer l’indexation: .. code-block:: bash sudo rundig Recherche ========= La recherche se fait via une page web http://monsite.com/cgi-bin/htsearch ou en rajoutant dans une de ces pages le formulaire suivant: .. code-block:: bash
Match: Format: Sort by:
Refine search:
.. note:: penser à copier le répertoire /var/www/htdig dans le home de votre site web Personnalisation ================ Vous pouvez également personnaliser les fichiers suivants afin d’afficher des informations spécifiques à votre site : /etc/htdig/header.html Cette page s’affichera en haut de tous les résultats de recherche. /etc/htdig/footer.html Cette page s’affichera en haut de tous les résultats de recherche. /etc/htdig/nomatch.html Cette page s’affichera lorsqu’une recherche n’aura donné aucun résultat. /etc/htdig/syntax.html Cette page s’affichera en cas d’erreur de syntaxe dans une expression booléenne. Vous pouvez trouver ici le repertoire htdig a placer à la racine de votre site web et la le repertoire /etc/htdig modifié afin de présenter une page de recherche http://monsite.com/htdig/index.html à la mode Management Note. Les fichiers modifiés sont header.html , footer.html, syntax.html et nomatch.html