Essai de quelques moteurs de recherche
Cette page est destinée à l'expérimentation de diverses solutions d'indexation et de recherche dans le contenu de ce site.
Les solutions que je trouve les plus intéressantes gagnent le droit de figurer en page d'entrée du site.
Indexation de ce site et recherche avec FreeFind (les PDF ne sont pas indexés):
Comme
son nom ne l’indique pas, la version débridée est payante. La version
gratuite (actuellement celle utilisée ici) est néanmoins intéressante.
Comme elle n’indexe qu’un volume limité de documents (32Mo
apparemment), je dois exclure de l’indexation certains documents (les
PDF principalement). FreeFind indexe les documents html, texte, PDF,
Word, Excel, Powerpoint, RTF, OpenOffice. On peut finement régler les
paramètres d'indexation.
Noter que ce moteur construit et affiche une table donnant la structure du site (site map), un index alphabétique des mots trouvés dans le site, et possède un moteur de recherche avancé.
Indexation de ce site et recherche avec WebSideStory Express Search (les PDF ne sont pas indexés):
Google:
vous risquez de ne pas trouver les dernières modifications, car Google
n'indexe qu'épisodiquement ce site. Inversement, vous risquez de
trouver des documents qui n'existent plus ou qui ont été déplacés
depuis la précédente indexation par Google. Par contre, les PDF, DOC,
XLS, etc... sont indexés.
Vous pouvez chercher dans Google "site:tayeb.fr" (sans les guillemets) suivi des mots que vous recherchez.
Ou bien utilisez la boite de recherche ci-dessous, tirée du service Google Adsense: Google Custom Search Engine (CSE) ne semble pas fonctionner convenablement.
Rechercher par exemple Thunderbird sur mes pages avec ce moteur => 1 seul résultat, alors qu'il y en a bien plus.
http://korben.info/rechercher-avec-des-images.html : le moteur de recherches d'images par similarité de Google existe maintenant sous forme de plugin pour Chrome et Firefox TinEye est un moteur de recherche d'images "inversé", qui vous permet de savoir sur quel site figure une image donnée ou ses variantes.
On peut indiquer l'image de référence soit depuis son ordinateur, soit depuis une URL.
Permet aussi de voir si une image que vous avez publiée a été copiée...
Existe en extension de Firefox.
Essayez par exemple avec
http://tayeb.fr/wordpress/wp-content/uploads/meunier_nictea_2.jpg
http://tayeb.fr/wordpress/wp-content/uploads/red_bull_air_race_san_diego_2009__8s.jpg
http://lh5.ggpht.com/_hw_gLogQolQ/THp3gGIuezI/AAAAAAAAHPg/m4dsY7spsco/s1024/DSCN5555.JPG
(jeunes punaises vertes Nezara viridula)
Malheureusement,
la base de données des pages indexées est loin de couvrir tout le web,
et plusieurs recherches sur des images figurant pourtant dans mes pages
n'ont rien donné.
GazoPa : beaucoup plus lâche que TinEye sur la concordance des images, donne donc beaucoup plus de résultats, mais moins pertinents.
BYO : recherche encore plus lâche, basée sur les couleurs.
Bing
permet, à partir d'une recherche par mot clef (et pas à partir d'une
image), de cerner des images similaires. Laisser trainer la souris sur
une des images obtenues, puis "Images similaires".
pimeyes : reconnaissance de visages. Face Search Engine. Reverse Image Search. Upload photo and find out where images are published.
Recherche d'images similaires en local
Pour rechercher les images similaires dans votre ordinateur: Awesome Duplicate Photo Finder (duplicate-finder.com)
Recherches sur eBay
Voir cet exemple très instructif http://tinyurl.com/m2ec8o et observer le champ de recherche eBay:
(whitworth,bsw) 1/4 -(tap*,die*,spanner,helicoil,wrench*,socket*,nut*,pin*)
où on cherche des bidules whitworth ou bsw, 1/4, mais pas de tap*,die*, etc...