Message original de yule
Le : 03/11/2008 à 13:56:46
Dejà lu 2937 fois avant vous
Bonjour,
J'ai crée il y a 5 ans un petit moteur de recherche en full-text (méta moteur en php-mysql) j'indexe uniquement une page par sitete, soit sa page principale sur le titre, sa description, ses métas tags et son url, je n'index pas les autres pages de ce même site et ce n'est pas le but.
J'aimerais le remettre au goût du jour et que celui-ci offre plus de résultats…
Comme vous le savez, Le recherche en full-text est assez strict, il y a une restriction avec la recherche en texte intégral d'ou l'utilisation des boolens si MATCH() est utilisé, c'est le cas de mon petit moteur de recherche.
Actuellement, si la recherche est infructueuse et que le résultat est NULL, j'affiche les 5 derniers résultats de google par son API…
Comme le full text est très strict, j'aimerais élargir la recherche comme suit
Recherche full text avec boolen (pom* pour tous les mots qui commencent avec pom.. pomme, pommes, pomme de terre, etc…) FONCTIONNE ACTUELLEMENT
Pour l'ordre d'affichage, c'est selon la valeur sémantique du mot recherché sur le titre du site, la description, son url et ses métats tags, FONCTIONNE ACTUELLEMENT
J'aimerais une sorte de soundex sur la recherche, une recherche phonétique + orthographique si la recherche stricte est null du type : A FAIRE
ai en e
ou en u
y en i
au en o
eau en o
qu en c
th en t
dé-doublonnage de rr en r tt en t ss en s
Simplification des doubles consonnes
Suppression des consonnes en dernière lettre etc…
Pari --> Paris
Parriss --> Paris
ou encore :
bato --> bateau
batteau --> bateau
bateaus --> bateau
battau -- > bateau
Bateaux --> bateau etc..
Etc…
Le but serait bien d'avoir une recherche moins strict qu'actuellement et avec plus de choix à proposer sur la recherche effectués par les visiteurs
Si à ce stade, le résultat est encore NULL, il faudrait donc switcher sur une recherche en LIKE% qui est plus souple et y donner également une valeur sur les mots clefs trouvés (une valeur plus grande si le mot clef se trouve dans le titre du site, moins grande si celui-ci se trouve dans la description et encore moins grande s'il se trouve dans les métas tags.. etc… A FAIRE si nécessaire… Peut-être que la recherche phonétique et orthographique peut suffire ? à l'écoute de votre avis sur ce point
Et si à ce stade la recherche est toujours NULL… Alors affichage par l'API de google, les 5 premiers résultats de google , FONCTIONNE ACTUELLEMENT
J'ai des petits filtres sur des mots bannis au niveau sexe, il faudrait mieux coder mon regex…, A MODIFIE SI NECESSAIRE
Et évidemment nettoyer mon code sur cette recherche qui n'est certainement pas au top des top.. néanmoins, sur un total de 45'000 sites, la recherche reste très rapide..
Actuellement j'offre 2 choix sur la recherche, une recherche pour un site suisse ou un site francophone, ne sachant pas en son temps.. regrouper mes deux recherches, j'avais deux pages identiques pour juste un WHERE qui changeait en 1 ou 0 (on ne rigoles pas…)
Je souhaiterais donc une offre pour ces modifications, il s'agit de deux pages php + une page en include pour mes filtres, actuellement ce moteur de recherche fonctionne, mais il est malheureusement assez limité pour les raisons mentionnées ci-dessus. Merci de me mentionner ce que comprend votre offre et vos solutions.
D'avance merci pour votre réponse si cela vous intéresse.
Cordialement
Yule