Lucene Rezultatul scorului

În Lucene, dacă aveați mai multe indexuri care acoperă fiecare câte o singură partiție. De ce aceleași căutări pe diferite indexuri returnează rezultate cu scoruri diferite? Rezultatele de la diferite servere se potrivesc exact.

adică dacă am căutat:

  • Nume - John Smith
  • DOB - 11/11/1934

Partition 0 would return a score of 0.345

Partition 1 would return a score of 0.337

Ambele se potrivesc exact cu numele și cu DOB.

0
adăugat editat
Vizualizări: 5

4 răspunsuri

Am primit această eroare săptămâna trecută după ce am modificat variabila de mediu PYTHONPATH și mi-am scris greșit calea către arcgisscripting.pyd.

Corectarea PYTHONPATH pentru a include "c: \ Program Files \ ArcGIS \ Bin" (corect scris) a rezolvat problema.

5
adăugat
Ei bine, a trebuit să actualizez config-ul exclipse cu calea arcgis \ bin ... și acum rulează, într-adevăr, într-adevăr, lent ... dar funcționează. Mă întreb de ce este atât de lent, inactiv este mult mai rapid pentru a compila.
adăugat autor Rex M, sursa
Pentru a clarifica, alergam dintr-un fișier batch ... nu din eclipsa. Este eclipsa folosind un alt python? ce versiune este ArcGIS și IDLE pe care îl utilizați?
adăugat autor Jay Cummins, sursa
S-ar putea să doriți să verificați configul dvs. de eclipsă (de ex. vogella.de/articles/Python/ images/pydev06.gif ) și să vedeți dacă utilizați versiunea potrivită pentru oricare ArcGIS pe care îl utilizați ( wiki.gis.com/wiki/index.php/Python ).
adăugat autor Jay Cummins, sursa
poate eclipsa scanează arcgis \ bin (poate recursiv)? poate încercați să mutați arcgisscripting.pyd într-un director gol și să actualizați config-ul de eclipsă? ( Nu știu eclipsa, deci luați sugestiile mele cu o sare de sare )
adăugat autor Jay Cummins, sursa
sau poate mai întâi, rulați procmon.exe (SysInternals goo.gl/J5nW ) și vedeți dacă este ceva evident că sare out.
adăugat autor Jay Cummins, sursa

Deoarece scorul este determinat pe index dacă nu mă înșel complet.

Dacă aveți indicii diferiți (date mai mult / mai puțin sau diferite care au fost indexate), punctajul va diferi:

http://lucene.apache.org/core/3_6_0/scoring.html

(Atenție: conține matematică :-))

0
adăugat
adăugat autor Gene T, sursa

notarea conține Inverse Frecvența documentelor (IDF). Dacă termenul "John Smith" este într-o singură partiție, de 0, 100 de ori și în partiția 1, o dată. Scorul pentru căutarea lui John Smith ar fi o căutare mai mare în partiția 1, deoarece termenul este mai redus.

Pentru a obține acest lucru ar trebui să aveți indicele să vă fie peste toate partițiile, sau va trebui să suprascrieți IDF.

0
adăugat
Sau puteți construi un multisearcher de la toți indicii.
adăugat autor Shashikant Kore, sursa

Ați putea fi, de asemenea, interesat de rezultatul explain() ) și Explicație object modul în care lucrurile sunt marcate așa cum sunt ele.

0
adăugat