Vă mulțumim pentru susținere

Lucene Rezultatul scorului

În Lucene, dacă aveați mai multe indexuri care acoperă fiecare câte o singură partiție. De ce aceleași căutări pe diferite indexuri returnează rezultate cu scoruri diferite? Rezultatele de la diferite servere se potrivesc exact.

adică dacă am căutat:

  • Nume - John Smith
  • DOB - 11/11/1934

Partition 0 would return a score of 0.345

Partition 1 would return a score of 0.337

Ambele se potrivesc exact cu numele și cu DOB.

0
adăugat editat

4 răspunsuri

Am primit această eroare săptămâna trecută după ce am modificat variabila de mediu PYTHONPATH și mi-am scris greșit calea către arcgisscripting.pyd.

Corectarea PYTHONPATH pentru a include "c: \ Program Files \ ArcGIS \ Bin" (corect scris) a rezolvat problema.

5
adăugat
Ei bine, a trebuit să actualizez config-ul exclipse cu calea arcgis \ bin ... și acum rulează, într-adevăr, într-adevăr, lent ... dar funcționează. Mă întreb de ce este atât de lent, inactiv este mult mai rapid pentru a compila.
adăugat autor Rex M
Pentru a clarifica, alergam dintr-un fișier batch ... nu din eclipsa. Este eclipsa folosind un alt python? ce versiune este ArcGIS și IDLE pe care îl utilizați?
adăugat autor Jay Cummins
S-ar putea să doriți să verificați configul dvs. de eclipsă (de ex. vogella.de/articles/Python/ images/pydev06.gif ) și să vedeți dacă utilizați versiunea potrivită pentru oricare ArcGIS pe care îl utilizați ( wiki.gis.com/wiki/index.php/Python ).
adăugat autor Jay Cummins
poate eclipsa scanează arcgis \ bin (poate recursiv)? poate încercați să mutați arcgisscripting.pyd într-un director gol și să actualizați config-ul de eclipsă? ( Nu știu eclipsa, deci luați sugestiile mele cu o sare de sare )
adăugat autor Jay Cummins
sau poate mai întâi, rulați procmon.exe (SysInternals goo.gl/J5nW ) și vedeți dacă este ceva evident că sare out.
adăugat autor Jay Cummins

Deoarece scorul este determinat pe index dacă nu mă înșel complet.

Dacă aveți indicii diferiți (date mai mult / mai puțin sau diferite care au fost indexate), punctajul va diferi:

http://lucene.apache.org/core/3_6_0/scoring.html

(Atenție: conține matematică :-))

0
adăugat
adăugat autor Gene T

notarea conține Inverse Frecvența documentelor (IDF). Dacă termenul "John Smith" este într-o singură partiție, de 0, 100 de ori și în partiția 1, o dată. Scorul pentru căutarea lui John Smith ar fi o căutare mai mare în partiția 1, deoarece termenul este mai redus.

Pentru a obține acest lucru ar trebui să aveți indicele să vă fie peste toate partițiile, sau va trebui să suprascrieți IDF.

0
adăugat
Sau puteți construi un multisearcher de la toți indicii.
adăugat autor Shashikant Kore

Ați putea fi, de asemenea, interesat de rezultatul explain () ) și Explicație object modul în care lucrurile sunt marcate așa cum sunt ele.

0
adăugat