Vă mulțumim pentru susținere

Localizarea textului în imagine

În prezent, lucrez la un proiect și scopul meu este să localizez textul într-o imagine. OCR'ing textul nu este încă intenția mea. Vreau să obțin practic limitele textului dintr-o imagine. Folosesc componenta de imagistică AForge.Net pentru manipulare. Orice asistență într-un fel sau altul?

Actualizare 2/5/09: De atunci am parcurs o altă rută în proiectul meu. Totuși, am încercat să obțin text folosind MODI (Microsoft Office Document Imaging). Acesta vă permite să OCR o imagine și trage text de la ea cu ușurință.

0
adăugat editat

4 răspunsuri

Acesta este un domeniu activ de cercetare. Există literalmente oudele unor lucrări academice pe această temă. Va fi dificil să vă acordați asistență mai ales fără prea multe detalii. Căutați anumite tipuri de text? Fonturi? Doar engleză? Sunteți familiarizați cu literatura academică?

Detectarea textului este o problemă standard în orice sistem de recunoaștere a caracterelor optice (OCR) și, prin urmare, există o mulțime de coduri pe interwebsitele care o rezolvă.

Aș putea să încep să înscriu grămezi de linkuri de la Google, dar vă sugerez să faceți o căutare pentru "detectarea textului" și să începeți să citiți :). Există și un exemplu de cod disponibil.

0
adăugat

Dacă sunteți în regulă atunci când utilizați un API online pentru aceasta, API-ul de la adresa http: //www.wisetrend. com / wisetrend_ocr_cloud.shtml poate face detectarea de text în plus față de doar OCR.

0
adăugat

recunoașterea textului în interiorul unei imagini este într-adevăr un subiect fierbinte pentru cercetătorii din acest domeniu, dar a început să scape de sub control atunci când captcha's a devenit "norma" în ceea ce privește apărarea împotriva spam-urilor. De ce să folosim captcha ca protecție? bine pentru că este / a fost foarte greu să localizați (și să citiți) text în interiorul unei imagini!

Motivul pentru care am menționat captcha-ul este că cel mai mare progres este făcut în acea zonă minusculă și cred că soluția ta ar putea fi găsită cel mai bine acolo. mai ales pentru că captcha-urile sunt într-adevăr despre localizarea textului (sau ceva care seamănă cu textul) în interiorul unei imagini aglomerate și apoi încercarea de a citi corect literele.

astfel încât dacă vă puteți găsi un bun instrument sursă de captură sursă open , probabil că aveți tot ce aveți nevoie pentru a continuați căutarea ...
Ați putea arunca chiar și cel mai dificult cod care se ocupă de recunoașterea caracterelor în sine, deoarece acele OCR-uri sunt folosite pentru a citi textul distorsionat, ceva ce nu trebuie să faceți.

*: avansare în termeni de informații vizibile, utilizabile și practice pentru un "non-cercetător"

0
adăugat
Celălalt motiv pentru care am menționat captcha-ul este că probabil acesta este "proiectul" său. :-)
adăugat autor T.E.D.

Stroke width transform can do that for you. That's at least what MS developed for their mobile phone OS. A discussion on the implementation is here at https://stackoverflow.com/

0
adăugat