De ce elementele de tabel HTML au tab-uri și linii noi este numai pentru citire

Încerc să citesc/analizez o pagină web. Unele elemente de tabel par să aibă multe file și linii noi.

Curios de ce câteva cuvinte sunt precedate de tab/newline.

1

2 răspunsuri

Este pentru lizibilitate și mentenabilitate. Ajută la identificarea elementelor blocului și a containerelor și pentru a se asigura că etichetele de deschidere au etichete de închidere. În principiu, este de a face viața dezvoltatorului mai ușoară, deoarece browserele nu le pasă de indentare.

2
adăugat

Veți vedea probabil marcarea ca:

<table id="stuff">
  <tbody>
    <tr>
      <td>
        Hello World!
      </td>
    </tr>
  </tbody>
</table>
doc = Nokogiri.HTML(some_string)
p doc.at('#stuff td').text
#=> "\n\t\t\t\tHello World!\n\t\t\t"

După cum puteți vedea, într-adevăr este conținutul textului acelei celule.

0
adăugat
Vă mulțumim pentru răspunsul excelent. Din punct de vedere vizual văd mai multe linii. Cred că sunt separate de
. Ceva de genul asta: mere
portocale
pin toate într-un singur <td>. De asemenea, văd \ n și \ t. Cred că trebuie să utilizez ca un separator și să ignor \ n și \ t. Mă voi întoarce după ce verific câteva lucruri.
adăugat autor nilanjan, sursa