Font Size

SCREEN

Profile

Layout

Direction

Menu Style

Cpanel

Aninki Code

JSOUP

JSOUP es una biblioteca Java para trabajar con HTML. Proporciona una API para la extracción y manipulación del formato HTML.

+ INFO

JSOUP -Parseando una url

El tratamiento con jsoup es muy sencillo. Para parsear un documento html:

		Document doc = Jsoup.parse(html);

Si por ejemplo, si queremos obtener los tags standards de body, title.. existen ya métodos ya creados para acceder a ellos

		Jsoup.parseBodyFragment(html);
		doc.title();
		Jsoup.parse(html).title()

También nos permite acceder a los tags por nombre 

		 doc.select("p").first()

También nos permite acceder a los atributos 

		 doc.select("a").attr("href"));

E incluso añadir texto 

		doc.select("p").first().append(".Texto nuevo")

Sanitizando la una entrada

La librería tambien nos permite validar si las entradas son seguras.

		//nos dice si es segura la entrada
		Jsoup.isValid(unsafe, Whitelist.basic()))
		// nos elimina los datos que no son seguros
		Jsoup.clean(unsafe, Whitelist.basic());