Quello che propone Opera Software però è un motore di ricerca molto diverso: non indicizza i contenuti dei siti web, ma memorizza il markup, lo stile, gli script e le tecnologie che si nascondono dietro alle pagine stesse.
Il progetto in questione si chiama Metadata Analysis and Mining Application (MAMA).
Ci sono già interessantissimi risultati, raccolti in questa pagina.
Alcuni sono:
- l'80,4% dei siti usano CSS;
- i 5 tag HTML 4.x più utilizzati sono, in ordine, head, title, html, body, a;
- In media ci sono 47 errori di markup e quasi 16500 caratteri per pagina;
- È possibile vedere in quali nazioni è maggiore la popolarità di una certa caratteristica (es.: flash, richieste XMLHttpRequest, etc...)
Nessun commento:
Posta un commento