Come sono strutturate le informazioni presenti sul web

Visualizzazione della struttura del sito web
Contenidos
Quando si trovano di fronte a un sistema informativo nuovo e complesso, gli utenti costruiscono dei modelli mentali. Usano questi modelli per valutare le relazioni tra gli argomenti e per indovinare dove trovare cose che non hanno mai visto prima. Il successo dell’organizzazione del vostro sito web sarà determinato in gran parte da quanto l’architettura dell’informazione del sito corrisponde alle aspettative degli utenti. Un’organizzazione logica e coerente del sito consente agli utenti di fare previsioni vincenti su dove trovare le cose. Metodi coerenti di organizzazione e visualizzazione delle informazioni consentono agli utenti di estendere le loro conoscenze da pagine familiari a pagine sconosciute. Se si ingannano gli utenti con una struttura che non è né logica né prevedibile, o se si utilizzano costantemente termini diversi o ambigui per descrivere le caratteristiche del sito, gli utenti saranno frustrati dalla difficoltà di orientarsi e di comprendere ciò che avete da offrire. Non volete che il modello mentale del vostro sito web assomigli alla figura 3.1.
Figura 3.1 – Non create una rete confusa di link. I progettisti non sono gli unici a creare modelli di siti. Anche gli utenti cercano di immaginare la struttura del sito e un’architettura dell’informazione efficace aiuterà l’utente a costruire un modello mentale solido e prevedibile del vostro sito.
Che cos’è la struttura dei contenuti di una pagina web?
La struttura del sito si riferisce al modo in cui si organizzano i contenuti del sito. Un sito web è spesso costituito da contenuti relativi a una serie di argomenti correlati, presentati in post e pagine. La struttura del sito si occupa di come questi contenuti vengono raggruppati, collegati e presentati al visitatore.
Come si trova la struttura di un sito web?
Non è possibile ottenere un elenco della struttura dei file e delle cartelle di un sito web, a meno che il proprietario del sito non voglia espressamente che lo si veda (o abbia dimenticato di impedirlo). I siti web non sono come i computer della vostra rete, sono macchine remote e come tali devono essere protette.
Quali sono le tre strutture di siti web più comuni?
Per costruire un sito web si possono utilizzare tre strutture essenziali: sequenze, gerarchie e reti.
Scanner della struttura del sito web
Ad esempio, Ruby on Rails (un framework MVC) ha una cartella diversa per i diversi tipi di modelli del sito. Si può usare il file routes.rb per far sembrare che i file si trovino altrove nelle cartelle, ma è mascherato con il routing delle loro posizioni reali. (non è estremamente preciso, ma fornisce una versione ridotta di ciò che accade).
Tuttavia, se il sito web non è vostro, sarete limitati per quanto riguarda l’accesso. Anche se riuscite a trovare la struttura di un sito, attraverso l’http, non sarete in grado di vedere alcun codice eseguito sul lato server.
I siti web non sono come i computer della vostra rete, sono macchine remote e come tali devono essere protette. Se vogliono farvi vedere la struttura la vedrete, se non la vogliono non la vedrete, è così semplice.
Cosa rende una buona homepage
Vi siete mai trovati nella situazione di dover analizzare tonnellate di dati da un sito web? Allora potreste aver incontrato alcuni fattori bloccanti, come una sovrabbondanza di dati su troppe pagine web da recuperare manualmente e/o dati completamente destrutturati quando si cerca di copiarli/incollarli in un foglio Excel, per esempio.
La buona notizia è che non è necessario essere un hacker professionista o avere un master in informatica per fare Web Scraping. Ci sono molti strumenti disponibili sul mercato e si può facilmente iniziare con le basi – già molto utili – installando liberamente l’estensione di Chrome “Web Scraper” sul proprio computer portatile:
Come forse sapete, la maggior parte dei siti web è costruita come una “struttura ad albero”, il che significa che avete una radice URL che vi reindirizza a più pagine web contenenti molti dati che possono essere di diversi tipi, come ad esempio:
Cominciamo con un esempio semplice e pratico: il vostro cliente ha richiesto un’analisi del costo medio per marca degli zaini scolastici proposti sul sito di Amazon. Ci sono decine di pagine nella categoria “zaini scolastici” con una media di 60 prodotti presentati in ogni pagina.
Struttura della homepage
Il Web strutturato è costituito da dati a livello di oggetto all’interno di documenti e database Internet che possono essere estratti, convertiti da forme disponibili, rappresentati in modi standard, condivisi, riutilizzati, combinati, visualizzati, analizzati e qualificati senza rispettare la forma o la provenienza originaria.
Negli ultimi mesi ho sempre più spesso scritto e fatto riferimento al Web strutturato. L’ho fatto intenzionalmente, ma, finora, con poche spiegazioni e premesse. Con l’inaugurazione di questa serie occasionale, spero di dare più colore e profondità a questo argomento [1].
Nell’ultimo anno ho imparato e documentato su AI3 i miei tentativi di comprendere le basi, i concetti e gli strumenti dell’emergente Web semantico. In questo processo, sono arrivato a definire i miei contorni del Web passato, presente e futuro. All’interno di questa visione del mondo, vedo il Web strutturato come l’imperativo e la realtà attuale.
Alcuni esperti del Web hanno abbracciato una terminologia di versioni del Web 2.0 e del Web 3.0 per descrivere una di queste visioni del mondo. Personalmente non sono d’accordo con questo sciocco versionismo – anzi, più di un anno fa ho ironizzato in un post ironico sul Web 98.6 – ma questa terminologia ha avuto una certa diffusione e serve a qualcosa. Di seguito fornisco le mie definizioni di queste “versioni”, se non altro per colmare il divario con visioni del mondo alternative.