Come si integra l’Assistente Virtuale Maggioli (chatbot) con il sito internet dell’Ente e altri siti istituzionali?

L’Assistente Virtuale Maggioli si integra con il sito istituzionale dell’Ente e con eventuali altri portali pubblici attraverso un processo di indicizzazione dei contenuti basato su sitemap.

Il sistema analizza esclusivamente le pagine web dichiarate nella sitemap e costruisce le proprie risposte sulla base di tali contenuti. Per garantire un funzionamento corretto ed efficace, è necessario rispettare alcuni requisiti tecnici e qualitativi.


1. Quali sono i requisiti tecnici della sitemap?

La sitemap è la "mappa" che guida l'Assistente Virtuale. Per essere valida deve:

  • Essere conforme al protocollo standard (sitemaps.org).
  • Essere pubblicamente accessibile.
  • Contenere l’elenco completo degli URL che si desidera indicizzare.
  • Gestione degli aggiornamenti e cancellazioni: È obbligatorio l'uso del tag <lastmod> per ogni URL.
  • Se un contenuto viene rimosso il sistema effettua scansioni periodiche: se un URL non è più presente nella sitemap o restituisce un errore (es. 404), verrà automaticamente deindicizzato e rimosso dalla base di conoscenza del chatbot.
  • Strumenti di verifica: Un tecnico può verificare la validità formale della propria sitemap utilizzando tool gratuiti come XML Sitemap Validator.

2. Ci sono vincoli tecnici per l’accesso ai contenuti?

Sì. Anche se la sitemap è corretta, il server deve permettere al nostro "visitatore automatico” di scansionare  le pagine web. Assicurarsi che:

  • Non ci siano blocchi lato Firewall o sistemi di WAF/Bot-protection (es. Cloudflare in modalità restrittiva) sull'User-Agent dell'Assistente.
  • Il file robots.txt non inibisca la scansione delle directory rilevanti.
  • Test di verifica: Se un browser anonimo non raggiunge la pagina, non la raggiungerà nemmeno l'Assistente.

3. Quali caratteristiche devono avere i contenuti per essere "validi"?

Non basta che una pagina sia raggiungibile; deve essere "comprensibile" per un'IA. Un sito è considerato idoneo se:

  • I contenuti devono essere testuali: L'IA non legge il testo "dentro" le immagini (es. manifesti PDF scannerizzati come immagine).
  • Qualità minima: Pagine con poco contenuto potrebbero essere scartate perché "poco significative". Ad esempio: pagine con solo immagini, pagine in errore o in manutenzione.
  • Tabelle: Evitare tabelle troppo complesse o annidate; prediligere elenchi puntati per descrivere servizi o requisiti.
  • Contenuti disorganizzati: tabelle troppo complesse o informazioni frammentate possono ridurre la qualità delle risposte generate.

4. Come devono essere strutturate le pagine del Personale e degli Uffici?

Per evitare che l'Assistente faccia confusione tra soggetti o ruoli diversi (specialmente in caso di omonimie o cambi di amministrazione), le pagine devono essere atomiche (una pagina per ogni soggetto/ufficio) e seguire uno standard chiaro:

  • Identità univoca: Nome, Cognome e Ruolo attuale bene in evidenza.
  • Contesto organizzativo: Settore e Ufficio di appartenenza.
  • Ambiti di competenza: Elenco puntato delle materie trattate (es. "Si occupa di: Anagrafe, Stato Civile, Elettorale").
  • Contatti diretti: Email istituzionale, telefono e orari di ricevimento aggiornati.

Nota bene: Evitare di inserire elenchi infiniti di persone in un'unica pagina generica; questo rende difficile per l'Assistente associare correttamente i contatti alla persona giusta.

5. Come vengono gestite le notizie vecchie e i dati storici?

Questo è un punto critico per la qualità delle risposte. L’Assistente Virtuale legge tutto ciò che è presente nella sitemap. Se il sito ospita ancora notizie del passato (es. "Il Sindaco Mario Rossi ha dichiarato..." del 2013), l'IA potrebbe erroneamente indicare Mario Rossi come sindaco attuale.

Per evitare risposte anacronistiche, l'Ente deve:

  • Utilizzare correttamente le date: Assicurarsi che ogni notizia o comunicato abbia la data di pubblicazione correttamente formattata e leggibile dal sistema.
  • Pulizia della Sitemap: Valutare se includere nella sitemap l'intero archivio storico o solo gli ultimi anni. Le pagine molto vecchie e non più rilevanti dovrebbero essere rimosse dalla sitemap per evitare che "inquinino" le risposte attuali.
  • Tag di stato: Se possibile, le pagine del personale non più in carica dovrebbero riportare chiaramente la dicitura "Cessato dal servizio""Mandato concluso".

6. Da cosa dipende la precisione delle risposte? (Responsabilità dell'Ente)

L’Assistente Virtuale è uno "specchio" del sito.

  • Se sul sito sono presenti informazioni contraddittorie (es. due pagine diverse che riportano orari differenti per lo stesso ufficio), l'Assistente potrebbe fornire risposte ambigue.
  • L'Ente è responsabile della coerenza e dell'aggiornamento dei dati. Prima di segnalare un malfunzionamento del chatbot, verificare sempre che l'informazione sul sito sia corretta e univoca.

7. Cosa succede se il sito contiene errori, refusi o dati non aggiornati

L’Assistente Virtuale non ha capacità critica: apprende e riporta i contenuti così come sono pubblicati sul sito istituzionale.

Il rischio di generare risposte imprecise o errate aumenta drasticamente in presenza di:

  • Refusi: Errori ortografici su nomi, date o codici possono impedire all'assistente di trovare l'informazione corretta.
  • Informazioni obsolete: Se una vecchia pagina con orari non più validi è ancora pubblicata (e/o presente nella sitemap), il sistema potrebbe usarla come fonte.
  • Contraddizioni: Se la "Pagina A" dice che l'ufficio apre alle 09:00 e la "Pagina B" dice alle 10:00, l'Assistente potrebbe fornire entrambe le versioni o sceglierne una in modo casuale.