Impostazioni Audio

Qui trovi tutte le impostazioni tecniche per ottimizzare l’audio del tuo assistente AI. Nelle impostazioni audio puoi controllare:

Modello di elaborazione vocale
Velocità di parlata
Sensibilità interruzioni

Modello di Elaborazione Vocale

Il modello determina quale tecnologia viene usata per convertire la voce in testo. Ci sono differenze tecniche importanti da considerare.

Deepgram (Consigliato)
Azure Europa
Google Cloud

Caratteristiche:

Latenza minima (~200ms)
Massima precisione
Server USA

Quando usare: Quando la velocità di risposta è prioritaria e la GDPR non è vincolante.Nota: Attualmente il migliore per velocità e accuratezza.

Confronto Performance

Modello	Latenza	GDPR EU	Lingue	Consigliato per
Deepgram	~200ms	❌	30+	Massima velocità
Azure Europa	~900ms	✅	40+	Compliance EU
Google Cloud	~400ms	✅	100+	Multilingua

Consiglio: Inizia con Deepgram per testare. Se devi essere GDPR-compliant, passa ad Azure Europa.

Velocità di Parlata

Controlla quanto velocemente l’assistente parla. Range: 0.75x (lento) → 1.5x (veloce)
Default: 1.0x (normale)

Come Scegliere

👴 Target anziani → 0.8x - 0.9x
👔 Business professionale → 1.0x - 1.1x
⚡ Clienti giovani/tech → 1.1x - 1.3x
📞 Call center veloce → 1.2x - 1.4x

Velocità >1.3x può sembrare innaturale. Testa sempre con utenti reali.

Esempio Configurazione

Receptionist professionale:

Velocità: 1.0x
Motivo: Deve essere chiaro e professionale

Supporto tecnico:

Velocità: 0.9x
Motivo: Informazioni complesse richiedono tempo

Conferma appuntamenti:

Velocità: 1.1x
Motivo: Interazione breve, info semplici

La velocità NON influisce sulla latenza di risposta, solo sul tempo di pronuncia.

Sensibilità Interruzioni

Controlla quanto facilmente l’AI si lascia interrompere dal chiamante. Range: 0 (bassa) → 10 (alta)
Default: 5 (media)

Logica

Sensibilità ALTA (7-10):

L’AI si interrompe facilmente
Risponde a ogni suono/parola
Conversazione più reattiva

Sensibilità BASSA (1-3):

L’AI completa le frasi
Ignora rumori di fondo
Meno interruzioni accidentali

Quando Modificare

Sensibilità ALTA (7-10)

Usa quando:

Clienti anziani (parlano più lentamente)
Ambiente silenzioso
Conversazioni formali
Vuoi che l’AI risponda subito

Esempio: Receptionist che deve essere molto reattivoRischio: Potrebbe interrompersi per rumori di fondo

Sensibilità MEDIA (4-6)

Usa quando:

Situazione standard
Ambiente normale
Non sai quale scegliere

Esempio: Supporto clienti genericoDefault consigliato

Sensibilità BASSA (1-3)

Usa quando:

Ambiente rumoroso (cantiere, fabbrica, strada)
Clienti che parlano velocemente
Molte interruzioni accidentali

Esempio: Supporto per aziende ediliRischio: Potrebbe non sentire interruzioni reali

Test Pratico

Per trovare il valore giusto:

Inizia con 5 (default)

Fai 10 chiamate di test

Analizza problemi

Se l’AI si interrompe troppo spesso → Abbassa a 3-4
Se l’AI non lascia parlare il cliente → Alza a 6-7

Affina gradualmente

Cambia 1 punto alla volta e ri-testa

Configurazioni Consigliate per Settore

Assistenza Clienti Standard

Modello: Deepgram
Velocità: 1.0x
Sensibilità: 5

Supporto Tecnico

Modello: Azure Europa (GDPR)
Velocità: 0.9x (info complesse)
Sensibilità: 6 (lascia cliente interrompere)

Prenotazioni Ristorante

Modello: Deepgram (velocità)
Velocità: 1.1x (efficiente)
Sensibilità: 5

Call Center Assicurazioni

Modello: Azure Europa (compliance)
Velocità: 0.95x (professionale)
Sensibilità: 5

Supporto Anziani

Modello: Azure Europa
Velocità: 0.85x (chiaro e lento)
Sensibilità: 7 (molto reattivo)

Cantiere/Ambiente Rumoroso

Modello: Deepgram
Velocità: 1.0x
Sensibilità: 2-3 (ignora rumori)

Impostazioni Avanzate

End of Speech Detection

Tempo di silenzio prima che l’AI consideri terminato il turno del cliente.

Breve (300ms): Conversazioni veloci, cliente esperto
Media (500ms): Default consigliato
Lunga (800ms): Cliente riflette, pensa, anziani

Noise Cancellation

Attiva: Ambiente rumoroso, chiamate da mobile
Disattiva: Studio registrazione, qualità già alta

In ambienti molto rumorosi, combina Noise Cancellation ON + Sensibilità BASSA per risultati ottimali.

Troubleshooting

AI si interrompe da sola

Causa: Sensibilità troppo alta o rumore di fondoFix:

Abbassa sensibilità a 3-4
Attiva noise cancellation
Verifica qualità linea

AI non si lascia interrompere

Causa: Sensibilità troppo bassaFix:

Alza sensibilità a 6-7
Riduci velocità parlata a 0.9x (più tempo per interrompere)

Latenza alta / risposte lente

Causa: Modello speech-to-text lentoFix:

Passa a Deepgram (se GDPR lo permette)
Verifica connessione internet
Check server status

Trascrizioni sbagliate

Causa: Audio di bassa qualità o modello non ottimaleFix:

Migliora qualità audio linea
Prova modello diverso (Google Cloud per italiano)
Aggiungi vocabolario custom (se disponibile)

Test e Ottimizzazione

Processo Consigliato

Baseline

Inizia con impostazioni default:

Deepgram
Velocità 1.0x
Sensibilità 5

Raccogli Feedback

Fai 20-30 chiamate reali e annota:

Interruzioni accidentali
Mancate interruzioni
Lamentele su velocità

Affina

Modifica UN parametro alla voltaEsempio iterazione:

Settimana 1: Default (test)
Settimana 2: Sensibilità 3 (meno interruzioni)
Settimana 3: Velocità 1.1x (più veloce)
Settimana 4: Setup finale ottimizzato

Monitora

Controlla metriche settimanali:

% chiamate completate
Feedback negativi su audio
Durata media chiamata

Best Practices

Testa sempre

Non fidarti delle impostazioni “standard”. Testa con il tuo target reale.

Un cambio alla volta

Cambia un solo parametro per iterazione per capire l’impatto.

Ascolta le chiamate

Riascolta 5-10 chiamate ogni settimana per identificare pattern.

Considera il contesto

Ambiente rumoroso? Target anziano? Adatta le impostazioni di conseguenza.

Prossimi Passi

Voce e Lingua

Scegli voce e lingua dell’assistente

Registrazione

Configura registrazione chiamate

Primi passi

Caratteristiche Assistente

Tools

Numeri di telefono

FAQ

Impostazioni Audio

Impostazioni Audio

Modello di Elaborazione Vocale

Confronto Performance

Velocità di Parlata

Come Scegliere

Esempio Configurazione

Sensibilità Interruzioni

Logica

Quando Modificare

Test Pratico

Configurazioni Consigliate per Settore

Assistenza Clienti Standard

Supporto Tecnico

Prenotazioni Ristorante

Call Center Assicurazioni

Supporto Anziani

Cantiere/Ambiente Rumoroso

Impostazioni Avanzate

End of Speech Detection

Noise Cancellation

Troubleshooting

Test e Ottimizzazione

Processo Consigliato

Best Practices

Testa sempre

Un cambio alla volta

Ascolta le chiamate

Considera il contesto

Prossimi Passi

Voce e Lingua

Registrazione

Primi passi

Caratteristiche Assistente

Tools

Numeri di telefono

FAQ

​Impostazioni Audio

​Modello di Elaborazione Vocale

​Confronto Performance

​Velocità di Parlata

​Come Scegliere

​Esempio Configurazione

​Sensibilità Interruzioni

​Logica

​Quando Modificare

​Test Pratico

​Configurazioni Consigliate per Settore

​Assistenza Clienti Standard

​Supporto Tecnico

​Prenotazioni Ristorante

​Call Center Assicurazioni

​Supporto Anziani

​Cantiere/Ambiente Rumoroso

​Impostazioni Avanzate

​End of Speech Detection

​Noise Cancellation

​Troubleshooting

​Test e Ottimizzazione

​Processo Consigliato

​Best Practices

Testa sempre

Un cambio alla volta

Ascolta le chiamate

Considera il contesto

​Prossimi Passi

Voce e Lingua

Registrazione

Impostazioni Audio

Modello di Elaborazione Vocale

Confronto Performance

Velocità di Parlata

Come Scegliere

Esempio Configurazione

Sensibilità Interruzioni

Logica

Quando Modificare

Test Pratico

Configurazioni Consigliate per Settore

Assistenza Clienti Standard

Supporto Tecnico

Prenotazioni Ristorante

Call Center Assicurazioni

Supporto Anziani

Cantiere/Ambiente Rumoroso

Impostazioni Avanzate

End of Speech Detection

Noise Cancellation

Troubleshooting

Test e Ottimizzazione

Processo Consigliato

Best Practices

Prossimi Passi