Impostazioni Audio
Qui trovi tutte le impostazioni tecniche per ottimizzare l’audio del tuo assistente AI. Nelle impostazioni audio puoi controllare:- Modello di elaborazione vocale
- Velocità di parlata
- Sensibilità interruzioni
Modello di Elaborazione Vocale
Il modello determina quale tecnologia viene usata per convertire la voce in testo. Ci sono differenze tecniche importanti da considerare.- Deepgram (Consigliato)
- Azure Europa
- Google Cloud
Caratteristiche:
- Latenza minima (~200ms)
- Massima precisione
- Server USA
Confronto Performance
| Modello | Latenza | GDPR EU | Lingue | Consigliato per |
|---|---|---|---|---|
| Deepgram | ~200ms | ❌ | 30+ | Massima velocità |
| Azure Europa | ~900ms | ✅ | 40+ | Compliance EU |
| Google Cloud | ~400ms | ✅ | 100+ | Multilingua |
Consiglio: Inizia con Deepgram per testare. Se devi essere GDPR-compliant, passa ad Azure Europa.
Velocità di Parlata
Controlla quanto velocemente l’assistente parla. Range: 0.75x (lento) → 1.5x (veloce)Default: 1.0x (normale)
Come Scegliere
Esempio Configurazione
Receptionist professionale:La velocità NON influisce sulla latenza di risposta, solo sul tempo di pronuncia.
Sensibilità Interruzioni
Controlla quanto facilmente l’AI si lascia interrompere dal chiamante. Range: 0 (bassa) → 10 (alta)Default: 5 (media)
Logica
Sensibilità ALTA (7-10):- L’AI si interrompe facilmente
- Risponde a ogni suono/parola
- Conversazione più reattiva
- L’AI completa le frasi
- Ignora rumori di fondo
- Meno interruzioni accidentali
Quando Modificare
Sensibilità ALTA (7-10)
Sensibilità ALTA (7-10)
Usa quando:
- Clienti anziani (parlano più lentamente)
- Ambiente silenzioso
- Conversazioni formali
- Vuoi che l’AI risponda subito
Sensibilità MEDIA (4-6)
Sensibilità MEDIA (4-6)
Usa quando:
- Situazione standard
- Ambiente normale
- Non sai quale scegliere
Sensibilità BASSA (1-3)
Sensibilità BASSA (1-3)
Usa quando:
- Ambiente rumoroso (cantiere, fabbrica, strada)
- Clienti che parlano velocemente
- Molte interruzioni accidentali
Test Pratico
Per trovare il valore giusto:1
Inizia con 5 (default)
Fai 10 chiamate di test
2
Analizza problemi
- Se l’AI si interrompe troppo spesso → Abbassa a 3-4
- Se l’AI non lascia parlare il cliente → Alza a 6-7
3
Affina gradualmente
Cambia 1 punto alla volta e ri-testa
Configurazioni Consigliate per Settore
Assistenza Clienti Standard
Supporto Tecnico
Prenotazioni Ristorante
Call Center Assicurazioni
Supporto Anziani
Cantiere/Ambiente Rumoroso
Impostazioni Avanzate
End of Speech Detection
Tempo di silenzio prima che l’AI consideri terminato il turno del cliente.Noise Cancellation
Troubleshooting
AI si interrompe da sola
AI si interrompe da sola
Causa: Sensibilità troppo alta o rumore di fondoFix:
- Abbassa sensibilità a 3-4
- Attiva noise cancellation
- Verifica qualità linea
AI non si lascia interrompere
AI non si lascia interrompere
Causa: Sensibilità troppo bassaFix:
- Alza sensibilità a 6-7
- Riduci velocità parlata a 0.9x (più tempo per interrompere)
Latenza alta / risposte lente
Latenza alta / risposte lente
Causa: Modello speech-to-text lentoFix:
- Passa a Deepgram (se GDPR lo permette)
- Verifica connessione internet
- Check server status
Trascrizioni sbagliate
Trascrizioni sbagliate
Causa: Audio di bassa qualità o modello non ottimaleFix:
- Migliora qualità audio linea
- Prova modello diverso (Google Cloud per italiano)
- Aggiungi vocabolario custom (se disponibile)
Test e Ottimizzazione
Processo Consigliato
1
Baseline
Inizia con impostazioni default:
- Deepgram
- Velocità 1.0x
- Sensibilità 5
2
Raccogli Feedback
Fai 20-30 chiamate reali e annota:
- Interruzioni accidentali
- Mancate interruzioni
- Lamentele su velocità
3
Affina
Modifica UN parametro alla voltaEsempio iterazione:
- Settimana 1: Default (test)
- Settimana 2: Sensibilità 3 (meno interruzioni)
- Settimana 3: Velocità 1.1x (più veloce)
- Settimana 4: Setup finale ottimizzato
4
Monitora
Controlla metriche settimanali:
- % chiamate completate
- Feedback negativi su audio
- Durata media chiamata
Best Practices
Testa sempre
Non fidarti delle impostazioni “standard”. Testa con il tuo target reale.
Un cambio alla volta
Cambia un solo parametro per iterazione per capire l’impatto.
Ascolta le chiamate
Riascolta 5-10 chiamate ogni settimana per identificare pattern.
Considera il contesto
Ambiente rumoroso? Target anziano? Adatta le impostazioni di conseguenza.