Please enable JavaScript.
Coggle requires JavaScript to display documents.
Ligando para a Generative AI - Coggle Diagram
Ligando para a Generative AI
AI conversasional por chamada
O que é preciso para tornar
possivel?
A AI tem que ouvir 100% do tempo da chamada sem a necessidade de gatilho
Para gerar uma conversa mais natural, a AI precisa saber quando a fala esta direcionada a ela e saber o que responder
Caso a AI fale, ela tem que saber quando usuário quer interromper
Uma máquina virtual para atender quando for chamada
Poder de processamento para renderizar o visual 3D do avatar
Emular Web-cam para redirecionar para o 3D do avatar
Implementar um sistema para atender em cada canal como:
Teams
Google Meets
Etc...
Pode ser que gere custo razoáveis por hora de máquina utilizado, porém, podemos pensar em uma forma de "Ligar para AI" e enquanto esta em espera de ligação ele liga uma maquina virtual e a AI atende no momento que a máquina sobe, e quando a ligação é encerrada a maquina morre
E se for fazer um protótipo?
Ambiente Web com Render 3D possivelmente usando A-Frame (ThreeJS)
Criar Web Page com Avatar 3D
O avatar 3D seria visualizado em uma telinha simulando uma vídeo chamada, onde a câmera do usuário e do bot estariam abertas
Sistema de STT e TTS, para o STT teria um botão de gatilho para o assistente começar a ouvir
No momento que o Avatar estiver ouvindo pode ser possível por uma detecção de emoção já que a webcam do usuário estará ativo, caso ache alguma utilidade
O avatar poderá adotar comportamento semelhante ao que já existe atualmente com o Aplicativo da Olivia
Poderá ter um espaço para escrever como um Chat
Com a tecnologia do A-Frame será possível adicionar um botão para uma versão em Realidade Aumentada, caso queira conversar frente a frente com o avatar