Please enable JavaScript.

Coggle requires JavaScript to display documents.

Associate Data Practitioner - Coggle Diagram

- - - - https://horsaspa-my.sharepoint.com/:i:/g/personal/davide_marcon_horsa_it/EbGQ0EFZju9EsDdqCK1y6doBMXOWqHNpGWlPRiesSDhNlQ?e=oIMXs7
    - - https://horsaspa-my.sharepoint.com/:i:/g/personal/davide_marcon_horsa_it/ETNpPlT7h25Knh-qrqA-cdkBC1JP8hnKUuuA-NdEAA4BGQ?e=kOGVqI
- - - - Speech, text, and language APIs
        
        Natural language API
        
        Speech-to-text API
        
        Text-to-speech API
        
        Translation API
      - Image and Video API
        
        Vision API
        
        Vision intelligence API
      - Conventional AI API
        
        Dialogflow API
    - - Librerie degne di nota
        
        JAX: è una libreria per il calcolo numerico ad alte prestazioni altamente flessibile e facile da usare. Offre nuove possibilità per ambienti di ricerca e di produzione
  - - - Gemini multimodal: elabora I dati in più modalità come testo, immagini e video
        
        Embeddings for text and multimodal: convertono I dati multimodali in vettori numerici che possono essere elaborati da modelli ML, in particolare dai foundation model di AI generativa
        
        Gemini for text and chat: che esegue attività linguistiche e conversazioni naturali.
        
        Imagen: per le immagini, che genera immagini e didascalie
        
        Chirp: per il parlato, che crea applicazioni vocali
        
        Codey per la generazione di codice, che genera, compila codice
    - - https://horsaspa-my.sharepoint.com/:i:/g/personal/davide_marcon_horsa_it/EcZNFETKpfZFsVECRXq4DQABoougqT6OEsIjQ14lxzi8wQ?e=Y8eaAL
        
        https://horsaspa-my.sharepoint.com/:i:/g/personal/davide_marcon_horsa_it/EeAsXfakvM9GlKREyEpyVt4BwhBXHcnpMkOjkicxmF9paQ?e=yvnHMR
  - - - 1. Preparazione dei dati
      - 2. Sviluppo del modello
        
        Addestramento del modello
        
        Indichiamo a Vertex dove sono posizionati i dati che vogliamo usare per l’addestramento. In base alla tipologia di dati dobbiamo selezionare “l’obiettivo”
        
        Decidiamo poi il metodo di addestramento
        
        Specifichiamo il budget e il prezzo
        
        Valutazione del modello
        
        Confusion matrix: è una misurazione delle prestazioni specifica per i problemi di classificazione del machine learning
        
        Feature importance: mostra come ciascuna feature contribuisce alla previsione. Questo grafico è importante per capire quali feature tenere all’interno del modello e quali si possono tralasciare
        
        Exaplanaible AI: funzionalità di Vertex AI. Serie di strumenti e framework che aiutano a comprendere e interpretare le previsioni effettuate da un modello di machine learning
        
        https://horsaspa-my.sharepoint.com/:i:/g/personal/davide_marcon_horsa_it/EccKEjd3Zp1AlPPoiB4BLfUBs5m_KqLiXlt_tX84Tmg0bQ?e=7pGsJ9
      - 3. Model Serving
        Ci sono 2 fasi:
        
        Deployment del modello. Ci sono due modi:
        
        Eseguire il deployment del modello su un endpoint per ottenere previsioni in tempo reale, spesso chiamate online predictions. Ottimo quando è necessaria bassa latenza, come i suggerimenti di navigazione nei browser
        
        Batch prediction. Ogni tot devo richiamare il modello per ottenere in risultato le previsioni. Es: ogni 2 settimane invio i dati sulle vendite per ottenere le previsioni.
        
        Monitoraggio del modello: Vertex AI Pipelines per automatizzare, monitorare e regolamentare i sistemi di machine learning
- - - - Cloud CDN
        
        Serve per creare una cache con i risultati delle query più frequenti
        
        È utile quando i dati sono statici (foto, file ecc), non dinamici (info sugli utenti)
      - Read Replica
        
        Utilizzata per avere ridondanza dei dati e migliorare le performance in lettura
        
        Se il server principale smette di funzionare, la read replica non entra subito in azione. Per renderla il server principale è necessaria un'operazione manuale
      - Failover Replica
        
        Utilizzata per creare una soluzione pronta ad entrare in attività in caso il server principale smetta di funzionare
    - - Read-write con blocco
        
        Durante la lettura e la scrittura dei dati il database blocca quei dati, in modo che altri servizi non possano modificarli
- - - - GMEK
        
        Completamente gestito da Google
        
        Non si ha il controllo delle chiavi, quindi difficile compliance con GDPR e altre leggi
      - CSEK
        
        Chiavi fornite dall'utente
        
        Creazione delle chiavi e salvataggio delle chiavi avviene al di fuori di Google Cloud
        
        Non possono essere usate in BigQuery
      - CMEK
        
        Creazione e salvataggio delle chiavi fatta in Google Cloud
        
        la gestione, rotazione e revoca delle chiavi è fatta manualmente