Please enable JavaScript.

Coggle requires JavaScript to display documents.

Kubernetes OPS - Coggle Diagram

- - - - Ogni regione ha 3 zone (solo una 4)
      - Tutte le zone di una regione devono avere la stessa topologia
        Se imposto 2 nodi nel nodePool saranno 2 nodi per zona e un master per ogni zona
        Si pagano solo i nodi worker (no master)
      - Resilienza, se va giù una zona non ci sono problemi.
        99.5 uptime
      - Posso aggiornare un master senza problemi visto che rispondono gli altri. Tutti i master possono gestire tutti i nodi, anche in altre zone
    - - Di default sono creati tutti nodi in una sola zona
      - Se va giù zona perdo cluster
      - Se aggiorno master perdo funzionalità di controllo, healtcheck, ecc...
        I nodi continuano ad andare.
      - si possono impostare più zone così da avere nodi in più zone. Una è principale (dov'è sempre il master), le atre secondarie. Se non va giù la zona principale ma un'altra i nodi della zona in fallimento possono essere ricreati sull'altra. Se va giù la zona principale con il master non succede.
  - - - Consigliato quando ad esempio uso VM costose (es. con GPU)
      - Si usano metriche, di default usa la CPU.
        Soglia configurabile e anche metriche valutate in autoscaling.
      - node auto-provisioning
        GKE permette di modificare le caratteristiche delle VM dei nodi. Si può ad esempio aumentare le CPU e la memoria
      - Il cluster, se abilitato l'autoscaling, gestisce il numero di nodi ed è in grado di crearli/distruggerli
        Si definisce un min-nodes e un max-nodes
        Si basa sulle metriche
        Scale-up facile, scale-down meno perché i pod si spengono in modo bilanciato e non ad esempio solo su una macchina. In pratica non avrò mai una macchina scarica.
    - - Horizontal pod autoscaler (HPA)
        Gestisce in modo automatico il parametro replicas del deployments e di conseguenza aggiunge o diminuisce copie.
        Lavora anche su più zone.
      - Vertical pod autoscaler (VPA)
        Permette di definire uno scaling di risorse di CPU/Memoria del Pod. Non funziona a caldo, il pod va distrutto e ricreato.
        Consigliato per capire di quante risorse ha bisogno un pod. In produzione non è consigliato perché quando scala ci sono errori su chi sta usando il pod.
- - - - One shared cluster
        Shared project
        Shared cluster
        Un namespace per environment
        Pro: semplice
        Contro: poca difesa, se entrano entrano su tutti, IAM condivisi sugli env, poco isolamento sulle risorse, stesso master
      - Cluster per env
        Shared project
        Cluster per ogni env
        Pro: nodi isolati, master isolati, un solo progetto da gestire
        Contro: IAM condivisi, gestione configurazione
      - Project per env
        Un project per env
        Un cluster per project
        Pro: difesa, IAM indipendenti, isolamento nodi, master isolati
        Contro: costa di più la gestione
      - Key point
        
        livello di isolamento (env/team)
        
        utenti hanno diversi permessi tra env
        
        ci sono compliance requirement diversi (env/team)
        
        altri motivi per il full isolation
        
        region diverse?
  - - - Firewall
        Traffico ammesso o no. Attenti a traffico tra nodi (healthcheck, loadbalancer, ad esempio)
      - Custom network (custom cidr)
      - Authorized network (chi può chiamare master)
      - Ip masquerading
        Permette di nascondere gli IP dei nodi quando fanno chiamate esterne. Si esce con un IP. Utile per gestire le regole di firewall. Requisiti IP aliasing e network policy
      - Consiglio abilitare IP aliasing e network policy (se abilitato dopo va ricreato cluster e se non usato non fa nulla)
      - Network Policy
        Va abilitato. Google usa Kaniko, permette di definire policy di comunicazione tra pod (o tutto quello che può ricevere pacchetti). Definisce regole di ingress e/o egress applicati a podSelector. Regole by namespace, by pod, by IP.
    - - Control plane (master) pubblico -> meglio privato con master-authorized-network (whitelist)
      - Cluster pubblico -> meglio privato
      - Node service account (all'attivazione di compute engine API è creato un service account con privilegi editor e se entro in una macchina e chiamo API di Google e non specifico un utente usa quello) -> soluzioni 2: IAM di secondo livello, non usare service account di default
        Workload identity, permette di usare un solo service account sui nodi e filtrare i privilegi dal namespace.
      - Metadata server (la macchina VM per sapere informazioni su sé stessa può chiedere a un servizio di rete). Può essere usato per attacchi sulla macchina. Si può limitare accesso a metadata service usando credenziali.
    - - Limitare con IAM
        Definisco chi accede o no al cluster. Valgono per tutto il cluster
        
        container.admin
        Assegna all'interno del cluster gli RBAC per fare tutto.
        C'è anche container.clusterAdmin che gestisce solo la piattaforma ma dentro il cluster nella RBAC non ha privilegi
        
        container.developer
        Configura RBAC nel cluster per fare quasi tutto a parte alcune configurazioni, come decidere RBAC
        
        container.viewer
        Configura RBAC nel cluster con permessi in lettura al cluster. C'è anche container.cluster-viewer
        
        container.clusterViewer
        Vede il cluster da fuori e non può modificarlo. Da dentro non configura nessun RBAC ma devo definire io cosa vede utente tramite RBAC
        
        container.hostServiceAgentUser
        Per gestire i permessi su risorse Google. Per permettere a un cluster di agire con i permessi di un service account. Per esempio per indicare se un cluster può usare un'altra rete (VPC).
      - Role-Based Access Control (RBAC)
        Permessi interni al cluster, ad esempio se un utente ha visibilità o meno su un namespace. Non sono mappati su Google con IAM ma all'interno del cluster. Google in base ad IAM può impostare a livello di cluster (ad esempio developer può gestire k8s API)
        
        Authentication
        Authorization
        Audit
        
        Permette di configurare chi ha accesso a quale risorsa (kind) e con quale privilegio. I permessi sono a loro volte risorse.
        
        Possono essere su determinate operazioni (leggere/scrivere secret). Se pensiamo a REST possiamo pensare a quale CRUD posso fare su una determinata risorsa.
        
        Ogni pod ha un service account (se non specificato default). Posso dare permessi sul service account.
        
        Definizione ruoli (collezione di permessi)
        ClusterRole
        Vale a livello di cluster
        Role
        Vale a livello di namespace (altri namespace non vedono questo ruolo)
        
        Binding. Associo ruolo a utente. A seconda del ruolo si chiama RoleBinding e ClusterRoleBinding.
      - Ruotare le credenziali