El autor diferencia entre los modos representativos, es decir lo que una cultura hace disponible como el medio para hacer el significado (el discurso, la escritura, la imagen, el gesto, la música y otros) y los medios de diseminación que son aquellos que la cultura hace disponibles como el medio para distribuir estos significados como mensajes (el libro, la pantalla de ordenador, la revista, el vídeo, la película, la radio, la charla, etc.). De acuerdo a esta mirada la escritura comienza a ser igual a los otros modos, lo que cambia son los potenciales de cada modo representativo en función de tareas específicas. Y estas tareas ocurren en un contexto social que proporciona condiciones para el uso y la apropiación de los diversos modos
En la actualidad hay un fuerte componente multimodal en los distintos ambientes y es importante analizar allí la variación de affordances (potencialidades) de los modos y las facilidades de los nuevos medios de comunicación
Un texto multimodal, no sólo es un texto escrito sino que se entrecruzan las imágenes, con los tamaños, las formas y los colores. Esta simultaneidad de modos permite desarrollar acciones y sentidos que no son privativos de la escritura. Existe una presencia creciente de la imagen en todas las formas en mensajes contemporáneos.
Kress sostiene que la lógica de la imagen es espacial y simultánea. Todos los elementos de la imagen están relacionados en disposiciones espaciales y simultáneamente presentes a diferencia de la escritura que presentan un ordenamiento de elementos (sintáctica/gramatical y léxica) en las secuencias convencionales de sintaxis. Por esto, en la imagen la mayor parte del significado proviene de las relaciones espaciales de los elementos representados