1.- Esta directamente relacionadas al lenguaje y a su esencia multimodal (admite entradas de imágenes y texto, y emite salidas únicamente de texto).
2.- Es capaz de realizar con asombrosa precisión tareas como generación de texto en diferentes formatos y estilos, resúmenes, traducción, composición de canciones, respuestas a preguntas complejas y más