Multimodale Systeme sind in der Lage, verschiedene Arten von Daten zu verarbeiten und zu integrieren, darunter Text, Video, Bilder und Audio, und können Inhalte zwischen diesen Formaten konvertieren. Nach Angaben von Meta soll es sich bei beiden Modellen um Open-Source-Software handeln. Meta plant, in diesem Jahr bis zu 65 Milliarden Dollar in den Ausbau seiner KI-Infrastruktur zu investieren.