programmier.bar icon
News AI #16 –

OpenAI Sora // Gemini 1.5 // Stable Diffusion 3 // Groq // SDXL Lightning

28.02.2024

Shownotes

Zwei Wochen sind seit unserer letzten AI-News-Folge vergangen und in der AI-Welt hat sich schon wieder einiges verändert. OpenAI hat einen nächsten Durchbruch mit ihrem „Text-to-Video“-Model Sora erreicht, Stable Diffusion 3 ist angekündigt, Gemini for Workspace wurde vorgestellt und Google hat ihr erstes Open-Source-Model auf Basis von Gemini veröffentlicht und es Gemma getauft.

Bytedance hat ebenfalls mal wieder im AI-Markt mitgemischt und ein destilliertes Model auf Basis von Stable Diffusion XL kreiert, welches in der 1-Step-Variante nur 120 ms Inference-Zeit benötigt und somit nahezu in Realtime Bilder erzeugt. 

Mistral hat ihr neues Modell Mistral Large als Closed-Source-Model in ihrem API Store released, was in der Szene für großes Aufsehen gesorgt hat.

Eine völlig neue AI-Hardware wurde von Groq released, die ebenfalls die Inference-Zeiten drastisch reduzieren soll. Ob das allerdings eine marktfähige Lösung ist, diskutieren wir in dieser Folge.

Weitere Links, von denen wir in dieser Folge sprechen:

Soundtrack composed by AIVA (Artificial Intelligence Virtual Artist)

Speaker Info

  • Philipp Schmid Profile

    Philipp Schmid

    Philipp Schmid ist Technical Lead und Machine Learning Engineer bei Hugging Face, einer Firma, die gutes Machine Learning durch Open Source und Open Science demokratisieren möchte. Der junge Nürnberger und AWS Machine Learning Hero hat sozusagen die deutsche Variante von ChatGPT entwickelt und darüber auf seinem Blog geschrieben. Checkt sie im Playground aus!

    Mehr Infos
    Angle right
    Angle right
    Angle right
Feedback
[object Object]