Google I/O: Spark, Omni, Flash 3.5 & Antigravity 2.0
- // Podcast
- // News AI 21/26
Shownotes
Google hat auf der Google I/O 2026 gefühlt im Minutentakt neue AI-Produkte vorgestellt. Neue Gemini-Modelle, Agent-Frameworks, Coding-Tools, persönliche AI-Agents und omnimodale Video-KI – und mittendrin versucht Dennis live im Podcast noch Omni zum Laufen zu bringen.
Gemeinsam sprechen Dennis, Fabi und Philipp über die wichtigsten AI-Ankündigungen der Woche und ordnen ein, was davon echtes Potenzial für die tägliche Arbeit von Entwickler:innen hat und was aktuell noch eher nach ambitionierter Zukunftsvision klingt.
Ein großes Thema der Folge ist Gemini 3.5 Flash. Google positioniert das Modell klar für agentische Workflows und hohe Geschwindigkeit. Die drei diskutieren, warum „Flash“ inzwischen eher auf Sonnet-Niveau spielt, weshalb das Modell gleichzeitig deutlich teurer geworden ist und warum Geschwindigkeit sich aktuell fast wichtiger anfühlt als die letzte Prozentzahl Modellqualität. Außerdem geht es um die Frage, ob ultraschnelle Agenten irgendwann so autonom agieren, dass ihre Entscheidungen kaum noch nachvollziehbar sind.
Auch Googles neues Agent-Ökosystem rund um Anti-Gravity sorgt für Gesprächsstoff. Aus Gemini CLI wird Anti-Gravity CLI – ergänzt um Desktop-App, Remote-Sandboxes, gemeinsame Agent-Harnesses, Managed Agents und ein neues SDK. Die Folge beleuchtet, wie Google damit versucht, ein vollständiges AI-Coding-Ökosystem aufzubauen und warum der Konkurrenzdruck im Bereich agentischer Entwicklungsumgebungen weiter zunimmt.
Mit Gemini Spark zeigt Google außerdem seine Vision eines persönlichen AI-Agents, der dauerhaft im Hintergrund läuft und auf Gmail, Kalender, Docs und künftig auch MCP-Integrationen zugreifen kann. Die drei diskutieren, warum Spark möglicherweise der erste massentaugliche AI-Agent werden könnte, wie nah das Konzept an Projekten wie OpenClaw liegt und ob Apple zur WWDC auf ähnliche Weise reagieren muss.
Besonders beeindruckend ist außerdem Omni, Googles neuer Vorstoß im Bereich omnimodaler KI. Das System kombiniert Text, Bilder, Audio und Video und ermöglicht damit neue Video-Editing- und Generierungs-Workflows. Im Fokus stehen vor allem die Konsistenz von Szenen, physikalisches Verständnis und die Frage, warum gerade Werbung und Social Content massiv von solchen Modellen profitieren könnten.
Und natürlich darf auch die Praxis nicht fehlen: Dennis versucht während der Aufnahme live ein Omni-Video zu generieren – mit wechselndem Erfolg.
Zum Abschluss der Folge sprechen wir über die neuste Ankündigung von Andrej Karpathy und seinem Wechsel zu Anthropic.
- Dennis
- Hallo und herzlich willkommen zu 1 neuen AI News Folge und wir haben grade bevor wir angefangen haben gesagt, ja hier heute wissen wir, was auf der Agenda ist, aber wir teilen gar nicht auf, wer was sagt und deswegen musste ich grad
- Fabi
- so lachen, weil ich noch
- Dennis
- nicht mehr wusste, ob ich die Intro mache oder ob das Fabi mach und deswegen weiß ich überhaupt gar nicht, welche Kalenderwoche ist, aber herzlich willkommen zu den AI News dieser Woche. Ich bin Dennis Becker
- Fabi
- in der Fabi Fink, hallo und wir haben auch noch
- Dennis
- die Hallo. Hallo. Yes und zwar wollten wir heute vor allen Dingen inhaltlich darüber reden, was es auf der Google i-o- Neues gab. Die hat zu unserer Aufnahme gestern, wenn ihr sie hört, vorgestern stattgefunden. Ja, und da gibt es einige Neuerungen natürlich auch aus oder vor allen Dingen aus dem AI Bereich. Weiß gar nicht, ob irgendwas veröffentlicht wurde, wo nicht irgendwo Gab's irgendeine gab's irgendein Philipp Announcement, was nicht
- Fabi
- AI? Es war ja immer AI drin, ne, wenn Du sagst, wir haben in Talent War Eye released.
- Philipp
- Ja, ja. Er eben,
- Dennis
- das ist ja auch komplett
- Fabi
- Lass doch lieber die Sachen sagen, die drin waren, oder? Neues Modell, Gemini 4 Punkt 5 Flash, Gemini Modell, was multimodal mit Video ist, Anti Gravity 2 Punkt 0, Gemini Spark, ne, der neue Anti Four 7 Personal Agent und die und noch viele andere Details, aber ich glaub, das sind so die Und vielleicht noch die,
- Dennis
- auch wenn's immer für mich nicht so spannend ist, aber ich glaube zumindest auf technischer Ebene ganz relevant, die neuen Chips, mit denen das Ganze mitskaliert, also die TPU Updates, arm, die's gab.
- Fabi
- Das stimmt. Aber war das in der war das in der Keynote noch mit drin? Denn da da müsst ihr was so weit erzählen
- Dennis
- über die Chips, da weiß
- Fabi
- ich gar nix.
- Dennis
- Also mir sind ja Unterschiede aufgeteilt. Philipp hat ja grad schon gesagt, er musste während der ersten Kino hat er gar nicht so viel mitbekommen, weil er die zweite vorbereiten musste beziehungsweise parallel Dinge live schalten musste mit seinem Team. Fabi hat die Keynote geguckt. Ich hab nur den Blogartikel gelesen, das heißt, wir haben alle 'n bisschen unterschiedliche Quellen für das Ganze hier, aber gucken mal, wo drauf es kommt. Ich würde sagen, wir starten mal, weil wir ja hier für App- und Webentwickler*innen einen Podcast machen, starten wir mal mit Gemini 3 Punkt 5 Flash, würde ich sagen, weil das am nächsten an unserem täglichen Doing ist und uns vielleicht 'n am meisten noch tagiert zusammen mit allem, was da noch außen rum ist, Anti Gravity, Anti Gravity, CLI, Anti Gravity 2 und so weiter. Germany 3 Punkt Flash. Philipp, Du machst aber schon so, hast son son Model Card im Kopf und sagst jetzt, das, das, das sind die?
- Philipp
- Ja, das es geht tatsächlich relativ schnell. Also es ist einfach einen, also eine neue Version von Unflash. Das heißt, keine API Changes in dem Sinne, außer die neue Model ID. Es ist viel bis zu viermal schneller als andere Modelle aktuell. Das heißt, wenn ihr irgendwie in letzten 2 Tagen das dann schon getestet habt, den Anti Gravity, EA Studio, Gemini App, also ist überall drin, solltet ihr gemerkt haben, dass es sehr, sehr schnell ist. Es ist jetzt ungefähr bis beziehungsweise besser als 3 Punkt 1 pro für Coding und Experianic experience. Das ist also alles, was mit Tool Calling zu tun hat. Und es ist auch dreimal teurer geworden. Das ist das, glaub, das Größte oder das die die das Negativste, was jetzt aufgefallen ist, sag ich mal, bei vielen. Aber es ist immer noch, also man darf es, glaub, jetzt weniger mit 'nem oder mit 'nem GigT Mini vergleichen, sondern eher auf dem so Net Level. Also es sind, kostet jetzt 9000000 Output Token, Input Token, weiß ich grad gar nicht ausm Kopf, genau.
- Fabi
- 1 50.
- Philipp
- Okay, genau. Und halt wirklich auf dem Via. Also wenn ihr irgendwie so nett aktuell nutzt, dann wär Flash sozusagen das Alternativmodell davon jetzt.
- Dennis
- Ja. Ich mein, ist
- Fabi
- ja schon interessant, ne. Gibt ja auch, also der General 35 Flash gibt's ja auch, wo Du meintest, ne, auch durchaus viel Diskussionen drum, weil ja dieses Flash und irgendwie günstige günstigere Modellen so, es hält ja nicht mehr so ganz, wie Du meintest, irgendwie schon dreimal 3 bis viermal so teuer irgendwie wie das vorherige Flash Modell, ist dafür aber auch sehr viel schneller. Und ich glaub, der Unterschied ist, wie Du auch sagst, ne, es ist halt jetzt, Sie sagen ja selber oder Google ja selbst, strongges Agentic Model und auch Coding Modell, aber interessant ist ja auch, also das ist es ist zwar schneller geworden und Tokenwise treibt's ja immer so teuer wie das vorherige Flash Modell, immer noch günstiger als so Three Punkt 1 Pro, aber wenn man sich noch mal 'n paar andere Benchmarks auch anschaut, also zum Beispiel Artificial Analysis, dann ist ja schon so sehr interessant, dass dadurch, dass es eben ist und scheinbar sehr viel mehr Reasoning am Ende betreibt, dass die Tokenusage viel, viel höher geworden ist und deswegen auch dieses Price promise gar nicht mehr so ganz hält. So, wenn man's vergleicht zu für den Artificialal dieses Intelligence Index, den durchzuführen, hat Three Punkt 1 Pro knapp 900 Dollar gekostet, wohingegen Three Punkt 5 Flash jetzt fast 1.5 Dollar kostet für den gleichen Benchmark, weil man kann sagen, so 75 Prozent teurer ist für das gleiche Ergebnis im Vergleich zu Three Punkt One Pro und auf dem Benchmark zumindest ist auch Threepoint One Pro immer noch besser so. Also und auch was man draußen liest, ich glaub so ganz einig ist sich bisher nach den ersten Tests der Community noch nicht, ob es wirklich das bessere und das Successor Modell für dann auch das Pro Modell ist und aber generell halt interessant, dass man Flash nicht mehr so ganz in diese so günstigere Kategorie eigentlich einordnen kann.
- Philipp
- Ja, ich mein, Flash stand eigentlich eher schon immer für das Schnelle, deswegen Find ich Bescheid. Flash, also Und es verändert sich ja immer. Also ich glaub, 'n paar Monate sitzen wir wieder da und haben dann welche Intelligenz für weniger Preise oder noch schneller. Ich hab's schon 'n bisschen genutzt als so im Vorfeld, auch in Anti Gravity und in dem neuen Anti Gravity, in der Anti Gravity 2 Punkt 0. Und es macht sehr viel Spaß. Also es ist viermal schneller in den Tests, die wir gemacht haben als UPUS und das merkst Du halt. Und es gibt 'n sehr gutes Gefühl, wenn Du halt irgendwie jetzt nicht die komplett komplexesten Tasks machst, aber Dennis hat noch vor 'n paar Wochen gesagt so, hey, ich starte das mal Task. Ich weiß gar nicht, was ich da 20 Minuten lang machen soll, weil die immer ganz schnell fertig sind. Und mit Flash bist Du halt jetzt also noch viel schneller und kannst noch viel mehr machen und halt dann vor allem auch Sub Agents, was halt cool ist, wenn Du dann sehr spezifische Tasks hast.
- Fabi
- Und hast Du 'n Kontext dazu, weil Sie ja irgendwie gesagt haben viermal Fast schneller als andere Modelle, aber Sie sagen in Anti Gravity zwölfmal schneller? Also damit ist gemeint, überall, wenn ich's in CLI, in Anti Gravity oder in der Anti Gravity IDI nutze oder was?
- Philipp
- Ich weiß jetzt nicht genau, an welchen IDIs und über welche Pläne oder Subscription und welchen Tools, aber sollte es so ähnlich sein wie der Fast Mode bei Opus oder bei Codex, soweit ich weiß. Okay, aber ich
- Fabi
- möchte gerne finden, dann vielleicht jetzt meinen sie hatti Gravity hatte ich irgendwo gehört. Deswegen, das hatte ich irgendwie einfach noch nicht so ganz verstanden, warum's schneller ist, als wenn ich das Modell irgendwie über, keine Ahnung, 'n Router anschließ.
- Philipp
- Aber eigentlich spezieller in puncto so was, der halt nur 'n Anti Gravity verfügbar ist.
- Dennis
- Das, was ja auch kommuniziert wurde, dass halt eben Anti Gravity oder die die Hahnes, die außen rum ist, halt speziell optimiert wurde auf ne, das 3 Punkt 5 Flash Modell, was vielleicht auch einfach noch mal in diesem Zusammenspiel von wie fühlt es sich an, wie gut ist es, ne, wenn Du's halt irgendwo reinpackst, ist vielleicht das Erlebnis, dass Du im Moment hast, auch noch mal 'n anderes, als wenn Du es dann tatsächlich in Ararness nutzt, die speziell dafür irgendwie optimiert wurde. Ich muss schon sagen, ich weiß gar nicht, ich bin nur so, also wir haben intern son Slack gab es Stimmen, über die 'n bisschen Pro, also Pro und Kontra waren, was was das neue Modell angeht. Ich hab seit gestern Abend schon auch eine relativ viel benutzt und diese Geschwindigkeit ist schon beeindruckend, weil's einfach wirklich deutlich, deutlich schneller ist und halt, aber es ist halt auch so, dass Du dann halt jetzt auch schon wieder deutlich weniger nachvollziehen kannst. Ich grade frage ich mich 'n bisschen, wie gut ich diese diese nächste Filme bei Claw, das ist schon so, Du kannst diese Gedankenschritte noch so lesen und irgendwie scannen und das, was jetzt im Moment passiert ist mit 3 von Flash, das geht alles so schnell, dass ich oft so war, ja, kack und haste auf einmal so 3 DIN A4 Seiten und denkst so, das fühlt sich dann auf einmal so effizient an, weil Du auf jetzt wieder langsam bist, das alles irgendwie zu konsumieren, bevor Du dann eine Entscheidung treffen kannst, wie es weitergeht.
- Philipp
- Also, das war teilweise so,
- Dennis
- oh, das hast Du ja sofort gemacht, ja.
- Philipp
- Bei Cloud das Thinking oder einfach die Notizen, die Du bei Cloud Code oder in der App bekommst.
- Dennis
- Im Grunde alles. Also ich mein, von den Thinkingschritten, die irgendwie da sind, plus natürlich dann, wer die Ausgabe generiert wird, kannst Du ja trotzdem noch so irgendwie einigermaßen scannen, wo ist der grade und was schreibt der grade und das ist halt bei 3 Punkt 5 Flash einfach in 1 Geschwindigkeit, wo Du's nicht mehr, also wo Du's nicht mehr hinbekommst, das einfach.
- Fabi
- Ich glaub, da ist ja wirklich ganz klarer Case von Gewöhnung oder? Es ist ja, das wird Je natürlich das Ergebnis gut genug, es wird dir so schnell egal sein.
- Dennis
- Ja, aber ich war trotzdem 'n bisschen, ja. Aber ich mein, das zeigt
- Fabi
- ja noch mal den Geschwindigkeitsbooster, dass Du, wenn Du sagst, da kommt's jetzt schon nicht mehr mit vor, kann man nicht mehr aufm High Level so grob die Gedanken nachvollziehen, inhaltlich nicht mehr folgen, jetzt kannst Du doch nicht mal mehr die die Grobschritte nachvollziehen.
- Dennis
- Nee, und jetzt war's halt dann zusammenfassen, ey, ich hab grade das, das, das und das gemacht und so, Du, Du hast jetzt grade all diese Schritte irgendwie so und wirst Du dieses Dokument erstellt. Also das fand ich schon, muss ich sagen, sehr beeindruckend. Das waren jetzt alles noch keine Task, aber muss ich auch sagen, ich bin sonst, ich kann diese Grenze von was sind komplexe Task und wo fühlt sich dann ein größeres Modell irgendwie besser an. Die kann ich selbst für mich noch nicht so auch nicht richtig greifen bei den Projekten, die ich so mache, aber es hat auf jeden Fall sehr viel Spaß gemacht, das zu nutzen. Das hab ich gemacht, vielleicht können wir da kurz direkt drauf eingehen in Anti Gravity 2. Das ist nämlich eine komplett neue App, also das ist, man kann's praktisch Anti Gravity 1 parallel dazu installieren, was ja noch son bisschen 'n Mix war, auch so was eigentlich eine ID, einen Co Editor und Du hast son bisschen deinen deinen Manager, dein Agent zu machen, zu jetzt sehr reduziert. Eigentlich interagierst Du da nur noch mit den Agenten, ähnlich 'n bisschen, was man aus, Superset und sonstigen Tools irgendwie kennt.
- Fabi
- Vielleicht bei dir eine Nachfrage zu dir, kann der Philipp vielleicht dann direkt einordnen. Aber so wie ich's verstanden hab, ist, was vorher war, jetzt und wurde der Name wird ersetzt von der 2 Punkt o, was dann diese Desktop App ist, die 'n bisschen ähnlicher ist auch zu der Cloud Desktop App und so weiter. Aber es gibt doch das, was vorher 1 Punkt 0 war, ist doch jetzt IDI, oder?
- Philipp
- Ich glaub, das also für mich war das davor schon IDE. Weiß jetzt nicht genau, wie das Trainingtechnik Genau, ja, aber sie
- Fabi
- hieß ja schon Enter Gravity, weil ich fand interessant, dass ich Enter Gravity 2 Punkt 0 runtergeladen hab und dann ersetzen musste auf meinem Mac mit der alten, dass sie, hey, ich hab doch ich hab doch noch nie die Desktop App drauf gekauft, bis ich gecheckt hab, ah nee, okay, die alte ist jetzt IDI, auch explizit genannt und die neue heißt jetzt Enter Gravity.
- Dennis
- Okay. Aber ich glaub, das war son Last Management Change, weil auf 1 Dokumentationsseite gestern war die App iCets sind unterschiedlich, aber sie heißen gleich. Vielleicht hatten die nicht aufm Schirm, dass man der als Standardnutzer die dann einfach beim Mac überschreibt.
- Fabi
- Ja, ja, kann sein. Also ich war, davon war ich blöd, dachte ich so, hey, ich hab doch noch nie die Desktop App runtergeladen.
- Dennis
- Ja, ja, nee, die hatte ich auch. Vielleicht hat die ersten, keine Ahnung, vielleicht kannst Du auch vielleicht mal sagen, was die die Pläne sind sind. Das Erste als jetzt Kontakte nutze, der ich viel vorher war, ist son bisschen, dass mir 'n paar Sachen fehlen, wie irgendwie wo ist mein Terminal und wo ist son bisschen Also ich hab theoretisch noch weniger, auch irgendwie eine Vorschau und so was nicht. Kann aber auch sein, dass ich das alles noch nicht gefunden hab oder ist das explizit im Moment nicht da?
- Philipp
- Ich weiß es leider nicht. Ich ich kann's dir echt nicht sagen. Also ich hab
- Dennis
- Okay. Wir
- Philipp
- waren die letzten Wochen 'n bisschen mehr beschäftigt GMinar APIA NAS Studio gemacht haben. Und das Team ist superschnell. Also wir kriegen jetzt da gar nicht immer alles mit, was irgendwie neu kommt. Ich glaub, das das große Wichtige und Ganze ist, dass es dass man es versucht, einheitlich zu machen im Sinne von, es gibt ja jetzt die Anti Gravity Se Reihe, die nutzt den gleichen Agent Hunners wie die Anti Gravity IDI, wie die Anti oder wie Anti Gravity 2 Punkt 0. Das heißt, egal, wo Du welche das Coding Environment man irgendwie bevorzugt hast, das heißt, ich arbeite gern beim Terminal oder ich mach jetzt auf meinem Server was in meinem Terminal oder ich möcht gern auch irgendwie 'n Terminal haben und File Editor oder ich geh behans off, ich brauch nur 'n eine Chatinterface. Alles nutzt jetzt irgendwie denselben Agent und den denselben Hintergrund und dieselbe Sessions und so was, dass ich halt einfach flexibel da dazwischen hin- und herschützen kann. Wie das jetzt genau mit den Featuren ist, kann ich dir nicht sagen.
- Dennis
- Mhm. Okay.
- Philipp
- Sie weiß auch gar nicht, ob der Plan ist, dass die dass dass die neue Version so komplett wird wieder zu 'nem Editor. Ich mein, man geht ja aktiv den Schritt weg von, ich bin in 'nem Coding Editor, wo ich alles so manuell mach hin zu, ich mach's eher kollaborativ mit den Agents. Und da ist halt die Frage, hey, brauche ich 'n Terminal oder sollte ich lieber meinem Agent halt sagen, welcher Background Jobs laufen lassen kann, führt das Command für mich aus? Da weiß ich halt nicht, wo wo Sie gehen wollen.
- Dennis
- Ja, kann sein, dass ich da auch einfach noch, ja, nicht modern genug bin in dem Sinne, weil das ist tatsächlich, das das hat ganz gut funktioniert. Er hat dann einfach im Hintergrund halt irgend einen NPM oder irgend einen Node Prozess laufen lassen, ob der dann da angezeigt wurde, was halt sonst normalerweise dann irgendwie abgebrochen wird oder so was, was aber da einfach im Background dauerhaft weiterläuft und da passiert ist. Also es können mehrere Sachen einfach im Hintergrund laufen, die der Agents praktisch macht, wo Du gar nicht son großen Einfluss hat. Hat. Von daher kann das schon richtig sein, einfach zu sagen, ja, wofür brauchst Du 'n Terminal, wenn das einfach der Agent bedienen kann? Da brauchst Du nicht mehr sehen. Was ich natürlich grundsätzlich erst mal begrüße. Okay, aber lass uns das mal ganz kurz aufdröseln. Also Anti Gravity haben wir gerade gesagt, ist die ist die neue App, die man nutzen kann. Dann Anti Gravity CLI, die die Gemini CLI ersetzt und dann gibt es noch dieses SDK Ding, das heißt Genau. Anti Gravity SDK. Antagravity SDK.
- Fabi
- Und Managed Agents in Gemini ARPi gehört ja auch noch son bisschen Genau.
- Philipp
- Und den Anti Gravity Prequel Agent.
- Fabi
- Willst Du dazu 'n bisschen was erzählen, Philipp?
- Philipp
- Ja, das kann ich gern nicht erzählen, weil das das hab ich mitgebaut.
- Dennis
- Dann haben
- Fabi
- wir ja 'n richtigen Manier.
- Philipp
- Ja, also sozusagen oder with managt Agents, Du hast den neuen Anti Gravity Preview Agent, welcher denselben Harness wie die Anti Gravity IDE, Sealy und andere Tools, sag ich mal, im Hintergrund hat. Und das Neue daran ist jetzt, dass Gemini eine bekommen hat. Das heißt, wenn Du 'n schickst, kannst Du halt 'n definieren, was einfach nur remote ist. Das heißt, ich will einfach, hey, statt für mich im Container Linux VM Basic, aber man kann auch Sourcen definieren und halt Skills direkt. Das heißt, Du kannst wie in 'nem JavaScript Diktory oder in 'nem Python Objekt halt einfach sagen, hey, hier ist eine Liste, hier ist meine von Typ GCS oder von Typ oder Inline, kann ich GitHub Repositories oder oder halt einfach Content bereitstellen und das sind mein Environment Mountain. Und ich kann auch Network Rules definieren. Das heißt, wir haben halt immer das Problem, hey, wenn ich beim Agent auf irgend 'ner VM Freelancers geborene, keine Ahnung, was der da mitmacht. Und wir haben das so gelöst, dass man 'n Proxy außenrum hat. Das heißt, der Agent and sich hat gar nie den Open API Key oder den Geminar API Key, sondern der weiß, dass er 'n machen kann. Und dann tauschen wir in dem sozusagen den den aus und das kann man selber konfigurieren. Das heißt, wenn ich irgendwelche speziellen Customheader nutze, wenn ich irgendwie den, dann kann ich das alles machen. Und dann kann er halt wie auf, sag ich mal, den in der Sandbox das ausführen und kommen dann zu dir zurück. Und Managed Agents ist sozusagen das, was dir ermöglicht, da noch zu bauen. Also ich kann ja meine definiert oder mein Environment irgendwie scapfolden. Das heißt, ich könnte zum Beispiel 'n machen zu meinem Agent und sagen, hey, bitte installier mir irgendwie die Note Version und irgendwie download das GitHub Repository und dann hab ich halt einen einen einen mit 'nem und ich kann sagen, hey, kopier jetzt dieses Environment und gib's einem Agent. Der Agent hat dann einen Namen oder beziehungsweise eine ID und hat doch halt die und dann kann ich diesen aufrufen wie alle anderen. Das heißt, ich hab so in anstatt in meiner SDKs, sag ich nicht mehr irgendwie Flash, sondern ich sag halt, Dennis, GitHub. Halt, Dennis. Und dann kann ich ganz normal mit allen Tools und allen SDKs, allen Integrationen sozusagen dieses oder diesen Agent nutzen.
- Fabi
- Das heißt theoretisch dann auch, gibt's eine, kann ich kann ich meine, gibt's irgend eine iPhone App, wo ich wo ich das Modell definiert hab? Kann ich's auch theoretisch am iPhone dann machen? Ich weiß gar nicht, bin nicht gut genug drin, dass ich da
- Philipp
- Ja. Also ich mein, Du kannst auch ganz gut genug drin aufrufen und das ist alles, also es ist ein nur eine API Call. Du kannst den erstellen, was einfach nur halt diese Konfigurationsdefinition außen rum ist mit dem Environment oder ich kann's definieren. Und dann hab ich eine ID und dann kann ich die ID mit 'nem ganz normalen API Call nutzen von überall.
- Fabi
- Ich mein, dieses ganze Prinzip ist ja superinteressant, ne? Ich mein, im Endeffekt fangen wir ja schon darüber, ja, jetzt 'n bisschen an, da rüber zu reden, was Gemini Spark ist so, ne? Können wir vielleicht gleich mal halt nix drauf eingehen? Macht vielleicht Sinn, weil das ja im Endeffekt auch diesen Hahness Bindung, die ich versteh am Ende nutzt, ne, eine Art VM in der Cloud, die sozusagen gesandbox ist, irgendwie über die für diese Proxy Infrastruktur superinteressant, so wie er's gelöst hat mit den Environment Variablen für halt so was wie Tokens oder so. Das ist superinteressant, dass dass dass dieses Stück Technologie da im Endeffekt an so vielen Stellen dann genutzt wird. Man kann's selbst definieren, aber auch so mit Spark so dem das das das Hauptsicht Produkt, was darum gebaut wurde, ne, Enduser Faceing Produkt.
- Philipp
- Genau. Megacool. Dennis schaut's das könnte. Schau noch
- Dennis
- mal ganz Ja, ich ich bin mal sicher, ob ich's ganz verstanden hab. Du hast eigentlich morgen was genannt, das hatte Preview in den Namen. Ist das, weil's 'n Preview ist oder weil das ein ist?
- Philipp
- Also wir das sind 2 Dinge gelaunt. Es gibt zum einen in so ähnlich wie gibt's jetzt den Anti Gravity Preview Agent. Das ist wie 'n Modell beziehungsweise es hat halt eine ID, die Du einfach aufrufen kannst. Das heißt so ganz einfach den Anticlavity Agent Harmess mit dem Germani 3 Punkt 5 Modell in 'ner remote Linux Sandbox nutzen via API Call, die Du ganz normal 'n Modell callen würdest und dann ist sozusagen die Infrastruktur und die Konfiguration, die wir außen rum gebaut haben, dass Du eigene Agens definieren kannst, dass Du die speichern kannst, dass Du die dann direkt aufrufen kannst, ohne immer dieses, ja, neu einzugeben, sag ich mal.
- Dennis
- Okay und wo kommt dieses in dem Namen her?
- Philipp
- Es ist einfach, dass es halt nur nicht, also es ist noch nicht, das heißt, es kann noch kleine Veränderungen geben oder Features fehlen noch oder
- Dennis
- Okay, das wollte ich nur, ah, okay, weil das Preview hier an der Stelle jetzt nicht hinten dranhängt, was es sonst immer tut. Deswegen, ob es ein Preview Agent ist oder ein Na, das
- Philipp
- ist ein Anti Anti Preview. Hat die ID Anti Gravity Preview.
- Dennis
- Ah, okay.
- Philipp
- Und die API ist in Preview.
- Dennis
- Anti Gravity Preview. Alles klar, okay. Jetzt hab ich's, glaub ich.
- Fabi
- Er hat keine Preview
- Philipp
- Gibt's super Dokumentation und Ja. Ja, ja. Gibt's super Dokumentationen und man kann's direkt in der AR Studio testen. Das heißt, wenn ihr auf der AR Studio geht, gibt's jetzt son Agents Tab und da gibt's auch 6 solche Beispiel Agents von, wenn ihr jetzt vielleicht eine Development Key dot gesehen habt mit dem AI Radio oder auch es gibt 'n Repository, 'n Data Analyst, dann ich weiß gar nicht, was die anderen 2 sind. Und dadurch, dass das halt alles über Filesystems definiert ist, das heißt, ich hab einfach meine Skills in meinem Environment oder Skripte oder meine Agents m d, da hab ich nicht irgendwelche komplexen Drug APIs, die ich irgendwie definieren muss, sondern ist alles über halt dieses Environment gelöst und der Agent kann dann auch an sich seine eigenen Skills halt verändern. Das heißt, ich sag halt in 1 an einem Turn, hey, bitte installiert das und das und im nächsten Turn hat er dann sozusagen den neuen Skill Rückbau.
- Dennis
- Und wenn ich's jetzt über AI Studio nutze, wo an welcher Stelle hinterlege ich dann die Keys, die ich beispielsweise brauche, x y zu nutzen?
- Philipp
- Da gibt's an der rechten Seite unten Network oder Sources und da kann man das dann sozusagen hinzufügen. Das ist alles URL Base. Das heißt, ich muss zuerst meine Domain definieren, die keine Wildcard haben und dann welche Transformation ich für den HTTP Leader durchführen möchte.
- Dennis
- Okay. Mhm. Mhm. Mhm.
- Fabi
- Bevor bevor gleich wieder wir Feedback bekommen zu Dingen, die Du bald ausspricht, Philipp. Ich glaub, es meint, es heißt und.
- Philipp
- Genau. Genau. Ja. Nicht, dass
- Fabi
- Du's am Ende wieder wieder hier
- Philipp
- Für mich ist es 'n HDDP Header.
- Fabi
- Okay, dann werd ich, dann haben wir's hier gesagt, da müssen Leute draußen kein Feedback geben.
- Dennis
- Sehr gut. Mhm. Alles klar.
- Fabi
- Haben wir noch was zu Enter Gradumm. Vielleicht noch das Einzige, was Vielleicht weil's Ja. Weil's zumindest da draußen ja auch diskutiert wird son bisschen dieser Move mit Gemini CLI successers als Enter Gravity CLI. Dass ja Gemini CLI Open Source war, sie jetzt im Endeffekt diese CLI gesuncated haben und Closed Source gemacht haben. Ja, weiß nicht, ob wir ob wir jetzt jetzt hier im Podcast auch noch mal drüber diskutieren müssen, weil es zumindest was, was da draußen irgendwie diskutiert wird, Open Source und vor allem auch nach manchen, Jaminar CLI war besser als die InterGraity CLI, also was closed source hingestellt, was man nicht mal verbessern kann, dann auch noch nicht auf demselben Niveau, wie die Jaminar CLI war. Aber es sei mal hier als sozusagen gesagt, ich weiß nicht, ob wir in das Diskussionsthema aufmachen wollen.
- Dennis
- Wo wir vielleicht noch mal kurz 'n bisschen einsteigen können, weil wir es gerade dann auch touchiert haben als Oberfläche, wo man das Ganze auch nutzen kann, ist ja das Google AI Studio, was wir durchaus häufiger schon hier auch erwähnt hatten, weil es 'n ganz coolen, einfachen Zugang zu dem Ganzen gibt. Da gab's ja durchaus auch 'n paar Updates. Ich glaub so mit 1 der, ich nee, ich weiß nicht ob's 1 der größten ist, aber 1 auf das auf jeden Fall spannend ist, dass die Android Apps jetzt unterstützen. Das heißt, Du kannst full flatcht Native Android Apps einfach in deinem Browser irgendwie bauen und musst keine SDKs und nix irgendwie runterladen und kannst ja auch noch mal was ich 'n ganz spannendes Update fand.
- Fabi
- Und auch in dem Zuge, dass es diesen Android Studio Migration Agent gibt, ne, also dass Du Rag Native Web und iOS Apps super schnell mit diesem Agenten zu Native CodeLIN Apps rewiten lassen kannst. Also da gibt's glaub ich 'n paar Sachen in Richtung Codelin und so weiter, Integration, nicht nur in AR Studio. Ja.
- Dennis
- Und ich glaube auch diese ganze, also alles, was ne, Firebase anbetrifft für die UFO Cloud, das ist ja immer schon so, Firebase der hoch gewesen, die Leute irgendwie die in die Cloud zu bekommen und damals ja auch irgendwie Mobile first so von der Idee gewesen. Das ist halt auch viel da drin, ne. Das heißt, allem diese ganzen, alles, was im im im Umfeld von von Google letztendlich passiert, ist halt supereinfach dann zu entwickulieren, sei es irgendwelche Services, sei es irgendwo was zu hosten und so weiter, ist halt eigentlich dann nur noch ein, mach das mal bitte so und es funktioniert direkt in diesem in diesem gesamten Setup. Du brauchst nicht noch mal einen Wörsell oder einen, weiß ich nicht was, dann irgendwas lauffähig zu haben. Das das irgendwie auch ganz cool.
- Fabi
- Nice. Wenn wir dann auf die anderen beiden großen Themen kommen, in welcher Reihenfolge auch immer, Omni und Spark.
- Dennis
- Ja, Spark. Erst mal die größte, ganz großer Rant, Rant ist schon ein bisschen übertrieben. Aber wir sind wieder da. Wir haben häufiger im Podcast schon unterhalten, so wann ist ne. Wir hatten mal eine Phase vor 2 Jahren, vor 3 Jahren, wo häufig als wir diese News hatten immer hieß, ja okay ist US only und irgendwann kommt das dann nach Europa. Dann hatten wir eine Phase, wo das eigentlich nicht mehr so war, sondern Sachen einfach ausgerollt wurden und wir sie auch hatten und jetzt sind wir ja zumindest, was die Google a o angeht, wieder dort, wo es eine starke ja Differenzierung braucht zwischen was ist wann verfügbar. Also erst mal ganz schön, das was wir eben alles besprochen haben mit dem neuen Modell, mit Enter Gravity und so weiter. Das sind alles Sachen, die weltweit sofort verfügbar sind und die man direkt ausprobieren kann und jetzt kommen wir in die Bereiche, wo das nicht mehr so ist, Jammy Spark mit 1 der x Subscriptions, die es da gibt, glaube ich, in den kommenden Wochen jetzt in den USA only. Das heißt auf jeden Fall ein Produkt, das er noch nicht nutzen kann und auch einiges andere, was auf der Google Io generell vorgestellt wurde, eher so, ja kommt dann im Sommer, kommt im Herbst, wird erst mal in der Beta ausgerollt und so weiter, also auch einiges durchaus vorgestellt, was jetzt noch nicht direkt in die Hände von von uns gelangen kann. Und darunter fällt Germany Spark.
- Fabi
- Das willst Du erklären, das sollte ich erklären.
- Dennis
- Das kannst Du gerne erklären. Du hast ja schon Angst. Nee.
- Fabi
- Ja, ich mach mal ich mach mal die High Level und Philipp kann ja falls Du ja Details zu Technicality Side gern noch ergänzen, so wie ich's verschnab bin. Das was so was Philipp grade erklärt hat, was den was diesen Manage Agents angeht. Im Grunde genommen ist es ist das das, würd ich sagen, das Enduser Produkt aus dieser Technologie. Also wir haben das im Grunde genommen einen Agent, der auf dedizierten Google Cloud VMs läuft, die dafür designt sind mit, denk ich mal, dem Hannes, den der Philipp grade erklärt hat. Und in der Idee ist, es ist dein persönlicher Agent, der twenty four seven läuft, von allen möglichen Plattformen, was angesprochen werden kann und direkt Zugriff hat auf deinen Gmail Docs Kalender und auch grundsätzlich Third Party Apps via MCP, obwohl die Integration noch im Nachgang kommt und eben so Dinge machen kann für dich irgendwie E-Mails draften. Und eigentlich eigentlich so dieser Agent ist, ich hab's vorhin zum Dennis im Vorgespräch gesagt, eigentlich diese Form von Agent ist, nachdem der Dennis die ganze Zeit fragt so. Der einfach alles weiß, den ich jederzeit alles fragen kann, da muss ich keinen Computer mehr aufgeklappt haben, das kann ich von meinem iPhone machen. Der der läuft da einfach so, Ich sag mal, das, was Openclaw für Developer mit Zusammenfrickeln möglicherweise war, ist das jetzt von Google als User Faceing Produkt, ohne dass Du absoluter Techy sein musst, gedacht. Ich glaub, so würd ich's irgendwie beschreiben. Also ich würd mal auf jeden Fall was sagen. Ich mein, Dennis, wir hatten irgendwie vorhin, ne, nach letzte Woche hatten wir wieder bei Lotum auch irgendwie AI Week und irgendwie haben wir irgendwie eine ganze Woche lang erst mal, ohne jetzt irgendwie produktmäßig was bauen zu müssen und wirklich nur explizit mit der AI beschäftigt und einfach wieder viel ausprobiert und so. Man denkt wirklich, ey, es nervt dann einfach immer mehr, wie viele Sachen im Alltag man dann doch wieder selbst machen muss und warum kann kann eigentlich diese Agents noch nicht das und warum muss ich das noch selbst machen? Und Spark könnte möglicherweise die Antwort darauf sein. Also ich fand's, als ich das gesehen hab, fand ich's echt megacool. Und ich glaub, das ist wirklich immer wieder son Produkt, wo man sagen kann, das wird auch Enduser facing, also auch außerhalb von unserer Tech Bubble, über die Tech Bubble hinaus könnte das echt irgendwie dann noch mal 'n großen Impact haben und irgendwie 'n großen Shift haben abseits von den Leuten, mit denen wir bei der Arbeit sonst suggerieren sind oder auch im privaten Umfeld.
- Philipp
- Ich glaub, vielleicht, was das Wichtige ist, was dazugehört, ist Ich mein, wir sind ja jetzt in dem oder Google das da in dem Fall jetzt nicht der der Vorreiter. Es gibt ja schon alternative Lösungen von Open Air and Topic, aber es ist alles in der Gemini App. Das heißt, man braucht nicht eine neue App runterladen, man braucht nicht eine neue App aus seinem Handy, man hat nicht irgendwie krass viel anderes, sondern es kommt alles nativ in die Gemini App. Das heißt, wenn ich aktuell Gemini App benutze schon bin, ich weiß jetzt nicht, über welche Subskription das dann am Ende für alle zur Verfügung ist, aber ich glaub, man fängt mit Ultra in den USA an. Und wie das dann genau funktioniert mit, hey, ich hab da 'n Computer 24 7 laufen oder irgendwie so was, weiß ich jetzt nicht. Ich glaub, die erfüllen ja da sind so
- Fabi
- auch diese, sorry, sag Du? Ja. Ich ja, dieser, ich hab nicht ganz dazwischen, die haben ja, glaub ich, auch noch eine neue Lizenz oder diese AI Ultra für 100 Dollar im Monat. Das ist ja die neue Lizenz, die sie auch irgendwie eingeführt haben. Das ist, glaub ich, die niedrigste Lizenz, wenn ich's in der Kino richtig verstanden hab, die dann Spark nutzen können soll. Also 100 Dollar pro Monat ist der Einstiegspreis dafür, wenn ich's verstanden richtig verstanden hab.
- Philipp
- Ja, ich bin echt gespannt, weil ich ich weiß, wenn man selber Entwickler ist und irgendwie Open Cloud sich aufsetzt, wie mühselig das ist, Gmail und die ganzen anderen Google Services zu verbinden, dass ich das alles nativ mit drin hab. Und man sollte auch Also ich mein, das müsste man testen, aber ich stell's mir einfach so vor, dadurch, dass ich Gemini in der Gemini App bin, hab ich ja die Chats, dass der Agent entweder Zugriff auf die Chats hat oder der Chat eventuell Zugriff auf den Agent, aber das weiß ich jetzt auch nicht.
- Fabi
- Ja. Ja, das wird interessant.
- Philipp
- Das heißt, Dennis, macht bald 'n VPN an, holt sich Ultra und dann gibt uns Bescheid, wie's funktioniert.
- Dennis
- Ja, oder ich warte einfach bis Sommer. Wie ist das hier? Neunter Juni ist ja WWDC Keynote, guck mal, ob Apple Apple ein gleiches Angebot hat, dann wär's natürlich für mein Ökosystem noch 'n bisschen passender, wenn es auch mit Gmail und so weiter reden kann.
- Fabi
- Das ist ja, was ist das das das wie ist das Wunschvorstellung, realistisches Szenario oder oder einfach
- Dennis
- Wieso, die nutzen die nutzen doch im Hintergrund Google, das ist doch noch das Ökosystem. Das kriegen sie doch noch hin oder? Die haben es da einmal zu bauen. Können Sie's doch jetzt abgucken.
- Fabi
- Das Wichtigste übrigens für mich das Preis, das Hauptargument für AAA Ultra, da ist auch Youtube Premium mit drin für 100 Dollar.
- Philipp
- Genau.
- Dennis
- Ja. Sehr gut.
- Philipp
- Das war
- Fabi
- für mich der Behauptung.
- Dennis
- Ich bin so geil, so
- Fabi
- bei Youtube Premium hole ich mir das AAA Ultra, da ist es mit denen.
- Philipp
- Und das gibt man doch grade
- Dennis
- schon eine.
- Philipp
- Klappt Crabalredet uns das? Cloud.
- Dennis
- Ach, Cloud Credits.
- Philipp
- Ja. Ich dachte, dass irgendwie eine Ja, lieber
- Dennis
- klappt. Ja. Weil Du gerade Jamal App sagtest, das finde ich noch ein nettes Schmankerl von gestern, dass es jetzt eine native macOS App für Germany gibt. Die ist nämlich auch neu. Jetzt hatte ich da immer diese, wie nennt man das, Chrome PWA oder was auch immer, also sone installierte Germany Webseite Rapper. Genau, jetzt auch eben nativ und hat da alles möglich so an 1 Stelle mit Bildgenerierung und so weiter. Ist da, ich mag's ja immer, wenn es das nativ gibt. So, dann haben wir noch, wenn ihr nichts mehr dazu habt, Omni und ich muss ganz ehrlich sagen, Omni, sodass, womit ich am wenigsten anfangen konnte oder ich am wenigsten verstehe eigentlich worum's geht. Klärt mich auf. Also, also im Grunde ist es
- Fabi
- das neue multimodale Modell, ne und ich mein das, was ihr Selling Pitch war bei der Keynote war, das ist im Grunde genommen, dass der Nano Banana Moment für Video ist so. Also dass Sie mir im Endeffekt rausgestellt haben, wie gut die Capabilities für Videoeditierung, Generierung sind und so und kombiniert im Endeffekt, Sie sagen, mit Dietmarenz Veo, mit Nano Banana und Geney und kannst ist multimodaler Input und der Output Fokus ist eben Video, also dass Du damit Videos generieren kannst und auch son bisschen, ich glaub, der Minister Habis hat son bisschen geframed wie, das ist halt son bisschen 'n in die Richtung, dass nicht einfach eine Pixel generiert werden, sondern dass das System auch die physische Welt irgendwie versteht. Also da haben Sie irgendwie viele Beispiele für gemacht, dass das erst mal grundsätzlich von der Idee ist, ne. Videogenerierung als der absolute als der absolute Fokus so und es ist auch, wenn man auch sieht, wo's irgendwie ausgerollt wird, das ist so live in der Gemini App und Flow für paid User und das wohl auch, wenn ich's richtig verstanden hab, globale, nicht new US only, soll aber auch in so Dingen wie Youtube Shorts und Create, also das in diesen Tools, wo eben Video generiert wird, auch da der Zugriff zu Omni irgendwie mit dazu passt und API soll in den kommenden Wochen kommen so. Also das Geminar App und Youtube Shorts ist sozusagen der erste Anwendungsfall, wie man's irgendwie benutzen kann. Und wir haben dann auch da so, ich sag mal so, ja, ich weiß nicht, was die Beispiele waren. Sie haben einerseits gezeigt, wie man mit einem Videoimput plus während Style Inputs irgendwie komplett ein neues Video generieren kann, aber eigentlich das den den das Input Video superkonsistent hält, sondern nur Style und irgendwie Hintergrund anpasst. Und ich glaub, sie hatten auch son bisschen gezeigt, wie Du sozusagen damit, ich sag mal, Video wie Direction irgendwie machen kannst, indem Du irgendwie aus 1 irgendwie direkt 15 verschiedene Videos generieren kannst, aus verschiedenen Winkeln, dann irgendwie 'n verändern kannst oder was halt jetzt macht das mal im Dunkeln, wo vorher 'n Auto standen, dann gehen die Lichter automatisch an, weil dieses Verstehen von Welt halt supergut funktioniert so. Aber der Pitch würde ich sagen, es soll der Nano Banane Moment für Video sein.
- Philipp
- Genau und
- Fabi
- vielleicht Also es ist
- Philipp
- weil Du das Ja. Kurz gesagt hast, Omni steht für omnimodal, also nicht nur multimodal mit dem großen Ziel alles zu alles generieren können. Also aktuell hat man halt nur Video als Output, aber als Input hat man schon und deswegen wahrscheinlich auch der Vergleich zu Nanobanana, Audio Textbilder, Video Audio Textbilder, ja, das ist also die die 4 Modellities in dem Fall. Und daraus kann ich 'n neues Bild generieren und das eröffnet halt ganz, ganz viele Möglichkeiten. Also man kann halt irgendwie Soundaufnahmen von einem hinzufügen, das Bild und 'n Video und sagen, hey, bitte mach mich mit meiner Stimme in dem Video jetzt. Man kann halt klar nur von Text irgendwie 'n Video erstellen, aber man hat halt diesen multimodalen Input und es ich hab Also es gibt so witzige Beispiele, alles, was in Richtung Video Editing geht. Also wenn ich irgendwie 'n existierendes Video hab von irgendetwas und das editieren möchte mit irgend, keine Ahnung, da laufen jetzt irgendwie ganz die Katzen durch das Bild rein und das normale Video sich sozusagen nicht verändert oder halt ganz natürlich da reinkommen, da hat man diesen Katzen drin. Und es ist wirklich Also aktuell ist es schwierig, sage ich mal, zu erkennen, ob das dann editiert würde. Klar, man sieht wieder bei kompletten Neugeneration von Video, dass es son bisschen dieses immer noch leicht typische AI Uncady Valley in den Gesichtern irgendwie hat, aber wenn ich 'n existierendes Video hab, das irgendwie mit Image Input, Sound Input oder Text Input editiere, ist es schon crazy.
- Fabi
- Dennis probierst Du aus, hast Du grad die Jaminar App aufgemacht und machst schon Ja. Für uns.
- Dennis
- Ja, ich, weil das steht ja jetzt tatsächlich, dass es omni ist. Mein erster Promny hat gesagt, es fehlgeschlagen, aber es könnte sein, dass sein, weil da ein Kind abgebildet war und das ist ja immer noch irgendwie
- Philipp
- Ja, das ist in der EU schwierig. Protected. Hast
- Fabi
- Du auch WDR Videos ohne Kinder auf deinem Handy? Ich suche gerade und setzen andere.
- Dennis
- Ich muss sehr weit scrollen.
- Philipp
- Dennis Handy ist direkt bei der EU jetzt auf irgend 'ner Blacklist gelandet.
- Dennis
- Ich wähle eigentlich aus.
- Fabi
- Ich hab noch später alle Updates.
- Dennis
- Das muss wahrscheinlich jetzt irgendwie aus der iCloud runtergeladen werden. Ja, okay.
- Philipp
- Hast Du 'n Video ausgewählt oder?
- Dennis
- Ich hab jetzt 'n Video. Okay. Und dann sage ich jetzt, im Hintergrund läuft ein flauschiger Affe rum.
- Fabi
- Ja, das sieht man auf dem Video oder hättest Du, dass da reingemacht wird?
- Dennis
- Nee, das ich, das ist das, was jetzt editiert da reingemacht wird.
- Philipp
- So, das ist okay,
- Fabi
- da hat jetzt mal 'n Laubend drüber, was gleich rauskommt.
- Dennis
- Und lustigerweise oben drüber steht jetzt immer noch Germany 3 Punkt 5 Flash, aber das ist ja wahrscheinlich einfach nur das normale Modell, mit dem ich hier rede. Okay, Video wird erstellt, das kann einige Minuten dauern, der Hinweis. Aber hat jetzt stand jetzt irgendwo,
- Fabi
- dass es aber das Video für also das Video für Das stand eben was
- Dennis
- mit Omni, ja. Ja, okay. Aber also okay, dann habe ich das irgendwie, da hätte ich vielleicht die Keynote besser gucken sollen, weil in dem Blogartikel war das so, als ob das irgendwie eine andere Kategorie ist. Also wie ich euch jetzt verstanden hab, ist es halt irgendwie der Nachfolge von 3 1 und ja, das Ziel ist es, aber
- Fabi
- Der ist schon eine andere Kategoriemodell, ne?
- Philipp
- Genau, also es ist nicht irgendwie, das ist dann dies dasselbe Modell soll dann in Zukunft auch Text generieren können. Also es ist nicht, dass Du irgendwie Modell 1 anrufst, sondern Modell 2 aufrufst, je nachdem, ob Du Text oder Video möchtest, sondern es soll halt beides können. Das heißt, es kann so weit gehen, dass es 'n Video generiert, dann einen Text danach und dann wieder 'n Video. Also dass ich einfach sozusagen dieses Interlievte von Modities dann auch hab oder Aber man sieht ja schon Banananananan ein bisschen, dass ich eine Geschichte mit Bildern dazwischen ja generieren kann und so halt für alle Modalitäten, die es geht oder geben kann. Und daher kommt auch, glaub ich, dieses. Also das ist, Du Du kannst nicht nur irgendwie auf Text und Bildern trainieren, sondern musst halt auf alles, was irgendwie existiert, trainieren.
- Fabi
- Ich glaub, wahrscheinlich wird also in der in der Tendenz wird wahrscheinlich dieses Omnimodale wird der neue Standard werden wahrscheinlich, wenn sie dann mit Geschwindigkeiten irgendwie Price und so was wahrscheinlich dann konkurrieren können, dann ist es möglicherweise das Default Modell, was man dann eben nutzt, das dann eben omnimodalen ist. Machst Du noch 'n Video oder Dennis?
- Philipp
- Bist Du Ja.
- Fabi
- Hast Du Videocalls jetzt 'n bisschen raus aus dem Podcast hier.
- Philipp
- Ich hab Leute,
- Fabi
- die nicht mit Videogruppen
- Philipp
- Die TikToks Deklaration, ne. Ja.
- Fabi
- Dennis macht Selfies und irgendwie macht hier hängen Blues in in die Kamera, so ich, man weiß nicht ganz, ob er noch bei uns ist.
- Dennis
- Ich versuche das ganz, wenn
- Fabi
- sonst mach ich mal Youtube, wenn Du fertig bist
- Philipp
- mit dem Podcast. Gleich Youtube an und fangt an, nehmen wir zu essen oder so.
- Fabi
- Ja, ja, genau. Oder oder macht YouTube Shorts mit dem neuen Omnimodell.
- Dennis
- Na, ich
- Philipp
- bin ich
- Dennis
- bin live auf TikTok.
- Fabi
- Also Du bist noch bei uns okay.
- Dennis
- Ich wollte meine Audiens nur kurz
- Philipp
- der Audiens einfach sagen.
- Dennis
- So, wir gehen jetzt rein. Oh Gott, das funktioniert immer noch nicht. Eine Sekunde, ich will das noch, so lange muss der Podcast jetzt aushalten, dass wir das nicht schaffen. Also, das vorher wurde auch wieder geblockt. Ich hatte 'n Video von meinem Au pair genommen, vielleicht sah sie
- Fabi
- Oh, richtig. Rotentier. Also das Au pair als
- Dennis
- Im Hintergrund im Hintergrund hangelt sich ein Affe entlang. Handelt, hangelt. Und jetzt aber, jetzt muss ich noch aufpassen, dass ich auf Videos drücke. Das hab ich eben nicht geschafft. So, mit Omni kreativ werden, Enter. Letzter Test, wenn das nicht geht,
- Fabi
- dann dann ist unser dann ist unser Fazit, so Omni funktioniert jetzt alles scheiße, oder? Ja. Das sind unser Fazit, ja. Genau. Alles alles gelogen. Omni, es gibt uns an.
- Philipp
- Also es gibt sehr coole Videos, gerade wenn ihr irgendwie auf Twitter oder so seid oder so oder ich weiß nicht, wo wir die alle publishen, aber vor allem gestern oder auch die nächsten Tage ist es sehr witzig. Also mal von, man hat irgendjemand, der vor der Kamera sitzt und Du kannst halt sagen, macht Person unsichtbar. Dann hast Du nur noch so die Brillen und es funktioniert halt wirklich. Also er generiert genau das, was dahinter sein soll und Ah.
- Dennis
- Es
- Philipp
- gibt ganz, ganz viele Dinge. Irgendwie Vielleicht hat Dennis 'n Video dann und man kann's irgendwie teilen oder so was, Aber wirklich, Du sitzt halt irgendwie Also was ich so witzig fand, Du hast immer diese Podcasts oder Interviews, so wie jetzt, sag ich mal, wir bei uns. Und dann kannst Du halt wirklich das editieren und irgendwie sagen, ja, Dennis sitzt halt irgendwie dort und isst 'n Eis und halt so komplett Nicht, dass es ist, sondern so komplett, wie als ob sie 0 interessieren würde so. Das macht's dann echt witzig. Und wir haben auf der IO son eine Demo, die heißt, wo man von sich dann ein ein Bild aufnimmt oder 'n kurzes Video Und dann generiert man eine komplette Commercial und die sehen extrem gut aus. Also ich geh ganz stark davon aus, dass alles, was irgendwie werbungstechnisch im Bereich ist, sehr davon getrieben wird.
- Dennis
- Das ist schon Okay, also ich wurde wieder, es wurde wieder abgelehnt und gesagt, dieses Video kann nicht erstellt werden.
- Fabi
- Ja, ich mein, wie gesagt, wir können ja mal 'n paar Beispiele in die Shownotes packen oder einfach Google einfach mal Einfach. Auf Youtube.
- Dennis
- Also vielleicht intervallierst Du jetzt neue Videos. Ja. Also,
- Fabi
- man könnte sagen, gut vorbereitet Podcast hätten sowas vor Ausbilder, aber ihr hört ja die programmier.bar, so ihr kriegt das live mit wie Dennis Struggle ein Video zu erstellen, so. Ja. Ich denk, da ist
- Philipp
- auch immer der Mehrwert
- Fabi
- hier drin.
- Dennis
- Unser aktueller Stand ist ja gerne, omnys Scheiß von daher, ich versuche das Ganze noch zu retten.
- Philipp
- Also mein aktueller Stand ist, ich bin mehr als Symbrest.
- Fabi
- Also wenn ich parallel, also wenn ich nicht den Weg wähle, wie Dennis etwas selbst auszubilden, sondern wenn die Youtube Beispiele auf Youtube dazu angucken, wo ich auch auswähle hab.
- Philipp
- Ja, ja, das muss das schon funktionieren. Ich weiß nicht, was Dennis immer wieder eingibt und welche Videos er da hochlädt von sich. Ich weiß nicht. Philipp,
- Dennis
- Du hast es
- Fabi
- in der Geminar App schon ausprobiert, ja?
- Dennis
- Du hast es
- Philipp
- Jetzt im Flow getestet. Und den im Flow ist es besonders cool, weil Du halt mehrere Parallelen machen kannst. Du kannst die übereinander stecken, dass Du dann sozusagen wirklich den Vorher Nachher Vergleich siehst. Du kannst dann das editierte Video dann halt weiter editieren oder das Du hast ein Video Output und kannst halt verschiedene Prompts für dieses Video machen, dass Du wirklich siehst, wie das sich irgendwie anpasst.
- Dennis
- Das doch einmal ganz, ganz sinnvoll zu füllen, die Zeit, was kosten das Ganze? Ist das irgendwie billiger, teurer? Gibt's irgendwelche Preise?
- Fabi
- Billiger teurer als was?
- Dennis
- Als wie beim Mai ist jetzt. Für mich ist es, wenn's aktuell nur Videos erstellen kann, vergleiche ich's jetzt erst mal mit dem Video erstellen.
- Philipp
- Also es gibt noch keine API, deswegen gibt's kein API Pricing und Ah. In Sheminar App und Flow ist es Teil der Google AI Subscription und ich weiß jetzt nicht, ob Du Ultra hast, aber scheinbar ist es am den Pro auch zur Verfügung mit Credits müsste man nicht schauen.
- Dennis
- Ich ich bin in sonem Workspace, also ich bin mit meinem Business Account drin, also in sonem Workspace Ding. Yes, okay, Anyway. Wir geben ihm noch 2 Sekunden, wenn das nicht ist. Haben wir sonst noch was für die Podcastfolge? Feedback Podcast at Programmier Punkt Bar. Philipp, danke, dass Du dich aus den USA hinzugefügt hast. Oh, das Video ist fertig. Ich konnte ein Video erstellen und es macht das, was ich wollte.
- Philipp
- Aber hast Du nur 'n neues Video erstellt oder 1 editiert?
- Dennis
- Na ja, das mit dem Video editieren ging ja nicht. Ich hab ein Foto genommen, ein Foto genommen, wo ich jetzt am Wochenende in Rostock war und das zu einem Video machen lassen, wo auf einem kleinen Kanal war eigentlich 'n großer Boot gefahren, ein ein Jet Jetski vorbeifährt und das sieht wunderbar aus. Das teilen wir natürlich auch unseren Social Media Channels, damit ihr Also
- Philipp
- wenn man's testet hat. Ja und wenn man's testet, vielleicht nicht dieses Text to Videos, sondern wirklich schauen, hey, ich kann Text, Video, Audio und Bilder gleichzeitig eingeben. Was kann da rauskommen? Also es sind, wenn ich einfach nur das irgendwie gegenüber Video vergleich, wo ich 'n Text eingeb, dann weiß ich jetzt nicht, ob man so viel Neues sieht, aber sondern es geht wirklich halt dieses Editieren und Okay.
- Dennis
- Was ist das so was?
- Fabi
- Willst Du Philipp abwürgen oder was hast Du uns grade gezeigt? Das ist der Ich glaub, Dennis ist komplett raus aus dem Podcast. Das ist der Jetski.
- Dennis
- Der Jetski, von dem ich sprach. Also da
- Philipp
- Vielleicht, vielleicht Feedback oder halt für Dennis nächstes Mal kein Handy mehr mit in die Aufnahme, sondern so das außer Handyverbot.
- Fabi
- Wie in der Schule son bisschen, ne.
- Dennis
- Was war das? Wenn dann letzte,
- Fabi
- aber doch als als letzte News, damit ich die Leute das mal gehört hab, wenn ich's nicht mitbekommen haben, Andre Capathy ist jetzt zu seinen Trip gegangen, ne.
- Philipp
- Genau. Muss man
- Fabi
- noch als News son bisschen am Ende am Ende droppen. Mal schauen, was da raus wird, so. Sehr gut.
- Philipp
- Das ist, da der der Tweet hat irgendwie 120000000 Aufrufe oder irgendwie so was gehabt Echt? Über 100000 Likes. Ja, also ich hab's verrückt.
- Fabi
- Das ist
- Dennis
- ja wirklich crazy.
- Fabi
- Ja, aber spannend. Das ist auf jeden Fall interessanter Move. Hatten wir's nicht letztens andere Folge, was macht er eigentlich mit seinem, was macht er eigentlich im Moment so mit seinem Was macht
- Dennis
- er eigentlich
- Fabi
- Learningplattform oder was kommt von ihm? Ja, dann wahrscheinlich doch nicht Learningplattform.
- Dennis
- Vielen Dank, habt eine schöne Zeit, bis bald, wir auch, Maritaa.
- Philipp
- Tschau, tschau. Tschüs.