Seedance 2.5 // GPT 5.6 // GLM 5.2 // Cursor iOS App // US vs. China // Gemini Computer Use
- // Podcast
- // News AI 27/26
Shownotes
Philipp meldet sich in dieser Folge direkt von der AI Engineering World Fair in San Francisco und bringt spannende Einblicke in die neueste Entwicklung von Cursor mit. Die beliebte IDE ist nun als iOS-App verfügbar und erlaubt es euch, mithilfe von Remote Agents und virtuellen Maschinen auch von unterwegs an euren Projekten zu arbeiten. Dabei setzt das Team auf eine nahtlose Integration von Cloud-Umgebungen, die sich trotz mobiler Plattform fast wie lokales Coding anfühlt.
Im Bereich der Videogenerierung sorgt ByteDance mit Seedance 2.5 für Aufsehen. Das Modell generiert nun bis zu 30 Sekunden lange Clips in 4K-Auflösung und 10 Bit Farbtiefe. Besonders beeindruckend ist die Möglichkeit, bis zu 50 Referenzbilder einzuspeisen, um die Konsistenz einer Storyline präzise zu steuern. Während die Technik rasant fortschreitet, formiert sich in Hollywood Widerstand in Form von Klagen großer Studios wie Disney und Universal, während andere bereits strategische Partnerschaften mit KI-Unternehmen eingehen.
Die GPT 5.6-Reihe mit den Modellvarianten Sol, Terra und Luna wurde offiziell vorgestellt. Doch wer gehofft hat, die volle Power des Sol-Modells sofort nutzen zu können, wird enttäuscht. Aufgrund strenger Sicherheitsauflagen der US-Regierung bleibt der Zugang vorerst auf einen kleinen Kreis ausgewählter US-Unternehmen beschränkt. Diese Entwicklung markiert einen Wendepunkt, da staatliche Behörden nun aktiv in die Release-Zyklen der großen KI-Labore eingreifen und internationale Veröffentlichungen vorerst blockieren.
Gleichzeitig verschärft sich der Ton zwischen den USA und China. Anthropic wirft Alibaba vor, sogenannte Distillation Attacks in massivem Ausmaß durchgeführt zu haben. Dabei wurden Millionen von Anfragen genutzt, um die Fähigkeiten der neuesten Modelle „abzuzapfen” und für das Training eigener, chinesischer Modelle zu verwenden. Dies führt zu einer hitzigen Debatte darüber, wie sich KI-Anbieter vor dem Diebstahl ihres geistigen Eigentums schützen können und welche Rolle die Politik bei der Verteidigung technologischer Vorsprünge spielen muss.
Dass aus China extrem leistungsfähige Modelle kommen, beweist auch Z.ai mit GLM 5.2. Dieses Open-Weights-Modell unter MIT-Lizenz überzeugt in ersten Benchmarks besonders im Coding-Bereich und spielt qualitativ in einer Liga mit den großen kommerziellen Modellen von Anthropic und OpenAI. Da es über Provider wie OpenRouter extrem kostengünstig verfügbar ist, stellt es eine spannende und preiswerte Alternative für eure automatisierten Entwicklungs-Workflows dar.
Google schläft ebenfalls nicht und spendiert Gemini das Computer Use Tool in einer neuen Version. Damit ist die KI in der Lage, Browser, Desktop-Umgebungen oder sogar mobile Betriebssysteme wie Android und iOS eigenständig zu steuern.
Zuletzt gibt es Neuigkeiten aus der Hardware-Ecke: OpenAI arbeitet gemeinsam mit Broadcom an „Jalapeno”, einem spezialisierten Chip für effizientere Inference, um die steigenden Rechenanforderungen und Token-Kosten langfristig in den Griff zu bekommen.
- Dennis
- Hallo und herzlich willkommen zu 1 neuen AI News in der Kalenderwoche 27, ja 2026. Wir sprechen heute über eine neue CursA App, die es für mobile Plattformen gibt. Modell Updates aus der OpenAI Welt mit der 5 Punkt 6 Reihe Seedance 2 Punkt 5 und GLM 5 Punkt 2. Außerdem haben wir noch was über Germany Computer Use dabei und wie sich enthropic wehrt gegen Angriffe, dann nennen wir sie erst mal in der Zusammenfassung, aus China. Ich bin Dennis und freue mich, heute zugeschaltet zu haben einmal
- Fabi
- den Fabi Finkelau und den
- Philipp
- Philipp. Hallo.
- Dennis
- Schön, dass ihr da seid. Alles fit bei euch?
- Fabi
- Ja. Philipp hat eine lange Leitung bei der San Francisco ist und ich muss mich anstrengen, nicht zu husten, also mal gucken, wie viel ich es schaffe zu reden, ohne zu husten.
- Dennis
- Super. Aber Du
- Fabi
- hast jetzt 'n kühles Eis gegessen, von daher, bei dir soll's jetzt laufen, oder?
- Dennis
- Bei mir soll das laufen. Ja, es tut mir 'n bisschen leid, dass die Aufnahme 2 Minuten später starten musste, weil ich noch 'n Eis im Mund hatte. Ich glaub, die Hörer merken's nicht. Von
- Fabi
- mich hat sie direkt gestartet an der Genervtstimme von
- Dennis
- von Philipp vielleicht. Willst Du, Du Du, wo bist
- Philipp
- Du gerade Philipp? In San Francisco und zwar auf der AI Engineering Worlds Fair, später.
- Dennis
- I engineing Worlds Fair. Fair hat direkt son bisschen was abtörnendes bei mir, weil es sich so World Fair? Ja, weil Fair hört sich so nach Messer an. Das ist son bisschen, ich erwarte dann irgendwie bei, weiß ich nicht, wie bei der Buchmeister so Ja,
- Philipp
- der Ständer. Stand. Stand. Von Swix am Anfang war mit dem groß, also übers Jahr verteilt gibt's ja mehrere E-Regineering Konferenzen. Da war auch jetzt eine in London und in Singapur, hoffentlich bald woanders auch noch. Und der Gedanke mit der Worldsface und bisschen aus der Expo kommend aus den frühen Neunzehnhunder oder Hunderdern, wenn ich's richtig verstanden hab, also mit dem Ziel, wirklich alle, die halt irgendwie in der KI unterwegs sind, an 1 Konferenz zusammenzubekommen und dann halt also die verschiedenen Kleinen.
- Fabi
- Aber gibt's da wirklich so so Tracks mit Speakern und so, also schon, dass schon 'n Konferenztrack gibt's schon?
- Philipp
- Ja, ja, es gibt, glaub, 6 Tracks oder so was, über 6000 Leute ist also die größte. Und Du hast halt wirklich Also es ist sehr familiär, würd ich immer noch sagen, weil man sich halt doch irgendwie dann wieder kennt. Aber Du hast wirklich Wir hatten gestern Abend 'n Speaker Dinner mit halt Antropic, OpenAI, Google Leuten, dann von den ganzen Start ups aus San Francisco, von halt Langchain über alles Mögliche. Es ist sehr cool. Also wenn man irgendwann mal die Möglichkeit hat, definitiv mal auf eine der Konferenzen gehen.
- Dennis
- Glaubst Du, dass sie sich in der Transition noch mal stark unterscheidet, weil die's nicht so weit haben?
- Philipp
- Ja, also der der Gedanke dahinter ist immer San Francisco, so alles irgendwie, wenn's geht. Und dann hast Du halt mehr fokussiert, zum Beispiel im April, die in London, da war halt sehr viel europäische Präsenz oder mehr europäische Präsenz für die Besucher beziehungsweise auch die Speaker. Mhm. Und jetzt hast Du doch sehr viel Silicon Valley, sag ich mal.
- Dennis
- Okay. Sehr gut. Cursor kommt, woher?
- Philipp
- Das weiß ich
- Dennis
- gar nicht. Was ist Cursor?
- Philipp
- Aus San Francisco. Aus San Francisco.
- Dennis
- Okay. Was haben die denn Neues gemacht?
- Philipp
- Die haben, ich glaub, also wir hatten hier, wir haben über die geredet. Das war ja deren deren jährliche Konferenz. Und da haben sie schon angekündigt, es gibt eine neue iOS App und es gibt jetzt die iOS App auch zum downloaden. Das heißt, man kann's die runterladen. Ist, ich hab's getestet auf meinem Weg vom Uber im Uber vom Flughafen zu meinem Hotel. Ich hab's also, ich hätt's runtergeladen, hab mich eingeloggt, mein ersten gestartet. Hat sehr gut funktioniert. Basiert auf dem Cloud Agents. Das heißt, wenn man schon irgendwie die Cloud Agents genutzt hat, man kann seinen auswählen von GitHub, eine Session starten bekommt dann halt son Remote Agent, der Dinge tut. Genau, wird's einfach beschrieben, sag ich mal.
- Dennis
- Falls ich was gestern hier in der Diskussion war, könnte da kurz einsteigen bei diesen remote Environments, die ja letztendlich alle die Cloud Agents brauchen, da irgendwie Projekte laufen zu lassen. Gibt's da irgendwelche Dienste, die mehr Konfiguration erlauben oder beziehungsweise wie viel kann man da im Moment konfigurieren? Ist das immer ein festes Setup, was da hochfahren wird oder gibt's irgendwie auch die Möglichkeit halt zu sagen, keine Ahnung, ich brauch Node irgendwas oder Node ist ja vielleicht auch nicht für jeden irgendwie das Variante, in dem man entwickelt. Wie viel Einflussmöglichkeiten hat man da aktuell?
- Philipp
- Ich glaub, Du hast halt auf der rechten Seite ja konfigurierbar als wahr, als Du möchtest irgendwie Und links halt, Magic Blackbox. Und es ist ja ein kompletter Markt an sich eigentlich mittlerweile, die Sandboxes. Also Du hast Start ups wie E-2B, Model, Daytona, die halt anbieten. Das heißt, Du hast definierte, sag ich mal, Container, kannst deine eigenen Container mitbringen oder Packages installieren und kannst dann in diesen halt irgendwie ausführen oder auch die neue Cursor SDK oder halt welchen Coding Agen sag ich mal, auch immer Du magst. Das heißt, da hast Du voll die Kontrolle. Da kannst Du auch dann das hört sich für deine eigene Agents, wenn die halt irgendwie ausführen sollen. Und auf der anderen Seite hast Du halt, sag ich mal, solche remote Agents wie CursOR direkt. Und bei CursOR ist es so, also zumindest bei dem, was ich getestet hab, dass es immer das hat, was es möchte, beziehungsweise der Agent das dann installiert. Also die machen irgend 'n, ich schau ins Repository, ob dann 'n Package json ist und dann bereite ich Node oder Python. Also die haben auf jeden Fall sehr viel Default installiert. Vor allem das der große Unterschied zu cursor, zu vielen anderen ist, dass Du eine komplette VM bekommst mit Display. Das heißt, Du hast nicht irgendwie so nur son Coding Ding, sag ich mal, sondern 'n ganz großes Feature von denen ist ja immer, wenn Du irgendwelche Sachen auf dem machst, dass Du sagen kannst, hey, bitte testet es. Und dann bekommst Du als Antwort nicht nur irgendwie, ich hab's gemacht, sondern Du kriegst auch 'n Video, wo Du siehst, wie das aussieht und wie der Agent das getestet hat. Debin macht das, glaub ich, auch mittlerweile. Genau, also das ist schon mehr. Und ist auch das, was Cursor selber gesagt hat, was den größten Unterschied ausmacht. Du musst dieses remote Environment so hinbekommen, dass es sich nach dem Lokalen anfühlt, weil der größte Unterschied ist ja, Du weißt, was Du lokal hast. Das heißt, Du anders, als was Du irgendwie remote hast. Und wenn Du remote dann irgendwie genau also prompten möchtest, weil Du halt dich hin- und her switcht mittlerweile, dann ist es halt extrem schwierig, wenn der Agent erst mal strugglet beat, wer kein installiert ist und dann erst mal 4 Runden verschwenden muss, dass er installiert.
- Dennis
- Und der Vorteil von diesen anderen Start ups, die Du genannt hast, ist, dass es son bisschen mäßig kommt, weil sonst könnte man sich wahrscheinlich auch irgendwo selbst einfach, also läuft die Inference dann praktisch in dem gleichen Container oder ist es einfach nur erst mal nur die Cloud umgeht, die wahrscheinlich nicht, ne, das ist ja, nee, kann ja gar nicht, ist ja Also
- Philipp
- es gibt da wieder 2 Modelle. Du hast Agent in Sandbox und einmal Agent Daddy Sandbox Call. Also Du kannst zum Beispiel, wenn Du, keine Ahnung, brauchst 'n ganz einfach gesagt 'n MCP Server, der hat 'n Tool, das nennt sich Bash. Dann kannst Du dir dein Agent Loop außerhalb irgendwo laufen lassen. Und wenn da dann dieses Bash Tool ausführt, dann machst Du diesen Call in die Sandbox rein oder Du startest dein Agent in der Sandbox und führst alles lokal aus, wie Du auch auf deinem PC machst.
- Dennis
- Mhm.
- Philipp
- Und es ist nicht einfach. Also es gibt 'n Grund, warum diese Start-up existieren, vor allem, wenn man in den Bereich von geht. Bei bei Agents im Verhältnis zu, wo man früher Counates benutzt hat, ist halt alles jetzt, also für und sonst was. Keine Ahnung, hat irgendwie 10000 und halt 'n normaler Container, den Du auf Cubaates laufen lässt, der deine Webseite hostet, der hat halt nicht dieses. Und es ist auch wichtig, wie Du halt startest und wie Du den State wiederherstellst und sonst was. Deswegen gibt's schon 'n Grund, warum da so viele Start ups existieren beziehungsweise warum alle jetzt da irgendwie 'n Service anbieten. Amazon hat das auch letzte Woche für Firecracker beziehungsweise für Amazon ABS Lambda son Micro WM Firecracker Zeug vorgestellt, dass Du das halt auch selber machen kannst.
- Dennis
- Okay. Ja, das muss ich mir mal 'n bisschen angucken, hab ich Gefühl, dann noch 'n bisschen flexibler zu sein. Okay, dann lasst uns doch mal 'n bisschen Abwechslung reinbringen und erst mal wieder in die Videogenerierung gehen, wenn ich Seadance 2 Punkt 5 richtig verorte im Videospace?
- Fabi
- Das hast Du richtig verortet. Seadance 2 Punkt 5, das neue Modell von ByteDance, warum waren wir bei Seadance 2 Punkt 0. Und ich glaub, die 3 Dinge, die superkrass herausstechen, warum es jetzt hier sone Welle gemacht hat, ist, dass das Modell ist, was jetzt 30 Sekunden Video mit einem Prompt generieren kann, also einfach erst mal Output Länge ist, hat sich direkt von dem davor standen, also dem Maximalen auch sozusagen verdreifacht oder ich glaub, CDance war, 2 Punkt 0 war vorher auch schon das Modell, das am längsten Videos generieren konnte mit 12 Sekunden. Jetzt sind Sie bei 30 Sekunden. Dazu ist das Ganze auch in 4 k mit 10 Bit Farbtiefe, also wirklich Topqualität direkt als als Output. Und auch noch super beeindruckend, dass 50 Referenzeingaben, also 50 Bilder, die Du mit reingeben kannst neben dem Text, als Referenz für das Video geben kannst, was natürlich super super beeindruckend ist. Also wenn man sich mal die Videos anguckt, die mit dem Modell generiert wurden wurden, ist schon so, dass man jetzt sagen kann, das geht jetzt wirklich so in, also ich mein, was kannst Du in 30 Sekunden schon an Storyline machen, ne? Und wie wie krass Du eine konsistente Story erzählen kannst mit 50 Referenzbilder. Du kannst es supergut guiden und stielen und ist natürlich jetzt superinteressant, dass es hier wieder ein Modell ist, was jetzt aus China China kommt. Vielleicht auch später wieder etwas, wo bei uns noch mal unterhalten werden, China, was USA. Aber ByteDance, also sozusagen der Mutterkonzern ja hinter TikTok, hatte auf jeden Fall wieder das Next Level Videomodell rausgebracht. Und glaube ich schon, dass es jetzt noch mal sehr viel mehr Einfluss haben wird dann auch in in Videogenerierung, möglicherweise auch in Filmproduktionen so. Ich mein, parallel sieht man auch, dass jetzt Hollywood an, sagen Sie, mit mehr Klagen losweg. Also Disney Universal und Warner Brothers haben jetzt chinesische Mini Macs verklagt und beispielsweise jetzt auch Google hat vor kurzem Announce eine Zusammenarbeit mit a twentyfour, dem Studio unter anderem hinter so Filmen wie Ex Machina, die jetzt zusammenarbeiten wollen, also 75000000 Dollar Partnership, sozusagen KI Filmwerkzeuge zu entwickeln. Also ich glaub, da wird sich jetzt schon mal eine ganze Ecke irgendwie mehr drehen. Ich glaube auch, wenn wir jetzt echt so was haben wie 30 Sekunden mit einem Prompt und 50 Bildern, wird es jetzt auch noch weiter in, glaub ich, auch in dem Alltag außerhalb unserer Tech Bubble irgendwie Einzug erhalten. Also ich glaub, es ist schon jetzt mittlerweile wird es, war's ja jetzt schon die ganze Zeit. Ich glaub, es hat ja schon mit Seed in 2 Punkt 0 und auch schon davor mit VEO irgendwie 'n Sprung gemacht, wo's, glaub ich, jetzt schon wirklich in die Workflows von Videomenschen Einzug erhalten hat. Und ich glaube, jetzt mit dem 30 Sekunden auf der Qualität 50 Referenzbildern werden wir's einfach nur noch mal mehr sehen. Und ist auf jeden Fall super super beeindruckend, was da jetzt mittlerweile rauskommt. Also mal gespannt, bei welcher Länge wir irgendwie in mit Seedance 3, 4, 5, also wann sind wir wohl bei, keine Ahnung, Tausende von Bildern rein und Filmlänge raus sind.
- Dennis
- Mhm. Abgefahren. Ja, ist interessant. Ich hab gestern zufällig auf auf TikTok auch ein, also AI generiertes Video, was bei mir in meinem Feed noch relativ überschaubar ist, muss ich sagen, von dem wir, was ich so sehe, aber das war so Deutschland gegen Paraguay in sonem bisschen dystopischen Setting, also so als Krieger angezogen, sowas, völlig wild, aber wo Du sagtest, also halt, ne, auch mit den mit den Spielern und so, wo Du hattest, ey, was eine Qualität so, ne. Du erkennst jeden, wer das sein soll und es hat eine Storyline. Es gibt verschiedene Kameras, es gibt Effekte und so was. Also abgefahren überhaupt auch, also ne, die Energie muss ja trotzdem jemand reinstecken, das dann noch mal so zu prompen und zu schneiden und keine Ahnung, was ja. Ja, ich meine, der kriegt ja auch so 2 Sekunden hintereinander.
- Fabi
- Ich mein, das war ja vorher auch, also genau so was zu prompt war ja schon auch durch das Spiel. Da wurde ja teilweise die Flows waren ja eher, dass man irgendwelche irgendwelche Imagemodelle dann genutzt hat, ja irgendwie von Nanonbanana Pro oder so was wurd häufig genutzt, wo eher sone Art Story Scene sozusagen als Bilder gebaut wurde, diese Bilder dann aufgeteilt wurden, sodass die Bilder in sich konsistent waren, daraus dann mehrere Clips erzeugt wurden. Und ich mein, dieser Workflow muss auch jetzt immer noch irgendwie gemacht werden, damit halt die Konsistenz über mehrere 3 Sekunden Clips hinweg passiert. Aber wenn Du jetzt einfach schon in einem Prompt irgendwie 3 Sekunden, wie gesagt, was Du da an Storyline irgendwie haben kannst und grade auch mit den Soundeffekten, ich glaub als einen, das war ja glaub ich 'n, das sieht ja dann 2 Punkt 0 Videobeispiel, aber so auch ASMA mäßig, da gab's, glaub ich, ein Video, wo's hieß, alter Mann, der Sand isst. Und man da mal irgendwie Kopfhörer aufsitzt, ist es irgendwie son alter Mann vor sonem Teller von Sand und dann knirscht es so zwischen den 10 in 4 k Auflösung und so. Also es ist schon auch soundmäßig auf jeden Fall alles next Level. Und ich ich glaube so, wir werden halt immer weniger von diesen, ich sag mal, zusammengebastelten Kreativ Flows brauchen so, sondern es wird einfach viel näher daran kommen, so, was in deinem Kopf ist, kannst Du mal schnell als Output generieren so. Also schon sehr interessant, wann es auch in Hollywood möglicherweise dann jetzt umschlägt von wir verklagen hin zu, es wird jetzt einfach das ernstzunehmende Tool und es wird viel mehr in Filmen auch irgendwie Einzug gehalten. Also 3 Sekunden ist auf jeden Fall eine Ansage.
- Philipp
- Mhm. Ich Habt ihr es dann eher besser oder schlechter mit filmen?
- Fabi
- Gute Frage. Mehr werden's werden und keine Ahnung, am Ende zählt ja trotzdem so die Kreativität so. Ich mein, warum die Frage ist, warum sollte es schlechter werden so, ne? Also ich mein, am Ende ist es so, die guten Filme werden sich durchsetzen. Es wird halt mehr sein, Du wirst krasser geflottet werden, Du weißt es halt nicht mehr, aber warum sollte nicht trotzdem Qualität siegen? Am Ende gucken sich das die Leute an, was Also die Frage ist ja auch, was ist besser, ne? Es werden sich entweder werden sich viel mehr Nischen ergeben und es gibt nicht mehr so den Mainstream und dann kommt der eine Film raus und alle gucken sich den an, sondern es wird sich viel mehr aufzweigen abzweigen so, die einen gucken das, die anderen das. Und es gibt viel mehr Subgenres so, es spielt plötzlich einfach viel weiter auf. Und es gibt nicht mehr so die einen Filme, die jeder kennt und die großen Stars, die großen Filme. Aber ob das jetzt schlechter oder besser ist, ich würd trotzdem sagen, ich mein, die Leute müssen trotzdem dann ihre Freizeit da reinstecken, sich diese Filme anzugucken. Also irgend eine Qualität musst Du liefern.
- Philipp
- Aber also ich mein, bei Netflix existiert ja aktuell schon, dass, ich weiß nicht, das ich würd's nicht Problem benennen, aber halt die die Strategie, dass Netflix ja sehr stark darauf schaut, was die Leute anschauen. Und das hat ja schon den Content verändert in in eine gewisse Richtung. Und bei Netflix seht ja jetzt mehr, auch wenn's, sag ich mal, kreativ, gestalterisch, qualitativ, die eine Staffel sehr gut funktioniert, aber die Menschen das halt einfach nicht schauen, weil's, keine Ahnung, kein ist oder kein Love Island oder so was, dann produzieren die das ja einfach nicht mehr. Wie zum
- Fabi
- Beispiel sagen, Love Island ist schlecht? Also das ist jetzt deine Definition von schlecht oder war's halt? Dann haben wir's da so unterschiedliche Meinungen.
- Philipp
- Ja. Und ich glaub halt, dass das zu viel mehr ähnlichen Dingen führt. Also im Szene von, Du hast son Art, Du siehst, was funktioniert. Und dann wird das eher nur mehr abgeändert, also die die gleiche Jetzt dann gibt's halt nicht Ich mein, es gibt ja schon sehr viele solche Formate, aber ich weiß noch nicht, ob das positiv ist für für Filme und Serien auf lange Sicht, was den Content angeht, den wir uns anschauen werden.
- Dennis
- Wobei ich den Aspekt denke, dass der wahrscheinlich auch schon passiert ist. Ich mein, Hollywood hat ja immer sich auch nicht hingesetzt und hat gesagt, so, was finden wir denn jetzt grade mal schön und was was denken wir, ne, was wo wir Spaß dran hätten, sondern natürlich auch, was kann erfolgreich sein und was sind die, ne, Plots und Dinge, die wir brauchen, einen monetär erfolgreichen Film zu machen, so. Aber natürlich auch, also es ist
- Fabi
- aber auch ein ein Tool, was halt dann wiederum die Kreativität in mehr Hände Ich mein, auf jeden Fall ist 'n gutes Beispiel, das wär Netflix, wäre dann eher ein Indiz dafür, dass es möglicherweise gleich gescheitert wird und viel mehr KPI getrieben wird. Klar, wenn Du das als Plattform und so monetär denkst, würd ich das auch sagen, aber andererseits ist es so, dass Du halt jetzt die den Leuten sozusagen die Tools in die Hand gibt, es viel kreativer zu sein und irgendwie einfach mehr zu erzeugen, die vielleicht in erster Linie auch erst mal nur was cool Kreatives erzeugen wollen. Ich mein, vergleich's 'n bisschen mit irgendwie Musikindustrie so, ne, wo Du vorher die großen Labels hattest so und irgendwie, dass Du dass Du mal überhaupt eine Platte aufnehmen konntest, war ja super gekatet durch die paar Großen, die halt entschieden haben, was funktioniert und was funktioniert nicht so? Und heutzutage kann halt jeder in seinem Homestudio irgendwie selbst aufnehmen und irgendwie eigenen Kram rausbringen, was auf jeden Fall dem auch nicht geschadet hat. Und deswegen, ich glaub, es sind son bisschen vielleicht 2 gegenseitige Bestrebungen, ist die Frage, ja, es kann sein, dass das, was von den großen Studios kommt und so was gleichgeschalteter wird und dafür die Masse mehr wird und dann aber wiederum die Frage ist, wird es das Medium Kino dann überhaupt noch geben, ne? Weil ich mein, wenn Du so schnell und irgendwie testen willst und so, dann ist halt auch Kino nicht mehr das richtige die richtige Stage dafür so. Aber klar, wenn irgendwie alle Streaminganbieter werden und auch noch noch schneller generieren können, kann schon sein, dass auch gleichgeschalter wird, aber ich glaub, es gibt auch schon genug Raum für Kreativität. Also ich mach mal darum eigentlich nicht so viel Sorgen.
- Dennis
- Okay, Machen wir weiter mit OpenAI und der nächsten Generation an Modellen, die da sind und da können wir ein bisschen anknüpfen an die letzten AI News, denn nachdem Anthropic ja mit Fable und Methheus 2 neue Modelle rausgebracht haben, die der US Regierung dann auf einmal doch zu stark waren und sie dachten, nee, da möchten wir nur, dass das US Bürger*innen konsumieren und nutzen können, haben sie ja verboten oder Also ich glaub, sie haben ja gar nicht gesagt, dass es überall geblockt werden muss, aber Anthropage hat gesagt, wir sind nicht in der Lage, diese diese diese rechtlichen Bedingungen zu erfüllen, deswegen nehmen wir es komplett offline und da das Anthropage schon durchgespielt hat, konnte OpenAI praktisch vorher mit der US Regierung reden und sich schon verbieten lassen, die neuen Modelle auszurollen und trotzdem haben sie sie in einem Blogartikel vorgestellt. Also es gibt die GPT 5 Punkt 6 Reihe und dort gibt es 3 Modellvarianten, die sich Sol, Terra und Luna nennen und 100 Prozent muss ich ehrlich sagen, habe ich das Naming immer noch nicht verstanden, weil sie sagen so, ab jetzt ist es so, dass die Modellnummer irgendwie die die also die Modellgeneration beschreibt und dann diese 3 unterschiedlichen Tears von Soltera und Luna sind praktisch so die Capabilities, die dann da drin sind und sagen dann, dass sich aber jede für sich weiterentwickeln kann. Und dieses jede für sich weiterentwickeln, das ist irgendwie was, was ich nicht verstanden habe. Also wenn das jetzt irgendwie einfach die Abstufung ist zwischen, okay, es gibt, weiß ich nicht, vielleicht, obwohl Opos und Sonne waren wahrscheinlich 2 unterschiedlich trainierte Modelle und jetzt hast Du irgendwie ein Modell und davon kommen diese Abspaltungen. Kann 1 von euch aus anfangen mit? Ich will, wenn ich mit Zollterra
- Fabi
- und Duna B dieses genau aufteilen, nee.
- Dennis
- Okay, also zumindest, ja, Anyway. Es gibt 3 unterschiedliche Modelle und Zoll ist das Größte vor allem dem Ganzen und ich meine mehr außer auf Benchmarks hören kann man aber noch nicht, weil sie eben nicht öffentlich sind, wobei auf Terminal Bench GPT 5 Punkt 6 soll im Ultra Modus 91.9 Prozent erreicht, wo ein Cloud Mythheus 5 beispielsweise auf 88 und ein Cloud Fable 5 auf 84 Prozent sind. Also noch mal ein Sprung in dem Gentic Engineering Bereich, den wir dort haben. Genau und sie sind grundsätzlich äußern sie sehr arsche oder sehr direkte Kritik und sagen, das darf nicht der Standardweg zukünftig sein, dass die US Regierung bestimmt, wann solche Modelle irgendwie die Öffentlichkeit erreichen, aber am Ende bleibt unterm Strich, dass es aktuell erst mal nur für, ich glaub, einhundert US Unternehmen freigeschaltet wurde, die einen Preview praktisch jetzt darauf haben und dass die breite Öffentlichkeit und vor allen Dingen der internationale Markt aktuell noch warten muss, dieses sehr mächtige Modell zu bekommen. Ja. Denk mal.
- Fabi
- Ja, ist auf jeden Fall ja eine Entwicklung, die man jetzt schon bei Entropic gesehen hat. Da bin ich immer gespannt, wie's da irgendwie weitergeht. Weil ja in dem Zuge finde ich auch noch interessant, wenn ich das Thema irgendwie dranhängen willst, weil ich find, das gehört auch son bisschen zur Diskussion, ne, mit Entropic in China und den dem vermeintlichen Clauda. Vielleicht kannst Du da noch mal kurz
- Dennis
- dazu erzählen, Ja.
- Fabi
- Weil irgendwie gehört's für mich auch in dieses Potpourri von globaler AI Entwicklung und irgendwie den Entwicklungen, die es da mit auch so solchen Dingen passieren.
- Dennis
- Und Regierungen haben irgendwas mit dazu erwischt. Das stimmt, weil denn Antropic hat nämlich offiziell Alibaba beschuldigt und dort sich an US Behörden gewandt und gesagt, das darf nicht so sein und zwar haben sie festgestellt, dass Alibaba in sehr, sehr großem Stil mit Accounts, die nicht auf ortungsgemäßen Weg erstellt wurden. Viele, viele Millionen insgesamt glaub ich fast knapp 30000000 Anfragen auf die neuesten Modelle von Anthropic gemacht hat, und das nennt sich eben irgendwie Destillation Attack, praktisch aus einem großen Modell die Fähigkeiten rauszuziehen, ein kleineres Modell zu trainieren. Mir war das vorher gar nicht son Begriff, dass es dass es son Ding ist. Ich denke mal irgendwie Philipp, Du hast
- Philipp
- es irgendwie vorher auch schon
- Dennis
- mal gehört, weil's glaube ich nicht das 1. Mal war, dass man sich untereinander beschuldigt hat, dass ja da Daten abgezogen wurden. War doch bei DeepCie
- Fabi
- war das doch schon genau das gleiche Thema, oder? Weißt Du
- Philipp
- Ja, da war doch Fragen zu hören. Sogar in den News. Da war vor 'n paar Monaten der diesen Blogpost gemacht hat, doch 'n Unternehmen direkt gecallt out hat, sag ich mal, mit Mini Max und allen anderen auch. Also Ja, die
- Dennis
- Moun Shot Deepseg und Mini Max war damals, ja. Ja. Ja, genau. Also im Endeffekt ist ja auch nur,
- Fabi
- also im Endeffekt ist ja, sie sie sie nehmen halt Input und Output sozusagen als neues Trainingsset, ne. Ihr speichern ihren, ihre Anfrage, speichern den Output und bauen sich dadurch irgendwie 'n Trainingsset zusammen, so. So ist ja die die Schema ja gar nicht so ganz. Das haben seit 30000000 Datensätze.
- Dennis
- Ja, das ist richtig. Aber interessant auch irgendwie, dass es funktioniert, oder? Also so in meinem
- Philipp
- Also es ist 'n kein neues Konzept, das gab's schon vor LLMs, sag ich mal, hat sich 'n bisschen angepasst. Man sagt aber auch, dass dass andere wär, sag ich mal, sich jetzt von chinesischen Modellen inspirieren lassen. Und man macht das ja auch ganz oft mit seinen eigenen Modellen. Also ich geh stark davon aus, dass, ich weiß nicht, die nächste Generation von Sonet und Haiku und vielleicht den kleineren GPT Modellen, von den größeren GPT Modellen profitieren, also dass Du da dieses Destillation halt intern machst. Mhm. Ja.
- Fabi
- Und ey, ich weiß, könnte man ja auch drüber diskutieren, ist das sogar wirklich überhaupt etwas, was schlecht ist so, ne? Also warum sollte man das nicht dürfen? Ich mein, im Grunde genommen trainieren Sie Ihre Modelle auf offen verfügbaren Daten da draußen, die auch irgendwie jemand erzeugt hat. Im Grunde im Sinne ist es jetzt auch nur ein anderes Datensätze. Sie sind halt mit Ihrem NLM genauso eine Datenquelle wie alle anderen Daten im Netz auch so. Also ist jetzt nicht die rechtliche Brille draufgelegt sozusagen, aber eigentlich, wenn ich jetzt erst mal nur meine Brille der der Interpretation drauf setzen würde, würde ich mich fragen, ja, ich kann verstehen, dass Sie's kacke finden, weil natürlich superviel Geld da im Spiel ist, aber andererseits ist ja das auch genau der Weg, wie Sie Ihre Modelle füttern. Also warum soll ich nicht ein besseres LLM auch als Quelle nehmen können und und es als Trainingsdaten für meinen LLM benutzen können?
- Philipp
- Ich glaub, da hast Du schon noch mal 'n Unterschied zwischen, ich nehm Code von, keine Ahnung, vom Internet und mach Pre Training darauf oder ich hab schon 'n Modell, was hat, extrem guten Mathe ist und lass das irgendwelche und Zeug generieren und trainier dann darauf. Aber ja, ist 'n schwieriges Thema. Aber
- Dennis
- ja, ja, da muss jetzt, ne, das da muss er halt dann unterscheiden, wie die initialen Quellen irgendwie entstanden sind, ne, also ob das praktisch kommerzielle Arbeit war so, die da reingesteckt wurde und dann veröffentlicht wurde. Das ist ja vielleicht son bisschen der Unterschied.
- Fabi
- Dass es kommerzielle Arbeit war, das Modell zu erzeugen oder was meinst Du?
- Dennis
- Ja. Im Gegensatz zu halt, wenn's irgendwie draußen sind und Open Source Modelle.
- Philipp
- Ja, aber ich glaube, ich mein, das da gibt's ja auch wieder Streitthemen, was dann Ja. Ausm Web wirklich denn, also ich mein
- Fabi
- Genau, also weil weil es haben sich wirklich beim Trainieren auch genau daran gehalten, darüber gab's ja viel Diskussion auch darüber, ne? Also Ja,
- Dennis
- ja, absolut. Ja.
- Fabi
- Aber ich glaub, im Endeffekt ist ja so, ich mein rechtlich ist ist wiederum, kann man sie Also das eine ist moralische und das andere ist rechtlich und ich mein, so oder so die Frage, was hat ein Tropic von der Hand habe, dass chinesische Modellhersteller das Ganze tun so, außer dass sie's technisch unterbinden, probieren's unterbinden. Rechtlich werden sie wahrscheinlich nicht so weit kommen.
- Dennis
- Das ist richtig.
- Fabi
- Das heißt, die müssen sich nicht alleine ironisch,
- Dennis
- dass sie auf der einen Seite die Peitsche der US Regierung spüren und dann aber jetzt auf der anderen Seite batteln Unterstützung, dass die Regierung da mal mithelfen soll, dass die Chinesen das nicht abgrasen.
- Philipp
- Glaubt ihr, dass das, also ist ja 'n sehr populäres Thema, glaubt ihr, dass das zusammenhängt mit, dass Dario ganz viel immer gesagt hat, hey, das wird alles zu gefährlich, hey, wir können das nicht releasen. Und dann irgendeiner wirklich mal gesagt hat bei Herrn Band der Regierung, ey, wenn er das die ganze Zeit sagt, vielleicht sollten wir da wirklich mal hinschauen oder uns mal wirklich Gedanken machen. Und dann halt unabsichtlich sozusagen das jetzt erzeugt hat.
- Fabi
- Also sagen wir's mal so, hätte er das Ganze, also hätte er es nicht so gemacht, würde ich auch tippen, wär's wahrscheinlich nicht so gelaufen so, ja. Das käme mir schon auch vor.
- Dennis
- Also, es ist furchtbar, wenn's so wäre, ne. Ich ich ich geh da irgendwie auch mit, aber es ist ja trotzdem irgendwo traurig. Wenn wenn eine US Regierung, die ja irgendwo auch eine Abwägung hat, was hat das für einen Einfluss? Was sind die, ne, was sind die Capebilities und sowas, die müssen ja irgendwie sich da Gedanken drüber machen und
- Fabi
- Ach so, meinst Du, ist die Sicht dann drauf so, dass sie nicht selbst aufgefallen wär.
- Dennis
- Ja, ja, genau, das ist halt nicht irgendwo, wenn das Model released wird und die dann denken, oh, guck mal, das sollten wir uns angucken, sondern dass 1 vorher sagen muss, oh, das ist jetzt gefährlich. Oder dann auch überreagieren, wenn es nur die Ansage war, so, ne. Also Ja. Sagen wir mal
- Fabi
- so, ich würde es wundern, wenn's ab jetzt nicht so oder so dann immer gemacht wird bei jedem Modell Release, dass sich das genauer angeschaut wird und abgewogen würde. Ich glaub, jetzt ist einmal der Damm gebrochen, von daher wird's jetzt in Zukunft mehr Thema werden.
- Philipp
- Das kannst Du
- Fabi
- wird nur aktive Diskussion sagen.
- Philipp
- Ich glaub, das kannst Du nicht machen. Also das wird logistisch nicht funktionieren. Und ich glaub, das möchte die US Regierung auch nicht, weil ich weiß nicht, Faible war vor 2 Wochen jetzt dann bald, ne. Das heißt, wenn Du zwischen jedem Model Release 4 bis 6 Wochen hast, irgendwelche Genehmigungen zu holen und aktuell gibt's da 2 Modelle, die da irgendwie infrage kommen. Was ist, wenn die nächsten Germanine Modelle, die nächsten Modelle von XAI, die nächsten Modelle von CursOR oder halt mit dazukommen? Dann hast Du halt irgendwie Also dann verlangsamst Du das ganze Thema halt extrem. Und ich glaub auch nicht, dass die US Regierung möchte, dass chinesische Open Source Modelle dann nicht verlangsamt werden und weitermachen. Also irgendwo Aber braucht dann einen gewissen Marktdruck, weil der, ich weiß nicht, oder Mythos irgendwie, keine Ahnung, 3000000000 zum Trainieren gekostet hat und die das nicht nutzen können, neue Daten zu sammeln, ihre Modelle zu verbessern, seinen Kunden zu verkaufen. Das das wirst Du nicht, das kannst Du nicht halten.
- Fabi
- Ja, also aus der Brille versteh ich auf jeden Fall den Argumentation komplett, aber andererseits, wenn Du die andere Brille aufsetzt, so, wenn jetzt erst mal einmal die Regierung irgendwie so nah dran ist, dass sie schon angefangen haben, so einem Modell Release zu verbieten, kann ich mir auch nicht vorstellen, dass sie jetzt dann wieder so stark zurück ist, dass sie dann ab, 8 wieder einfach, was ihr wollt. Halten uns wieder komplett zurück. Also ich glaube, dass am Ende jetzt, es gibt einen neuen Akteur in diesem Spiel und jetzt ist nur die Frage, wie limitierend ist er oder wie genau bindet er sich ein? Aber ich denke schon, dass in diesem Releaseprozess jetzt Regierung als ein als ein stärkerer Stakeholder, als er schon war, war, irgendwie mit drin ist und irgendwie da mitreden wird so. Aber ich geborene dir recht, wenn wir am Ende daran landen, dass irgendwie 'n sechswöchigen Prozess braucht, erst mal überhaupt die Genehmigung der Regierung zu bekommen, dann wird es einen sehr negativen Einfluss haben und das kann auch nicht im Interesse der Regierung sein, so. Andererseits, wenn die Gefahren, die die da im Raum stehen und selbst promotet, dann wirklich so groß sind, dann kann es auch möglicherweise, halte ich's nicht für 'n komplett unrealistisches Szenario, dass das Ganze dann auch so passiert, so, ne. Und aber kann natürlich sein, wenn am Ende dann China irgendwie vorne wegrennt, dass das auch noch mal 'n weiterer Impuls dafür ist, dass es sich dann wieder dreht. Aber also was ich eigentlich feststellen will, so, es ist 'n weiterer Player im Markt und ich bin sehr gespannt, wie sich's irgendwie in die oder in dem in dem Spiel. Ich bin sehr gespannt, wie's sich dann, wie's sich's ausgeht so. Aber dass er sich komplett wieder zurückzieht, das kann ich mir nicht vorstellen.
- Dennis
- Trump war jetzt aber nicht so wahnsinnig involviert, oder? Das war jetzt nicht sone One Man Aktion, dass er gesagt hat, hey, lass es mal. Also ich hab zumindest im Grunde irgendwie nicht viel gelesen. Weil dann wär die Wahrscheinlichkeit, dass er auch wieder egal ist zu machen, nicht so gering.
- Fabi
- Das ist schwierig. Ich glaube, das war's jetzt nicht. Also, es ist jetzt
- Dennis
- nicht, hat's sich nicht hingestellt gesagt, so, ich hab's Also,
- Fabi
- was was ich ja gelesen habe, gerade bei dem Fabeling war's sogar irgendwie, irgendwie, dass der der Amthor CEO irgendwie ja bei der US Region, der son bisschen mit dafür, also irgendwie sich sehr negativ darüber geäußert hat oder dass man die US Regierung zu gebracht hat, diese strengeren Regeln zu zu erlassen so. Also deswegen, das stimmt jetzt nicht, als hätte er da,
- Dennis
- als wär das jetzt ein
- Fabi
- ein Gedanke von Trump gewesen kann. Es passt ja auch nicht wirklich zu Trump, oder?
- Dennis
- Also na ja, also die Aussage, das darf keiner aus sein. US Bürger, der einen einen US amerikanischen Ausweis hat Ja,
- Fabi
- stimmt, das wiederum schon, das fasst grundsätzlich schon. Schon,
- Dennis
- ja. Passt erst mal sehr. Okay, GLM 5 Punkt 2 oder GLM, weiß ich nicht genau. Was ist das? Bei der Wiesnse?
- Philipp
- Das ist ein neues Open Waits Modell mit 1 MIT License, was letzte Woche in den Social Channels sehr gehypt wurde. Als Modell war's so gut ist, ungefähr wie Opus 4 Punkt 8 im Coating Bereich, was sich jetzt auch 'n bisschen bestätigt hat, sag ich mal, von den und von dem Sentiment. Und wer GLM noch nie gehört habt, das ist eine Modell Family von ZAI. Wer ZAI noch nie gehört hat, ZAI ist 'n chinesisches Start-up oder eine AI, ey Company aus China, welche 2019 aus der Beijing Chingua University,
- Dennis
- ich hoff, das
- Philipp
- war irgendwie ein Ersatz, was so richtig gegründet wurde. Und genau, die trainieren Open Wait Modelle und sind auch am achten Januar public gegangen in China mit 1 Evaluierung über 6600000000 US Dollar. Und GLM ist ja, das, wie soll ich sagen, das zweitbeste Recodingmodell auf verschiedenen Arena Benchmarks. Es ist MIT licenseed, hat 753000000000 Parameter, ist 'n MUI, 1000000 Token Kontextwindo, hat 'n sehr coolen Report oder Research Report mit veröffentlicht, wie Sie's trainiert haben und worum es geht. Es ist in mittlerweile allen möglich gängigen Coding Agents verfügbar. Also man hat's auf Open Router. Es ist auf hier, sag ich mal, Influencer Plattformen von Firefox zu. Sie haben auch eigene Pläne, die mit verschiedenen funktionieren. Das heißt, Du kaufst per ZDA son Coding Agent Plan und dann kannst Du das nutzen in wie wie in existierende. Und da gibt's erst wieder viel positive drüber, weil so gut wie Opus 4 Punkt 8 anscheinend, aber nur 4 Euro 40 pro Million. Das heißt, das ist fünfmal günstiger, wenn ich mir jetzt nicht alles toll ist. Also meine genommen, Opus kostet 25 Dollar, die Tokens ohne Subscriptions. Ich glaub, das war so auf jeden Fall sehr günstig und sehr beliebt. Und wenn ihr irgendwie nutzt, Cursor, Pi, wie auch immer, das kann man das alles sehr easy integrieren und nutzen.
- Dennis
- Spannend. Weißt Du, wie groß es ist im Sinne von wie viel ein, also ist es irgendwie möglich. Gibt's da irgendwelche Destillate, die auch lokal laufen oder ist es schon
- Fabi
- so, dass Du Cloud Power brauchst,
- Dennis
- das Ganze laufzulassen? Ah.
- Fabi
- Ich hätte mir gestern nur kurz kurz, den ist der Lars bei uns zur Firma hat sich 'n Mac mini aufgesetzt, für son lokalen Agent. Und da hat auch kurz geschaut, ob er das drauf laufen kann. Also zu meinem für 'n Mac mini reicht's nicht aus. Die Auswahl ist Einzige. Okay.
- Philipp
- Ja, also Du brauchst schon, es ist es gibt sehr viel schon von der Community Effords, die halt versuchen, das Modell zu verbessern. Du hast jetzt auch irgendwie Datablicks, die ist mit fast 400 Tokens die Sekunde hostet, was extrem viel ist, aber alles halt auf NVIDIA GTUs. Und es gibt auch, könnte ich City Varianten, aber Du brauchst halt mindestens, sage ich mal, 'n Stack, h 200 GPUs, sage ich mal, dass das irgendwie Sinn macht. Ja.
- Fabi
- Mhm.
- Dennis
- Aber es
- Philipp
- ist sehr cool, sehr günstig. Das heißt, wenn ihr irgendwie, ich weiß nicht, wenn ihr Codex Nutzer seid, könnt ihr über Open Code über Open Router das mal insite Codecs testen oder ja. Ich hab's noch nicht gemacht, aber ich hab sehr viel Positives gesehen.
- Dennis
- Okay, spannend. Vielleicht noch nur, damit man's gehört hat, ohne jetzt groß auf Einzugehen, weil wir grade über Chips und NVIDIA und tatsächlich 100 redeten, gab's letzte Woche auch noch die News, dass OpenAI dort auch ins Hardware Business praktisch einsteigt und zwar mit Broadcom zusammen Jalapeno veröffentlicht hat, was OpenAIs erster Hardware Chip ist für Inference und ja einen, ich weiß nicht ob das Bruchteil oder auf jeden Fall deutlich besser Performance pro Watt rausbringen soll als als vergleichbare State of the Art Chips und ich glaub, irgendwann Ende des Jahres oder so soll das sein. Das nur in Kürze dazu.
- Philipp
- Aber es ist ja nicht bekannt, ob man das irgendwie sieht. Du wirst vielleicht im Hintergrund die Chips nutzen, wenn Du mehrere Modelle, oder?
- Dennis
- Ja, genau. Aber wir hatten jetzt halt schon häufiger oder wir sind auch hier einen Slack und Thread, wo es so die Kosten ging und die Zukunft und ich ja immer eher argumentiere, ich kann mir nicht vorstellen, dass so für den Use Case, wie wir jetzt aktuell entwickeln und klar, wenn wir jetzt irgendwie zehnmal so viel entwickeln am Tag, dann dann wird
- Philipp
- das vielleicht auch zehnmal so
- Dennis
- viel kosten, aber dass die Kosten so viel stärker explodieren. Ja, die Abo Modelle sind im Moment subventioniert im Vergleich zu den zu Tokenpreisen natürlich, aber gerade solche Sachen, wo man dann sieht, die Chips werden deutlich effizienter und ne, lassen das deutlich schneller laufen. Die lokalen, die Open Modelle sind da, es wird alles schneller. Also ich ich sehe halt nicht so den Weg, dass es so exorbitant teuer wird, dass man darüber nachdenken muss, ob's jetzt sinnvoll ist, einzusetzen oder nicht. Und das ist ja alles ja auch Gab's ja auch übrigens
- Fabi
- diese diese Annoncement von DeepSeak, dieses Deep Spark, die irgendwie die inference 85 Prozent schneller machen sollte, so, was wahrscheinlich auch dann wiederum Kosten Input ist, weil sie ja irgendwie nach Wahrscheinlichkeit irgendwie vor berichten, welcher Pfad der Next Tokenchain irgendwie der wahrscheinlichste ist. Also genau hab ich mir jetzt den Algorithmus nicht angeschaut. Ich werd nicht Philipp, ob Du's ob Du's dir angeschaut hast, dieses die Spark Ding, aber das ist ja auch, na ja, es gibt ja einige Entwicklungen in die Richtung, ne, dass es uns das Gleiche irgendwie in Zukunft kostengünstiger machen. Und auch große Modelle versus irgendwelche Hardware und Optimierungen im Algorithmus, dass es günstiger wird.
- Dennis
- Hat mir auch irgendwann in den danach nichts mehr von gehört, aber die die praktisch diese LLMs auf den Chip gebrannt haben und da ja auch so wahnsinnige Geschwindigkeiten erreicht haben. Yes. Ja, gut, dass wir fragen,
- Fabi
- wie schnell die werden, ne. Von daher braucht er immer eine Weile am besten neue Modell draußen. Ist immer spezifisch für das Modell, die Architektur, ne.
- Dennis
- Ja. Ja, ja, klar. Aber ich denk auch, das
- Fabi
- wird auch irgendwo in Zukunft eine Dattensberechtigung haben und irgendwie stärker sein, dass vielleicht die neuesten Modelle die ersten 3 Wochen teurer sind, bis die Hardware dafür gescale ist. Aber die Frage ist, wie schnell geht's was?
- Dennis
- Ja, aber also für mich bin ich, sind wir da halt überall nicht so weit weg. Also wenn Du jetzt halt einen Opus 4 8 für super günstig haben könntest so, ne, damit kannst Du ja schon wahnsinnig viel abdecken. Ja. Ja, auf jeden Fall ist so
- Fabi
- die Frage bei den Usecakes, die wir haben grad, was Coating angeht, werden
- Dennis
- wir irgendwann an
- Fabi
- der Schwelle sein, wo wo man sagen kann, 95 Prozent der Arbeit können wir einfach auch mit ein Jahr alten Modellen möglicherweise machen und müssen nicht sein, den besten Benefit davon zu haben. Und ich denk, irgendwann wird sie's wahrscheinlich da so, dass es halt 'n paar Modelle gibt, die einfach klar sind so, dass sie erst mal fürs nächste Jahr supportet sind so, weil die Use Case einfach da ist.
- Philipp
- Ja, wollt ihr nicht 2 Euro ausgeben, den Button von grün auf blau zu machen?
- Fabi
- Doch, im Moment möchte ich das
- Dennis
- ja gerne aus Problem mit. Das wär gut. Computer Use. Das verbaute Europa 'n paar Token.
- Philipp
- Ja, aber es ist sehr cool. Also Computer Use ist ja nichts Neues und auch in German High ist Computer Use nichts Neues. Aber wir haben letzte Woche das Computer Use Tool für Germany 3 Punkt 5 vorgestellt und Computer Use beinhaltet ja mehr als nur irgendwie den Computer. Und was jetzt ganz neu ist, ist, man kann eine definieren. Das heißt, ich kann sagen, hey, Germany kontrolliert den Browser oder Germany kontrolliert 'n Computer oder Germany kontrolliert ein Telefon. Und der große Unterschied zwischen den verschiedenen Environments ist dann, dass Du verschiedene Tools bereit hast. Das heißt, Du aktivierst das Computer Use Tool und je nachdem, was für ein Environment Du hast, hat dann Gemini verschiedene Tools, dass es aufrufen kann, also irgendwie Klick oder Track und diese Dinge. Und zwischen 'nem Computer bedienen und 'nem Smartphone bedienen existieren ja Unterschiede, weil in 'nem Smartphone ja alles mehr oder weniger touch and Track ist, mehr oder weniger. Das heißt, da gibt's nicht viel und ich hab vielleicht klar noch 'n Input und 'n Type und sonst was. Und genau, das heißt, man kann jetzt supereasy mit Gemini und 'nem Tool eine Art Android Controller mehr oder weniger bauen. Ich hab da auch relativ, ja, 2 Stunden alles für mich gedauert, son Emulator mit, also Android Emulator und ein kleines Python Skript, wo Germanai dann diesen Emulator kontrollieren kann und wirklich man halt gibt eine Promptyiten zu tun, okay, geh mal bitte auf die und die Seite oder öffne die und die App und teste dann den und der Flow und dann macht Germany das alles automatisiert und dann kann man wieder das Ergebnis halt anschauen. Und was besonders cool daran ist, ist zu halten es zu, sag ich mal, Android und iOS, ist, dass man hier einfach bei Android eine Ubuntu Maschine starten kann und dann eine Android Emulator ausführen und man hat dann diesen Display. Das heißt, es ist relativ easy, aufzusetzen und zum Testen und funktioniert aber auch für iOS. Also es ist nicht nur 'n Android Computer Use Tool, sag ich mal, sondern funktioniert auch mit mit iOS Apps. Und wenn ihr irgendwas, sag ich mal, im mobilen Bereich macht, gerne mal reinschauen und testen, weil es Ich glaub, Codex hat so was mit iOS Development 'n bisschen, aber definitiv sehr cool zum Anschauen, auf der Wege.
- Dennis
- Gut. Wenn ich auf die Themenliste gucke, haben wir, glaub ich, alles. Fällt euch noch irgendwas spontan ein, was ihr nachschießen wollt? Jetzt glaub, heute haben
- Fabi
- wir schon viele Themen gemacht, oder? Sehr gut.
- Philipp
- Ja, Dennis hatte mal wieder viele Fragen.
- Fabi
- Kommt immer mit Überraschungsthemen. Es ist ja, es ist eine EinheitAI News und andererseits auch Dennis Fragestunde. Also ist die Frage für die
- Philipp
- Frage Nee, ich ich
- Dennis
- ich versetz mich einfach in die Lage unserer Hörer*innen und versuche möglichst viel für sie rauszuholen.
- Philipp
- Ich glaub, das ist so, okay, Dennis muss Kosten sparen bei Er kann keinen externen Berater mehr beauftragen. Ich frage einfach Philipp.
- Dennis
- Ja. Wenn ihr Fragen habt, schreibt uns gerne an Podcast, der Programmierpunkt war. Ich leite die gerne an Fälle weiter oder wir besprechen sie hier in der nächsten Folge. Und sonst habt ihr die Hitzewelle überstanden? Was ist San Francisco? Geht wahrscheinlich, oder? Was ist wie ist das Wetter?
- Philipp
- Kalt.
- Dennis
- Kalt.
- Philipp
- Ja. Kalt? 19 Grad. Gestern Nacht waren's 14 Grad.
- Dennis
- Das ist ja unangenehm.
- Philipp
- Ich kenn nur noch 33 Grad im Schlafzimmer bei 4 Uhr 8, also
- Dennis
- Das ist sehr gut. Das ist ja jetzt im letzten Jahr besser aufgehoben. Ja. Macht's gut, vielen Dank und bis zum nächsten
- Fabi
- Mal. Tschüs. Tschau, macht's gut.