News AI 47/25 –
Gemini 3.0 Pro // WeatherNext 2 // Attacken mit Agents
20.11.2025
- // Podcast
- // News AI 47/25
Shownotes
Die neue Gemini-Familie wurde veröffentlicht: Gemini 3.0 hält Einzug in viele Google-Produkte und ist direkt zur Nutzung bereit. Philipp erzählt von seinen eigenen Eindrücken, die er bereits über die letzten Wochen sammeln konnte. Ein weiteres Tool im Zuge der Veröffentlichung ist Antigravity zur agentenzentrierten Entwicklung.
Auch von Google kommt ein neues Wetter-Modell: WeatherNext 2, das die Wettervorhersagen-Berechnung auf die Technologie generativer KI hievt. Dennis versucht die Entwicklung einzuordnen und der Bereich Wetter ist spannend, aber auch sehr kompliziert.
Anthropic hat einen Blog-Beitrag veröffentlicht über eine der ersten dokumentierten Attacken, die auch von Agents ausgeführt wurden, um zur Spionage genutzt zu werden.
/transkript/programmierbar/news-ai-47-25-gemini-3-0-pro-weathernext-2-attacken-mit-agents
- Dennis
- Hallo und herzlich willkommen zu 1 neuen AI News der Programmierer. Wir befinden uns in Kalenderwoche 47. Ich bin Dennis Becker und heute zusammen im Studium sind
- Fabi
- Fabi Finckerlow und der? Philipp.
- Dennis
- Und heute sind wir vielleicht noch 'n bisschen verzögerter als sonst. Philipp ist ja schon häufiger mal remote zugeschaltet gewesen von irgendwo auf der Welt, aber tatsächlich befinden sich auch Fabi und ich heute nicht dort, wo wir normalerweise sitzen. Hoffen, dass es von der Soundqualität trotzdem am Ende alles passt und wir uns nicht zu oft ins Wort fallen. Wenn wir über die folgenden 3 Themen sprechen, es gibt nämlich heute das große Update, Google hat was Neues rausgebracht und zwar Gemini 3 und damit auch einiges anderes an Features und Produkten, die außen rum so ein bisschen mit released wurden. Wart Philip Putz, uns das zu erzählen, dann gibt es auch aus dem Google Kosmos, also zum Wetter ein neues generatives Modell, was ich mir 'n bisschen angeguckt hab, fand ich sehr spannend fand. Und dann gibt's noch ein Security Incident, den En Troopic aufgedeckt hat und da ist dann Fabi, der ihn wieder uns darüber berichten wird. Aber Philipp, starten wir erst mal mit dem großen oder vielleicht auch erst mal der Frage, ist es ein großes Update, aber zumindest mal Germanay 3 releast worden?
- Philipp
- Ja, also ich bin super. Ich mein, ich kann ja jetzt sagen, dass ich schon 'n bisschen das Modell testen konnte über die letzten Wochen und auch son bisschen dabei war, wenn wir das sozusagen mit anderen Unternehmen vorgestellt haben oder halt auch bisschen Feedback gesammelt. Und für mich ist Gemini 3 Pro Preview, also es gibt 'n neues Pro Modell, 'n Riesenfortschritt. Also ich mein, dadurch, dass ich halt bei Google arbeite, hab ich natürlich 2 Punkt 5 exzessiv genutzt, sag ich mal, tagtäglich in AI Studio, in irgendwelchen IDIs oder sonst wo. Und 3 ist in jeder Hinsicht besser. Also wirklich von irgendwie Knowledge, also gerade irgendwie so, wenn man halt irgendwelche Dinge fragt zu Video- und Bilderverständnis, zu Coding, zu irgendwie mit Tool Use, zu allem, was man eigentlich machen kann. Und es gibt auf jeden Fall auch sonen coolen, sag ich mal, Keyword Blogpost, der alle Neuerungen son bisschen zusammenfasst. Und Teil davon ist auch son, sone Tabelle mit den Benchmark Updates. Und das das Krasse für mich war halt, also ich hab natürlich auch nicht alles gewusst im Vorfeld, aber es ist wirklich auf jedem Benchmark besser als 2 Punkt 5 Pro. Und nicht nur irgendwie so ein, 2 Prozent, sondern im Schnitt wirklich zwischen 5 und sogar 60 Prozent für manche Benchmarks, was auf jeden Fall nicht nur 'n kleiner Schritt ist, sag ich mal, sondern echt 'n Riesenschritt. Und 2 Punkt 5 pro wurde ja zuallererst im März vorgestellt, also jetzt 8 Monate dann her. Und es ist für mich immer noch verrückt, wie viel Fortschritt wir doch in den letzten 8 Monaten irgendwie gemacht haben. Genau, Modell, überall verfügbar. Also klar, EU ist 'n bisschen schwieriger, ich weiß nicht ganz genau wo, aber an sich sollte es in der Gemini App sein, In AI Mode, in AI Studio auf jeden Fall, da könnt ihr's definitiv testen. In, da kommen wir gleich dazu in der Gemini. Ja, ich mein, in jeder App eigentlich, wo Gemini bisher war. Android weiß ich noch nicht genau, ob's da auch schon dabei ist, aber auf jeden Fall in in den großen Apps, sag ich's meist, ist es verfügbar. Und dann, ich hab ja schon ganz kurz erwähnt, erwähnt. Es gab ja vor 'n paar Monaten ja, den oder ich weiß nicht, wie man's beschreiben soll, aber 'n Großteil des Teams ist ja Google beigetreten. Und ist sozusagen deren erster Release. Es ist eine neue Coding Plattform oder Plattform, son bisschen ähnlich wie Windsurf oder Cursur. Neu verfügbar, einfach auf antiquarity dot Google gehen, ist aktuell verfügbar auf Mac, Windows und auch Linux, sogar Intel Macs. Man kann's sich kostenlos anmelden. Es gibt eine kostenlose Preview mit Zugang zu Gemini 3 Pro. Kann sein, dass es 'n bisschen dauert, weil sehr viele sich anmeldet und das Ziel einfach hinter und bisschen diesen neuen Ansatz von Softwarearchitektur. Also im Sinne von, ich schreib nicht mehr mehr Software, sondern ich beschreibe das mehr oder weniger und lass halt sonen Implementierungsplan erstellen. Und dann hab ich immer noch eine einen Editor, wo ich die ganzen Dinge revieren kann und anschauen kann. Also ich hab sone Art Inbox, wo ich verschiedene Agens Aufgaben geben kann, die dann anfangen, irgendwelche Dinge zu tun. Man hat 'n nativen Browser integriert in die IDE zum Beispiel und kann dann sagen, hey, bitte schau, dass der Button, keine Ahnung, mittig ist oder irgendwie so was. Und dann geht der Agent los, macht das. Aber an der gleichen Zeit kann ich halt weitere starten oder auch selber einfach im Code bisschen die Dinge tun.
- Fabi
- Und weißt Du, ist ist das auch wieder 'n Fork von VS Codes, sondern von der UI. Sieht's erst mal so aus, beziehungsweise? Ja, ja.
- Philipp
- Also ich weiß nicht, ob's irgendwo beschrieben wird, aber es ist also ist halt VS Code von, wie es aussieht, was es nutzt auf Marketplace. Aber ich glaub eher nicht VS Code Fork, sondern eher codium heißt es, Open Source Part, sag ich mal. Aktuell Ja. Ja. Ich
- Dennis
- hab irgendwo gelesen oder auf auf extra oder zumindest 'n Kommentar, dass glaub ich irgendwelche Codeschnipsel waren auch da, die auch stark darauf schließen ließen, dass es von Windsurf mehr oder weniger gefockt ist direkt, also noch nicht mal praktisch
- Philipp
- nur Ja, damals.
- Dennis
- Wie's Coating, ja.
- Philipp
- Damals hat Google sich die Lizenzrechte für die Windsurf IP gesichert. Und dann denk ich, macht's ja auch irgendwie Sinn, dass ich halt von dort aus weiterbau.
- Fabi
- Ich hab mich nur gefragt, ist son bisschen noch mal so das von Inter Gravity, also so mit diesem mit dem Plan, ihren Plan schreiben lassen und so weiter. Ich sag, ich hab mich einfach 'n Keyword erinnert von Amazon, so, wo wir auch schon 'n bisschen belächelt haben, so ist das so der richtige Ansatz irgendwie, irgendwie, auch schon 'n bisschen belächelt haben, so ist das so der richtige Ansatz irgendwie, dann Code später zu schreiben so. Ist und dabei da jetzt meinst Du grad noch son bisschen so Agent Orchestration oder so? Da also hast Du das Gefühl, es gibt so ein Key Herausstellungsmerkmal bei der Browsersituation, hab ich kurz gedacht, kann Google das vielleicht besser machen als der Simple Browser, den ich mir jetzt Code hab
- Dennis
- so?
- Philipp
- Also ich nutz das schon länger. Wir haben eine interne Version, die ich, sag ich mal, nutz für mein Daily Coding mehr oder weniger alles, was son im Google Horizont ist. Und Du hast halt diesen Manager, das ist 'n komplett eigenständiges, separates Windows, wo Du eine normale Chatinter Box hast, wo Du auswählen kannst zwischen 2 Modis, zwischen planning und halt normal. Kannst die Modelle wählen, aktuell GML 3 und gibt's und sogar das GP2GPT0S. Und hast Du wie sone Art, ganz normal wie 'n Curser auch an der Seite, wo man halt den Agent hat oder den neuen Agent Editor, wo ich sagen kann, hey, bitte implementier irgendwie was. Das ist nicht so, dass Du dann jetzt generierst, sondern jeder dieser Agents oder Tasks hat halt mehr sone Art Plan, den kannst Du anschauen in sonem Art Editor. Kannst dann natürlich iterieren mit Textinputs, ob das irgendwie für dich Sinn macht oder nicht und dann geht er durch den Plan durch. Ist relativ ähnlich zu all dem, was wir haben. Das einzige Neue ist, würd ich sagen, Du hast halt diese Inbox und kannst in 1 Inbox auch in verschiedenen Workspaces arbeiten. Also eine Workspace ist wie 'n VS Code, der Workspace, der ist halt ein oder mehrere Repositories und Du hast halt einen Inbox Manager, der parallel in verschiedene Workspaces arbeiten kann. Und pro Workspace kannst Du dann auch in den Editor reingehen, musst Du es aber nicht.
- Dennis
- Ja, ich hab's tatsächlich auch mal nur kurz seit ihr. Ist ja noch nicht so lange für uns alle verfügbar, bisschen eingespielt und würde auch sagen, also wahrscheinlich viele der Funktionalitäten findet man teilweise in anderen, aber irgendwie erst mal aufn ersten Blick hat mir ganz gut gefallen, wie's mittlerweile integriert ist. Also dass man noch mal stärker einfach diesen Fokus darauf setzt. Und Du kannst auch in sonem Modus praktisch dem Agenten folgen, dass Du halt immer siehst, wo er jetzt grade ist. Und es kombiniert halt supereasy, diese ganzen, ne, Tools von Terminal ausführen und Browser und sich Sachen scrapen und so. Also da ist er sehr schnell überall unterwegs und nutzt verschiedenste Tools, die Du eigentlich so letztendlich auch verfügbar hast, halt so integriert in einem Ding. Der individuelle Eindruck von 1 Stunde Nutzung war irgendwie ganz cool, glaube ich Ja,
- Philipp
- ich glaub, man kann's schon am ersten mit Cursure vergleichen, oder halt mit Windsurf an sich oder halt, ich weiß nicht, was da jetzt anbietet. Also es ist nicht dieses, was wir jetzt ja in i-Studio, in i-Studio haben. Es ist auch jetzt nicht so krass dieses, was irgendwie ist, aber halt auch nicht irgendwie. Ja, ich weiß, dass es sehr, sehr verwirrend ist, dass Google plötzlich 4 Coding Produkte hat mit Jules, Gemini Sealy, Air Studio und jetzt Anti Querity. Ich glaub, da arbeitet man selber bei uns intern noch 'n bisschen, okay, wann macht wars irgendwie Sinn? Aber ich mein, jeder hat irgendwelche Präferenzen. Und wenn ich 'n Entwickler bin, der doch sehr gern in 'ner IDI unterwegs bin, der bevorzugt, wenn er irgendwie Servercode schreibt, aber trotzdem gern irgendwelche, sag ich mal, nutzt, Dinge zu tun, dann ist Antiquarity schon definitiv cool, mal auszuprobieren. Und vor allem, wenn ihr halt irgendwie Cursonutzer seid, aktuell kostenlos zum Testen. Zugang zum neuen Champions League Modell kostenlos, keine Ahnung, wie lang oder wie hoch die sind. Ich denk, es kommt stark ganz stark darauf an, wie viele Nutzer gleichzeitig es am Nutzen sind. Aber wenn man irgendwie in Europa ist und morgens irgendwie, hat man vielleicht bessere Chancen als zur nachmittags, wenn die USA dann aufwacht. Ja, auf jeden Fall cool. Und ich mein, ich bin 'n Riesenfan von dem Team. Und generell, ich geborene da auch sehr coole Youtube Videos, die son bisschen die Features zeigen, ja.
- Fabi
- Okay. Und sag mal zu Germany 3, weil Du jetzt auch meintest, Du hast jetzt schon 'n paar Wochen könntest Du's irgendwie benutzen und klar, die Benchmarks sind ja irgendwie super impressics. So grad passt irgendwie auch die, wie dieser Benchmark, generell son bisschen visuelle zu lösen, also eher so der visuelle Benchmark oder 1 der visuellen Benchmarks. So meine Frage ist, hast Du irgendwas so in deinem persönlichen Use Case, wo Du das kühl hast, so krass, das könnte Germany 3 jetzt, was ich vorher nicht so hinbekommen hab oder irgendwie schwierig? Also hast Du so was so persönliche Erfahrungen, wo Du wo Du überrascht warst?
- Philipp
- Ich mein, ich nutze es für wirklich alles alles jetzt und es ist halt für alles viel, also es oftmals besser und man muss oftmals weniger iterieren oder Dinge neu formulieren und noch mal machen. Also wenn Du am Anfang irgendwie, keine Ahnung, zum Textschreiben, zum Erstellen, zum sonst was irgendwie halt 3, 4 Iterationen gebraucht hast, brauchst Du vielleicht jetzt 2, 3 weniger oder so was. Also ist relativ gut. Und vor allem, wo ich's 'n bisschen getestet hab, aber kann ich jetzt noch nicht genau sagen, ist, 'n Video Understanding. Also gerade, wenn Du 'n Youtube Link reinpackst und dann irgendwie sagst, dass er irgendwas mit dem Content von dem Video machen soll oder noch genauer irgendwelche Timestamps oder so was, da merk ich's halt vor allem. Und ich mein, das ist bisschen auch widergespiegelt in dem Benchmark Screen Point heißt der, glaub ich. Was, wenn Du 'n Bild reingibst von irgend 'ner UY, von irgend 'nem Screenshot, sag ich mal, von 'nem Screen, dann ist es richtig, richtig gut geworden, Dinge zu verstehen. Also was halt superhilfreich ist natürlich auch für Coding, wenn Du irgendwie sagst, hey, beweg das von hier nach da oder überleg mal, wie ich das machen kann. Und ja, ansonsten halt wirklich überall besser.
- Dennis
- Ja, was ich auch spannend fand, was Sie ja gesagt haben, also Du meintest ja schon, Germany 3 3 ist jetzt auch dann komplett schon in in Google Suche und diese, die es da gibt. Und dass sie bei diesen teilweise Snippets
- Philipp
- oder Generative jetzt, was falsch ist.
- Dennis
- Genau, genau. Also UI generieren, dir Sachen zu erklären, weil ich total krass finde. Also eine ne, irgend eine Simulation oder irgendwas physikalisches oder so, was Du verstehen möchtest, dass sie da einfach on the fly dir eine UI generieren, die dir das Problem erklärt. Das finde ich megaspannend, dass wir jetzt da schon sind. Ich mein, war ja auch schon, weiß ich nicht, von 'nem vor dem Jahr oder so was mit Sicherheit irgendwie 'n Stichpunkt, aber da es ja schon in der Google Suche teilweise so ist, dass Du da eine UI hinprogrammiert bekommst, schon irgendwie
- Philipp
- Ja, ich glaub, bis es noch relativ limitierend, für wen das verfügbar ist in der AI Mode. Ich glaub, Du brauchst irgend eine spezielle Subscription und ich würde auch stark davon ausgehen, dass es noch nicht in Europa ist, aber dasselbe Prinzip ist auch in der Gemini App mittlerweile jetzt vorhanden. Da nennt sich's, glaub, Visual Layout. Und da kann man halt wirklich, wie Du sagst, es, man kriegt halt nicht mehr noch den Text zurück, sondern man kann wirklich explizit nach irgendwelchen Dingen fragen, was, glaub ich, sehr cool sein wird für ganz viel Useral Use Cases einfach.
- Fabi
- Und hattest Du irgendwas von inSight so, wurde irgendwas an der Art des Trainings für Germany 3 jetzt verändert oder unterhalten uns da einfach über größere Datenmenge? Also ist gibt's da irgendwas so, wurde irgendwas grundlegend anders gemacht so oder kann man darauf zurückführen, was was er jetzt den Unterschied gemacht hat? Gibt's dazu überhaupt im Plus?
- Philipp
- Ja, also oh, ich hoff, ich sprech sein Name richtig. Oral ist WP of Research. Der hat gestern 'n bisschen was gepostet, weil wir hatten ja, glaub ich, vor 'nem Jahr ungefähr war's, wo Ilia gesagt hat, Pre Training ist ja irgendwie tot und die Modelle werden irgendwie nicht mehr besser und wir kommen nicht mehr weiter. Und wurde gestern gesagt, dass wir Verbesserungen im Pre Training und Post Training gemacht haben und dass das Delta zwischen 2 Punkt 5 und 3 im Pre Training genauso ist wie davor. Also mehr Daten, bessere Daten, einfach mehr. Also ich mein, es ist, glaub, sehr offensichtlich für alle, was wir aktuell machen müssen, besser zu werden. Deswegen bin ich sehr gespannt auf die bin ich sehr gespannt auf die nächsten 6 bis 9 Monate und ich geh stark davon aus, dass Antropic, OpMei und alle anderen halt auch immer bessere Modelle bekommen. Was immer noch, sag ich mal, sehr einzigartig ist mit Germany 3 ist, man hat immer noch den 1000000 Kontext Input, der auch besser geworden ist, also umso größer Du wirst. Und einfach grade dieses multimodalverständnis von Audio, Bilder und Videos ist doch einiges besser als von den anderen.
- Dennis
- Gut, Fabi, dann was hattest Du im Bereich der Security?
- Fabi
- Genau, wir hatten jetzt vor am 13 November, das heißt heute bei der Aufnahme 6 Tage her, hat darüber gesprochen, dass sie so den ersten AI so Cyberattacke oder Cyber Spionagekampagne entdeckt haben oder zumindest auch teilweise abgewendet haben und haben son bisschen darüber gesprochen, wie das Ganze denn so abgelaufen ist. Und auf jeden Fall grundsätzlich so ganz interessant, ich mein, dass man, dass AI für Cyberattacken genutzt wird, ist ja jetzt nicht das erste Mal. Also ich glaub, wir haben uns ja auch schon im Podcast irgendwie drüber unterhalten, dass natürlich mit irgendwie dem mit dem, was irgendwie AI kann, dass es da 'n supergutes Tool ist. Und wenn's nur irgendwie ist bei teilweise irgendwelchen Spam-E-Mails oder so oder Phishing-E-Mails. Aber hier geht's wirklich eine etwas größere Spionageattacke, wo ein Shoppingic meint zu glauben, dass es auf jeden Fall irgendwie aus China oder aus 'ner chinesischen individuellen Gruppe kommt, die das die das Ganze probiert haben und verschiedenste größere US amerikanische Firmen betroffen hat. Und jetzt der große Unterschied von den Spinalkampagnen, die man vorher gesehen hat, zu dieser ist, dass die Durchführung der Kampagne oder der der Attacke zu, sagen wir mal, Sie sagen 85 bis 90 Prozent von AI wirklich auch durchgeführt wurde, sodass im Endeffekt son bisschen, wie man sich's vorstellen kann, der erste, wenn man's vielleicht zusammenpassen würde, der erste Spionage Agent, das erste LLM als Spionageagent, sodass man so so ungefähr beschreiben dies son bisschen, dass sie eben nur nach an bestimmten Key stellen, die die Angreifer mit AI interagieren mussten und sozusagen mit weiten Entscheidungen son bisschen treffen mussten und eher als Orchestrrator fungiert haben, als jetzt wirklich als den als die Person, die es durchführt, was halt vorher bisher immer anders war. Grundsätzlich haben Sie dafür als Modell untendrunter Claude Code genutzt. Und der eine Part erst mal son bisschen interessant ist, grundsätzlich ist ja sind ja die Modelle, wie auch alle Claude Modelle ja eigentlich darauf trainiert, solche Dinge nicht durchzuführen so. Das heißt, ich war schon ein relativ leveres Orchestrieren von bestimmten Proms, die überhaupt dazu zu bringen, die verschiedenen Tools zu nutzen, die verschiedenen Schritte durchzuführen. So der Grundtonor, dem Sie genutzt haben, war, dass Sie gesagt haben, zu sind, Sie sind eigentlich eine Cybersecurity Agentur, die sozusagen eigentlich probiert, Schwachstellen aufzudecken soll. Und das wär erst mal der Grundthema, mit dem Sie's überhaupt geschafft haben. Ich mein, so einfach war's am Ende nicht. Die Proms sind schon sehr viel genauer irgendwie engineert, aber das war so der der Grundthema, mit dem sie die Erde zugebracht haben, überhaupt mitzu kooperieren und dort zu helfen. Und dann kann man sich's eigentlich so vorstellen, dass es einen verschiedenen Layern aus verschiedenen MCP Servern waren, die so grundsätzliche Tools genutzt haben, die man die man auch von solchen Attacken kennt. Also dass sie im Endeffekt, wenn man wenn man dann mal son bisschen schaut, wie sone wie sone Attacke abläuft, dann ist es ja, dass man am Anfang son bisschen macht, so kann ich vorher auch noch nicht so ganz sind grundsätzliche Querys, mit denen man probiert, alle Informationen 1 1 Firma zusammenzutragen, dann zu schauen, okay, was für welche was für Angriffsvektoren gibt es. Es fängt an von der einfachen, kommt eine Website, über Subdomains, irgendwie, ob's irgendwelche Leaks in der Robots txt gibt, dann werden aber auch DNS Records sich angeschaut, irgendwie geschaut, gibt's irgendwelche offenen s 3 Buckets, die man vielleicht nicht kannte, aber auch so Informationen, die gesammelt wurden, wie was gibt's denn für also so Human Hacking? Also was gibt es für Leute, die dort arbeiten, so wie bei bei LinkedIn zu schauen, okay, wie ist das Ort, Chart, so was gibt's wirklich? Hab Reposern erst mal probiert, diese gesamte Informationen zusammenzutragen, aber dann auch die Durchführung der Attacke, die über Cloud Code dann im Gegenteil orchestriert wurde. Und in Shopic hat wohl dann dazu halt die und Cloud analysiert, hat wohl auch immer mit den Unternehmen parallel dazu, wie sie angegriffen wurden, wohl auch kommuniziert, ihnen das irgendwie zu sagen. Und hat dann auch teilweise die Accounts von den Leuten, die es genutzt haben, irgendwie gesperrt. Aber dass sie halt, das ist echt 'n ganz interessanter Artikel, den man sich mal son bisschen durchleben kann, so wie das Ganze irgendwie orchestriert wurde und dann auch eben die Durchführung der Attacken. Also wenn man dann Exployds hatte so, dann auch im Endeffekt, dass sie sich in dem System bewegt haben, probiert 'n Diagramm davon zu erstellen, Architekturdiagramm, was gibt's für Technologien? Wo sind Vulvenobilities? Und sobald Sie dann mal irgendwelchen hatten, irgendwelche User Credentials, dann auch probiert haben, son bisschen explorativ durchs System zu gehen und zu analysieren, okay, wo könnte man denn noch was rausholen? Cloud Code hat direkt mit 'ner Datenbanken interagiert und sich teilweise so Back up User erstellt, mit denen sie wieder draufkommen, große Exports gemacht. Und dass man einfach sieht, dass diese Attacken in dieser Größe von Stil, das ist, glaub ich, das, was jetzt sone der der Shift damit son bisschen passiert, dass es jetzt einfach sehr viel einfacher ist, wenn man das son bisschen als Exempel nimmt, mehr Attacken in größerem Stil mit weniger menschlichem Input irgendwie durchzuführen. Also ich glaube, so Attacken gab's vor 1 zu 1 auch schon. Und das Besondere daran war jetzt, wie viele Firmen gleichzeitig in dem Fall irgendwie angegriffen werden konnten, analysiert werden konnten. Die haben jetzt nicht dazu geschrieben, ob es wirklich kritische Daten dabei jetzt irgendwie geleakt wurden. Bleiben natürlich gibt es auch trotzdem noch weiterhin Probleme so. Ich glaub, 1 der größten Probleme ist son bisschen Halluzination weiterhin so, dass es auch Fälle gab, wo laut irgendwie gesagt hat, das hat irgendwelche Credentials gefunden, die aber einfach ausgedacht waren sie, die gab's gar nicht. Aber es ist, glaub ich, wirklich schon interessant so, dass das jetzt so der erste, vielleicht eher auch erkannte Fall war wie sone Art, wie wie ja, so Agent zum Hacking irgendwie erstellt wurde. Auf jeden Fall sehr, sehr interessant zu lesen, was in Herrn Tropic da da geschrieben hat, was damit wir genutzt wurden. Aber im Endeffekt, besonders ist sind eigentlich und das ist so die Bottom dann, glaube ich, ist eigentlich nichts Spezielles. Es ist dann im Endeffekt gut orchestrierte Proms mit 'n paar M CP Servern, die Tools nutzen, die Sie vorher auch schon genutzt haben. Da ist kein neues Tool dabei, sondern im Endeffekt jetzt nur eine Qualitätsstufe erreichen, indem man solche Dinge sehr viel besser orchestrieren kann. Und auch trotz dieser Halluzinationen von den AI Models irgendwie zu 'nem sehr, sehr gutem im negativen Sinne Ergebnis kommt. Und ich glaub, das ist schon schon sehr, sehr interessant.
- Philipp
- Macht ihr bei euch irgendwelche Tests, Spam-E-Mail, Phishing-E-Mails, irgendwas?
- Fabi
- Irgendwas automatisiertes meinst Du?
- Philipp
- Ja, oder generell son
- Dennis
- Ja, nee. Ich weiß nicht, hab, das haben wir am Ende nicht gemacht, dann die hatten wir son Angebot in Anführungsstrichen für son Phishing Test von extern. Aber ich glaub, das haben wir, haben wir an der Stelle noch nicht durchgeführt und eher noch mal dafür sensibilisiert. Also wir hatten tatsächlich eine ganz gute von, also auch schlimm, dass es funktioniert, aber wir arbeiten ja mit den auf Matter und da hatten dann welchen Systemen genutzt, sich praktisch mit 'nem Nutzer anzumelden, der eine E-Mail-Adresse war. Und dadurch ist es geschafft, halt von der Original mit der Adresse eine, ja, I Nachricht an uns zu schicken, wo man drauf reagieren sollte. Und das heißt, sie war die sah komplett, ne, sie war vom richtigen Absender, da da passte eigentlich alles. Die haben dann zum Beispiel die Dateien geteilt, aufmerksam zu machen, wie gut es sein kann.
- Philipp
- Ja, ich glaub halt, dadurch, dass Du halt die Tools hast und vor allem so was auch wie Deep Research und so was, kannst Du relativ gute Profilbilder, sag ich mal, von Menschen erstellen, die mehr öffentlich oder mehr in der Öffentlichkeit unterwegs sind. Also ich kann mir sehr gut aus vorstellen, dass man von mir relativ schnell 'n relativ authentischen Bot generieren kann, der dann irgendwelchen Leute anschreibt und versucht, irgendwas zu ergattern oder so was.
- Fabi
- Ja, und ich mein, das ist ja, das ist ja das, glaube ich, das Spannende an der Sache, ne. Dass man schon überlegt, wie schlecht, wie gut die teilweise sehr schlechten Phishing-E-Mails schon funktionieren und so, Da ist halt die Frage, okay, wenn sie das wirklich in 'nem sehr guten Stile hinbekommen, ich mein Dennis, dein Beispiel, was mit Metaverse war, das war ja wirklich schon sehr gut. Ich glaub, wir haben schon den Vorteil, kleine Company, alle relativ technisch und grundsätzlich irgendwie schon Also es ist den Leuten ein Begriff im Vergleich zu vielen anderen Firmen, wo Du ja, wenn Du eine viel größere Workforce hast, die viel diverser ist, die irgendwie da, was das angeht, auch gar nicht in ihrem Alltag so viel Kontakt haben oder irgendwie so über solche E-Mails irgendwie nachdenken, hast Du die, geht so was sehr viel leichter. Also ich glaub, bei uns ist es schon relativ schwierig, es überhaupt zu schaffen. Aber wenn sich die Qualität insofern verändert und durch solche Attacken vielleicht dann so was auch häufiger passiert, wie Du grade meintest, dann ist das sie an, dass sie an irgendwelche User Accounts kommen, so E-Mails dann vielleicht doch mal verschicken zu können. Dann sind halt viele so der Indizien, die man vorher hatte so, sehr, sehr schwierig. Dann brauchst Du schon sehr viel mehr Kontext und einfach so einfache Dinge wie, ist ja das Erste, was ich mach, ne, guck mir mal den E-Mail-Absender an. Was ist das für eine Domain? So macht die überhaupt Sinn? Und dann kannst Du ja schon mal sofort ausschließen so und wenn das schon mal wegfällt.
- Philipp
- Ja, ich glaube aber, dass das so, ich weiß nicht, wie's bei euch ist, aber ich nutz E-Mails eigentlich gar nicht. Also ich schau einmal am Tag morgens meine E-Mails an und Achtzigter Prozent davon sind irgendwelche von Chatnachrichten, whatever. Und wenn ich irgendwie, sag ich mal, andere Menschen kontaktiere, die ich nicht kenne, gehe ich auch mittlerweile nur noch irgendwie über Twitter oder LinkedIn oder irgendwie so was. Und den Vorteil, den Du halt auf den Plattformen ja hast, ist, dass Du mehr oder weniger dein Profil ja mittlerweile verifizieren kannst oder musst, dass es halt doch dann irgendwie schwieriger wird. Und ich bin halt mal gespannt, ob das dann in Zukunft son E-Mail-Themaproblem noch mehr wird und ob der normalo, sag ich einfach mal, dann auch zu Alternativen geht. Weil ich glaub, Apple hat jetzt letzte Woche angekündigt, dass sie sone digital ID machen wollen irgendwie, wo Du halt wirklich verifizierst, dass Du 'n Mensch bist. Und ich denk, so was muss halt auf lange Sicht kommen, weil wie viel Bots haben wir auf jegleg je möglichen Plattformen? Wenn Du, Du kannst die halt nicht mehr unterscheiden. Du brauchst halt irgend 'n Weg zu zeigen, dass Du 'n Mensch bist, ansonsten wird's schwierig.
- Fabi
- Ja gut, aber andererseits ist halt schon so, ne, ich mein, die E-Mails sind ja kein persönlicher Kontakt, über die Phishing kommt, ne. Klar, denk ich auch, aber so die meisten, ob die Leute irgendwie reinfallen, sind ja Systemnachrichten. So, wenn Du dir trotzdem immer heute 'n von deinen Applikationen anschaust so, Ja. Also allein Registrierung von Accounts bis hin aber dann zu System Notification, das heißt jetzt keine App ist, die Du hast, das passiert ja immer noch alles über Mail. Und das mein, ist jetzt nicht umsonst. Das ist, glaub ich, eine der größten oder die meisten Anzahl von Fischen Mails bekommen irgendwie 'nem Strato Absender. Also sind so einfach so mäßig an die ist eine Rechnung zum Bezahlen, so ungefähr. Und das sind ja schon immer diese Systemnachrichten, wo ich jetzt grade noch keinen Move sehe, dass das jetzt groß verändert und wir irgendwie 'n anderes System bekommen, was was natürlich gesehen bessere Security Layers drin hat, oder?
- Philipp
- Ja, aber deine Kinder haben nicht mehr neue Whatsapp Nummer und dass Du ihnen schreiben sollst.
- Fabi
- Die ersten ersten ersten
- Philipp
- Mal Hallo Papa, ich habe ja eine neue Nummer. Kannst Du mir bitte schreiben?
- Fabi
- Genau, so, also es geht geht auch auf anderen Plattformen, aber meine Kinder haben zum Glück noch kein Handy, von daher kann ich diese auch relativ gut ausschließen so und sie können auch noch nicht schreiben so. Das hat aber, das ist 'n bisschen dasselbe wie mit der E-Mail-Adresse.
- Philipp
- Ja, ich hab keine Kinder und bekommen die trotzdem, deswegen.
- Dennis
- Ich muss auch gleichzeitig sagen, ich bin irgendwie ganz happy, dass die Leute, die das machen, noch einigermaßen dumm scheinen, oder? Ich mein, also mich wundert die Qualität, also die heutige teilweise von den Phishing Mails oder so was, wie schlecht sie dann auch noch irgendwo ist.
- Philipp
- Wär aber wahrscheinlich das,
- Dennis
- was Du alles an der Reihe hast.
- Philipp
- Kostending, wenn es nichts kostet, 100000 Menschen zu schicken, dann reichen dir ein Prozent Erfolgsrate. Wenn das irgendwann kostet oder schwieriger wird, dann steigt wahrscheinlich auch die Qualität da davon.
- Fabi
- Ja, mit AI singen sowohl erst mal die Kosten als auch die Barrier, die Qualität hochzuschrauben, so. Ja. Ein schwieriges Zeichen an der Front. Ja.
- Dennis
- Gut. Dann kommen wir noch zum dritten Topic und das ist eigentlich eigentlich, was ich einfach gewählt habe, weil es interessantfälle. Und es ist weit weg davon, dass ich irgendwie Experte bin, aber ich weiß nicht, wie es euch geht, aber irgendwie finde ich Wetter immer in 'ner gewissen Art und Weise spannend, wie das Du
- Fabi
- meinst, jeder ist Experte oder nicht?
- Dennis
- Jeder ist Experte. Jeder ist Experte. Aber es gibt auch son paar X. Also, weißt Du, unser hier Gründer Sebastian, der ist noch mal 'n bisschen mehr Experte als man selbst, hab ich das Gefühl, wenn's zum Thema Wetter kommt. Aber, auch das ist jetzt wieder was von Google Deep Mind und Google Research, was sie gemeinsam veröffentlicht haben. Und zwar geht es ein Modell, das nennt sich Weathernext Two. Und an dem Two sieht man auch, dass es jetzt nicht grundsätzlich neu ist oder dass sie vorher schon ein Modell hatten, wo sie einen ähnlichen Ansatz gefahren sind mit. Und ich fand das einfach nur sehr faszinierend, weil seitdem es irgendwie Gen AI gibt, ist es natürlich zum einen immer noch hier und da ein gewisses Hypethema, zum anderen einfach eine Realität, wie viel sich damit ändern lässt. Und aber trotzdem auch dann für mich immer noch eine Frage gewesen, okay, wie weit kann man praktisch diese Technologie ähnlich anwenden auf auf andere Gebiete, dort, ja, Dinge neu zu denken und neu neu berechnen zu lassen. Und bis jetzt ist tatsächlich so, dass einfach Wettermodelle, das heißt, da gibt's 'n paar, es gibt von von soner europäischen Organisation, wo alle möglichen europäischen Länder drin sind, gibt's 1, was zentral gesteuert sind. Das sind fast 500 Mitarbeiter, die dann gesponsert werden von den den Ländern, die da drin sind. Und das sind vor allen Dingen mathematische Formeln, die sich halt über die Zeit ergeben haben und die laufen auf riesigen Supercomputer und rechnen halt dadurch aus, wie das Wetter in der Zukunft werden soll. Und das sind mehr oder weniger festgelegte Regeln, die sich da irgendwie anpassen und das wird dann immer berechnet. Und bei Weathernext Two ist es letztendlich, geht es ein ein generatives Netzwerk, das nennt sich Functional generative Network, was dahintersteht. Und das wurde einfach auf vielen Daten trainiert und also auf der gesamten Vergangenheit sozusagen der Parameter. Es gibt irgendwie, weiß nicht, 100, 300 Parameter, die so die Atmosphäre beschreiben, was man alles dafür hat, was irgendwie sinnvoll ist, Wetter dann berechnen zu können. Und genau, dadurch ist es halt möglich geworden oder die Qualität ist jetzt mittlerweile halt durch Weathernext Two so hoch, dass es letztendlich genutzt werden kann, Wettervorhersage zu machen, wo es in vielen Benchmarks oder Tests Vergleichen besser war als die die herkömmliche Berechnung des des Wetters. Das heißt, das wird, also diese Technologie wird jetzt Einzug gehalten in all Google, in alle Google Wetterfunktionen, also sei es irgendwie, wenn man in Google Suche oder in Germany oder Pixel, auf Pixelphone oder in Google Maps gibt's, glaub ich, auch irgendwie Wetteranzeigen. Also alles überall, wo Google irgendwelche Wetterinformationen bereitstellt, das wird jetzt zukünftig dann mit diesem Modell gemacht. Und was halt auch krass ist, wie sie geschafft haben, das Ganze deutlich effizienter zu machen. Also wenn man sonst nicht überlegt, okay, da sind die ganz nette Riesenrechner, die das machen. Und tatsächlich ist es so, dass eine einzige GPU jetzt ausreicht, in 1 Minute das Wetter für die nächsten 15 Tage zu berechnen. Und das ist dann
- Fabi
- Das heißt, wenn Du jetzt sagst Wetter berechnen? In Welt, also für die Welt.
- Dennis
- Für die Welt, wobei sich da ein Medium grade in Fachturm vergessen. Also es sind ungefähr Raster von 30 mal 30 Kilometern, die es geht. Und dann gibt es noch mal praktisch kann man, weißt Du, auf diesen Daten dann noch mal spezifiziert, also speziellere Modelle trainieren und so was, die jetzt machen, aber es ist erst mal son grundsätzlicher weltweiter, ja, der da ist. Und durch diese Effizienz ist es halt auch möglich, dass einfach sehr, sehr unterschiedliche Varianten, also mit 'nem gewissen Randomess, die da mit reinkommt, zu berechnen, dann zu gucken, okay, was könnte denn noch passieren? Was grade natürlich für Dinge wie ja, so Katastrophenevents, Überflutungen, Zitrone, die irgendwo sind und so was, das noch mal deutlich effizienter macht, weil man einfach gucken kann, okay, was könnte theoretisch auftauchen und das dann genauer unter Beobachtung zu haben.
- Philipp
- Vielleicht noch ganz jetzt zusätzlich, ist auch verfügbar in der Google Maps Plattform. Klar, Google Maps kennen wir alle vom Handy, aber Google Maps hat auch 'n API Service, wo es mittlerweile eine Kategorie gibt. Unter anderem gibt's dort auch eine AppI. Und dort gibt's auch einen von 10000. Und 100000 kosten 14 Dollar. Ich weiß jetzt noch nicht, ob das schon auf die neue, die neu, das neue, sag ich mal, Wettermodell gegangen ist. Aber wenn man irgendwie in dem Bereich aktiv ist oder eine Anwendung baut, die braucht halt Wetterinformationen benötigt, dann vielleicht auch mal dort reinschauen. Ja.
- Dennis
- Ja, und auch da die Kombi ist dann halt wieder spannend von den Daten, ne. Also wenn zum Beispiel in Google Maps, wenn dort ein riesen Regenschauer, 'n Sturm vorhergesagt wird, dann kann das schon in die Routenberechnung miteinbezogen werden, dass da dann wahrscheinlich zur Verzögerung kommt. Und so ist es dann ein netter ein netter Use Case. Fabi?
- Fabi
- Und richtige banale Anwenderfrage, kannst Du mir mal beantworten, in welchem Tool ich jetzt sozusagen das Wetter von bekommen? Kann ich das grad auf irgendeine Seite gehen und sagen, das ist das.
- Dennis
- Ja, Du kannst Frankfurt Frankfurt Wetter in die Google Suche eingeben. Das ist. Ja, ob's jetzt aktuell, sie, das ist der Plan, dass alles übernehmen wird. Ob's jetzt grade heute der Stand ist, das kann ich dir noch nicht hundertprozentig sagen. Gleiches gilt auch für die API. Also wenn nicht jetzt, dann relativ bald in der Zukunft.
- Fabi
- Ja, also Sie sagen jetzt grade, ist 13 Grad, die Sonne scheint mit bisschen Wolken. Also das ist richtig, das heißt, es muss ja eigentlich sein, oder? Genau. Ich glaub,
- Philipp
- es ist mehr, also wo ich's gesehen hab, was mich auf jeden Fall freuen würde, ist halt vor allem, was auch 'n bisschen länger geht. Also ich weiß nicht, ich hab halt 'n iPhone auch hauptsächlich und ich guck mein iPhone Wetter nicht an, weil mein iPhone Wetter ist immer sehr, sehr ungenau und wenn man dadurch bisschen
- Fabi
- Das kann da kann nicht sein, iPhone Wetter ist genau.
- Philipp
- Ja. Ich mein, wenn das dadurch besser wird, wo generell vielleicht auf den Standardmeer geht. Also ich bin auf jeden Fall, wird auf jeden Fall, glaub ich, sehr interessant. Und wenn's halt achtmal schneller und günstiger ist, eröffnet's ja auch immer wieder ganz viele neue Anwendungen. Also ich kann mir vorstellen, gerade auch wenn Du irgendwie, ich weiß nicht, outdoormäßig irgendwie tätig bist, sei es irgendwie Bauarbeiten oder andere Dinge, wenn Du halt morgens irgendwie reinschauen kannst und sagen kannst, hey, heute brauch ich nicht zu Fabi fahren, weil ich seh, da regnet's zwischen 8 und 10 Uhr, dann geh ich lieber erst zu Dennis und mach dort die Dinge. Kann halt schon auch sehr hilfreich sein, produktiver zu sein in normalen täglichen Doing. Und ich weiß aktuell nicht, ob sich das lohnt oder die Genauigkeit groß genug ist, dass halt so Unternehmen das mit einbeziehen, wenn man halt den Debberecht tätig ist.
- Fabi
- Hier auch nicht mehr noch, was Du meintest mit Effizienz ja auch eine schöne Nachricht. So der, wir unterhalten uns ja eigentlich immer nur darüber, wie viel Strom irgendwie verbraucht wird sozusagen, wie viel allein wie viel allein durch durch Dankesagen in LLMs irgendwie verbraucht wird. Und ist ja irgendwie schön zu sehen, dass wir da auch also außerhalb von Large Language Models irgendwie AI Anwendungsfelder halt wirklich das Ganze so viel effizienter machen, was auch irgendwie unsere, was einfach ressourcenschonender ist. So ist es natürlich auch cool, irgendwie so Beispielefirma zu bekommen. Ja. Ja, auch Aber jetzt wahrscheinlich nicht gleich, was wir an LLMs stecken.
- Dennis
- Das ist richtig, ja. Oder das Training dafür. Weil ich das gerade sagte, also das wird in 6 Stunden Schritten dann berechnet, also für diese Minute 0, dass es noch als Kontext ist, glaube ich, wichtig, also zu jeweils 6 Stunden Blöcken, in denen das ist. Und ich glaub, weiterhin die Zukunft, Philipp, das wird wahrscheinlich 'n Problem erst mal bleiben. Ich glaube, viele sind sich da recht sicher, dass man das über 15 Tage
- Philipp
- Ja, ja, nee, ich wär's schon so 3 Tage, genau.
- Dennis
- Ja, okay. Das wird wahrscheinlich, ja, werden wir auch besser drin.
- Philipp
- Ist ja cool.
- Dennis
- Gut. Wie viel grade hast Du das hast Du gesagt, Fabi? Ich wunder mich über deine Mütze.
- Philipp
- Ja, ich sitz aber auch
- Fabi
- hier im Schatten. Ich musste mir, ich hab sehr lange gebraucht, ihm auf dieser großen Community Contest Du mit
- Philipp
- anspielen, dass bei ihm wahrscheinlich aktuell 28 Grad und so was sind. Jetzt wollte ich nicht,
- Dennis
- nein, aber, guck, Fabi ist doch auch in Barcelona. In Barcelona würd man dann auch denken, wenn jetzt in der Sonne sitzt, ich kenn's dir mal durch T-Shirt aus.
- Philipp
- Ja, nee, ich
- Fabi
- hab die Sonne ist, an meinem rechten Arm ist grade Sonne, da wird's mir auch grad 'n bisschen zu warm. Die sind ja grade draußen hier, 13 Grad sind's. Also es ist schon gestern Abend waren wir unterwegs, da war selbst mit dem Pulli war's zu So hätt ich gern eine Jacke dabeigehabt. Aber ja, jetzt so in der Sonne könntest Du wahrscheinlich auch grade im T-Shirt rumlaufen. Okay. Ja,
- Philipp
- also in Deutschland hat's Minusgrade und die Autos waren heute Morgen hochgefroren.
- Fabi
- Bei uns jetzt geschneit in Bad Nauheim. Ja, Dennis hat's auf jeden Fall gegen die beste Wahl grade getroffen, Martin Nik. Sehr. Dafür müssen alle anderen, Du kannst in der Sonne sitzen, dafür müssen alle anderen mit unserer Verzögerung jetzt leben, die wir hoffentlich in der Postproduction dank Carlo wieder 'n bisschen auszukommen. Ja. So
- Dennis
- ist es. Vielen Dank, dass Du's dir dabei wart.
- Philipp
- Ihr mein wart bitte.
- Dennis
- Wer ihr Feedback habt, genau, schreibt uns an Podcast at Programmier Punkt bar und sonst surfen wir uns in dieser Konstellation gerne in 2 Wochen wieder. Macht's gut, bis dann.
- Philipp
- Tschau.
- Dennis
- Tschüs.