programmier.bar icon
News 30/23 –

Valibot // Twitter wird X // Microsoft Cloud Probleme // Google Street View // GPT4 wird schlechter

26.07.2023

Shownotes

In der letzten Folge vor der Sommerpause geht es um das Open-Source Tool Valibot als modulare Alternative zu ZOD. Microsoft Cloud hatte eine große Sicherheitslücke, deren gesamter Umfang noch gar nicht klar ist. Google Street View hat neue Aufnahme in Deutschland veröffentlicht. Twitter war mal, jetzt kommt X - ein weiterer zumindest fragwürdiger Schritt von Elon Musk. GPT-4 verändert sich über die Zeit - ob das automatisch schlechter ist klären wir in der Folge.

AI-generierte Kapitelmarken:
0:00:17 Sommerpause ankündigen und reduziertes Programm
0:01:22 ChatGPT und mögliche Veränderungen über die Zeit
0:03:17 Elon Musks Kind und Namensgebung
0:05:26 Google Street View aktualisiert Bilder in Deutschland
0:06:34 Leben in der Bubble: Haus vs. Wohnung
0:07:45 User ausrollen und neue Bilder zeigen
0:08:11 Microsoft - Ein verlorener Schlüssel und chinesische Angreifer
0:08:56 Microsoft und die spärliche Informationspolitik
0:10:20 Google testet das Kappen des Internetzugangs für Office-Arbeiter
0:12:12 Vorstellung der Valibot-Plattform und ihrer Funktionen
0:12:22 Valibot - Eine Open-Source-Validierungs-Library
0:12:56 Valibot - Eine modulare Alternative zu ZOD
0:14:04 Dokumentation und Ankündigungen zu Valibot
0:15:28 Valibot als vielversprechende Alternative zu ZOD
0:18:35 Veränderung der Primzahlerkennung von GPT-4 im März und Juni
0:19:41 Performance-Veränderung bei Primzahlen und zusammengesetzten Zahlen
0:24:14 Entwicklung von Modellen mit sprachabhängigen Elementen
0:26:02 Abschiedsworte und Ausblick auf die Sommerpause
0:26:49 Abschied nehmen
0:26:50 Verschiedene Abschiedsgrüße

/transkript/programmierbar/news-30-23-valibot-twitter-wird-x-microsoft-cloud-probleme-google-street-view-gpt4-wird-schlechter
Hallo und herzlich willkommen zu den letzten Programmier.bar News vor unserer Sommerpause. 30 23 haben wir und wie man gleich hören wird, sind wir heute schon ein bisschen reduzierter am Start. Mir zugeschaltet ist der liebenswerte Fabi. Hello Denis. Moin. Ähm, ja. Wir zwei halten noch Stellung. Andere sind schon im Urlaub. Und da wir auch bald beide Du machst von dir hören wir jetzt noch Ende. August nach Portugal. Ende August nach Portugal. Ich bin Mitte August in der Türkei und deswegen machen wir wie letztes Jahr ein paar Wochen Pause. Voraussichtlich sind wir Mitte September dann wieder für euch da. Am Freitag gibt es noch einen letzten Dip Dive zu Design Systemen und dann hört ihr uns nach der Sommerpause wieder. Heute sprechen wir über Wally Bott. Dann gibt es ein Paper zu ZGB, was in Frage stellt, ob das schlechter geworden ist oder anders geworden ist. Über die Zeit, da reden wir drüber. Und dann gibt es. Drei. Das ist ein Mann. Die anderen Jungs, die ich habe, die sind so klein. Wenn ich nur die Überschrift sage, ist die Geschichte schon vorbei. Von daher. Vielleicht machen wir das mit einem. Vorsicht. Das mache ich gerne. Pass auf. Also, hier haben wir das Erste, worüber wir sprechen können. Dass Elon Musk tatsächlich Twitter umbenennt. Manchmal denkt man ja immer irgendwie Geht's noch so? Ähm. Ich sage mal so an der Grenze zu Das ist jetzt gerade ein Witz, oder er macht das wirklich und das ist im Moment so! Also Xcode .com leitet jetzt weiter auf Twitter. Auf Twitter selbst ist auch der Vogel schon weg. Da ist jetzt das Neue. Ähm. Gehässige würden sagen Dabei handelt es sich ja nicht um ein Logo, sondern es ist in irgendeinem. Es ist aski, glaube ich. Also es sind irgendwas Gitarre bitte auch mit drin. Ähm, zu dieser Buchstabe. Ja, es hat sehr viele Sachen hier irgendwie mitchs benennt und findet das gut neben seinen Kindern auch. PayPal vorher hieß war es mit den Kindern. Auch wirklich was mit extra lustig? Ob das ein Witz war, als ich es gelesen habe? Ich glaube das ist wahr. Ähm und ja, die Sache heißt ja auch die, die er da gestartet hat. Von daher ja Felix bei Elon Musk und ich bin sehr gespannt. Was als Basis zieht, auch alleine, wenn man überlegt, wie viel Arbeit das jetzt bei anderen Leuten macht. Überall. Keine Ahnung. Jeder, der Jung und Widder verglichen hat, um auf den Account zu verweisen, alle Assets und sowas. Wenn sich das jetzt wirklich durchsetzt in Anführungsstrichen, müssen ja alle Externen auch da ihre ganzen Bildchen anpassen und dann nicht mehr von Filter, sondern von Externen. Aber. Na ja. Irgendwie. Ist das denn wirklich ein Witz. Na gut, er heißt Xavi. Also, das sind drei Namen. Die unbekannte Variable. Ei die Elfen Schreibweise von Ei ist der zweite Name. Und der dritte ist Edward, der Vorläufer ihres Lieblingsflugzeuges. Keine Waffen, keine Verteidigung, nur Geschwindigkeit. Großartig im Gefecht, aber gewaltfrei. Also, äh. Das ist das Kind von Ihnen, Mask und der Sängerin Grimes. Ich würd mich gerne vergrößern. Junge, Junge, Junge. Junge. Na, zumindest kriegt ja einiges an Geld vererbt. Also ja, mal gucken. Ich sag mal so, wenn. Geld für Dinge wie Twitter ausgibt und sie dann zu XY umbenennt und dann vielleicht auch nicht. Eher das richtig auf vielleicht 1 Milliarde oder irgendwie oder schon noch übrig haben. Aber ich habe vergessen, wir haben ja auch den Job von Linda. Ja, Carina, wie gesagt, ich würde sie auf Twitter auch echt scheiße vor. Das ist doch bestimmt durch Creme so Gespräch vor wie gut, wie, wie viel, wie viel Zeit wird Ihnen Maske der Woche für Twitter haben? Das haben Stunde so kurze Gespräche sein, während er grad in seinem seiner Limousine sitzt, denn da nennt Twitter nix um so einen ist sicher XY weiß das ja. Und dann will sie noch irgendwelche anderen wichtigen Themen besprechen. Sag ihnen, den Rest schaffst du schon so, nennst einfach nix um, sag mir Bescheid, wenn es dann. Ja, das ist richtig. Und das ist also wirklich so unvorstellbar wie so was. Also man würde so gerne mal also das wäre wirklich was, wo ich gerne mal einfach hinter die Kulissen blicken würde, wie so was abläuft und da ist begeistert Leute gibt, die klatschen und sagen Hey, super Idee Typ oder ob da mal einer. Bist du dir sicher, dass man ein sehr bekanntes Unternehmen einfach mal umbenennen sollte? So Na. Ja. Vielleicht ist es ja auch einfach nur Strategie auf Ebenen, die wir alle nicht sehen können. Und der Typ ist einfach zu schlau für die Welt. Ja. Das magister sein. Gucken wir mal, magister sein ja, dass wir anfangen kann sein. Zwölfte zu fragen, wie ihr Papa so findet. Nächste kurze News Google Streetview hat neue Bilder in Deutschland geschossen. Ich weiß es gar nicht immer. Vor ein paar Wochen oder so war das ja mal ein Pic oder eine News von mir, dass Apple das ja so sehr heimlich gemacht hat mit dem Logo Round Feature so ziemlich deutschlandweit in richtig krasser Qualität. Einfach mal alle Bilder updatetet hat und zur Verfügung stellt. Und tatsächlich nach vielen ja, ich glaube 2009 war das schon mit Googles Video kommen jetzt mal neue frische Bilder, die aus 2022 und 2023 stammen, haben es gerade im Rollout. Das heißt, kann sein, dass es noch nicht jeder sofort jetzt sieht, aber in den nächsten Tagen sollte es eigentlich bei allen ankommen. Und dann kann man mal gucken, ob das eigene Haus dort neu abgelichtet und ich frage mich auch neu verpixelt werden muss. So, also übernehmen Sie die die Verpixelung aus dem alten Guesthouse oder muss man jetzt eine neue Farbe pixeln lassen? Gute Frage. Ich finde es einfach machen wollen, dann lassen Sie es drin. Aber na ja, vielleicht verwechseln sie es auch nicht und es passiert einfach nix, weil die Leute jetzt 14 Jahre weiter sind. Nicht mehr reinschauen. Aber dann ist man, merkt man, du lebst in deiner Bubble nicht. Also dann kann man mal schauen, ob sein Haus nicht jeder hat ein Haus glaube ich von unserem Hören. Aber wir können natürlich schauen. Sie wohnen, wo wohnt. Dort sonst außer in Häusern. Ja auch eine Wohnung befindet sich in dem Haus Pei. Ecke. Na ja, gut, wir haben es jetzt nur gerade so gerade gerückt. Hmm. Da bin ich gespannt. Okay, aber Sie haben nichts dazu gesagt, ob es wirklich jede Straße, jeder Winkel neu, sondern einfach so? Na ja, aber auf jeden Fall mehr. Viel mehr als sie vorher hatten. Und genau. Was heißt sie? Aber sie heißt nicht. Es heißt nicht, sie rollen es aus. Jetzt kann man das nicht auf User ausrollen, sondern sie räumen nach und nach die Bilder aus. Es ist so, dass sich die Bilder einfach updaten. Aber nicht du jetzt schon deinen. Meine Straße gab der sehen kann und ich nicht. Oder geht es hier um User ausrollen, die dann den gesamten Content sehen oder Content ausrollen? Nee, is aus rein echt. Also ich zumindest jetzt. Aber es soll ziemlich schnell gehen. Ich glaube, dass das vielleicht, wenn die Folge raus ist, schon gar nicht ohne das Ding ist und man die neuen Bilder sieht. Aber die Abdeckung wird trotzdem glaube ich so sein, wie Apple Maps im Moment hat. Aber es sind auf jeden Fall mehr als vorher und wollen auch noch mehr dann in kleine Dörfer usw das noch mehr abdecken. Also fahren weiter rum. Na ja, es. Noch ein klein wenig an einen kleinen Themen hier. Bereichert oder was geht ab? Ich hatte mit Microsoft, aber das ist halt wieder so ein Ding, man weiß noch nicht genau so richtig. Also auf jeden Fall. Microsoft hat irgendwie den Schlüssel verloren. Für mich ist der Schlüssel scheinen sich herauszustellen. War irgendwie nicht nur dafür möglich, dass es gab chinesische oder vermutlich chinesische Angreifer, die sich diesen Schlüssel besorgt haben und dadurch konnten sie sich einfach Zugangsdaten erstellen, um in Exchange Online Konten und da vornehmlich europäische Regierungsbehörden reinzukommen. Ähm, und Microsoft ist da gerade sehr, sehr spärlich, was die eigenen Informationen angeht. Das alleine wäre ja schon schlimm. Also da hat man es also dort hat man es explizit gesehen, dass das genutzt wurde. Also in den Logs wurden Daten geschrieben, wo andere nicht autorisierte Leute dann Zugriff hatten zu diesen Konten. Und eine Sicherheitsfirma hat jetzt aber mal recherchiert und sich diesen KI noch mal genauer angeguckt und festgestellt, dass das eigentlich so ziemlich ein Schlüssel war, wo man so in alle möglichen Clouddienste von Microsoft reinkam, weil durch wohl eine Fehlkonfiguration wie genau die Gründe gibt, dass noch nicht alles mögliche betroffen war. Also SharePoint, Microsoft Teams, Microsoft Office, Outlook. Letztendlich für all diese Dienste konnte man sich dann einfach Zugangsdaten generieren mit diesem großen Schlüssel. Und ja, ob das genutzt wurde, weiß man nicht. Aber es ist natürlich trotzdem irgendwie heftig. Ja, dass das mal wieder passiert am Ende. Ich weiß nicht, mein eigenes Ding ist einfach so, ich habe das Gefühl, egal wie, gerade Microsoft schreibt sich auf die Fahne, da besonders sicher Und da kannst du deine Sachen in die Cloud packen und es gut und in Deutschland und keine Ahnung was, aber so eine hundertProzentige Sicherheit werden wir wohl nie haben und müssen damit leben, dass wir einfach davon ausgehen können, dass wenn einer will, würde schon irgendwann die Daten kommen. Vor allem ich das noch gerade nebenbei gelesen, dass bei Google jetzt gerade getestet wird für ein paar Leute, die ins Office im Office arbeiten, dass der Internetzugang gekappt wird. Also sie haben noch Zugriff auf die eigenen Clouddienste, Also die ersetzen alles, was im Google Privat Network befindet, also Google Drive, Gmail, So was können sie alles noch benutzen, aber kein Internet und haben auch probieren bei anderen Leuten mal aus Rootkit Zugriff wieder einzuschränken. Aber im Endeffekt auch ein Sicherheits, also aus Sicherheitsaspekt, wo sie sagen okay, um mal zu testen, welche Rechte brauchen die Leute jetzt wirklich noch? Und Witze können sie, weil ich den Internetzugang kappen? Es ist. Nicht so, ich bin letztes Mal außerdem bei uns ins Büro gefahren und habe meinen Laptop vergessen. Es ist ja ein bisschen ähnlich wie in Der Zugang kappen. Äh, ja, ich sag mal so produktiv war da nicht so, ich hab mir sogar Test Auf jeden Fall Internetzugang kappen. Ja, du hast. Welche Jobs kannst du noch machen? Wo du also als kannst auf ein Drive und kannst gut da das Intranet von Google ist halt auch ein bisschen hat ein bisschen bessere Tools, so als wenn jedes andere Unternehmen das Ganze machen würde, aber. Naja, schwierig. Gut. Ich meine andererseits. Hast du die internen Dokumentationen? Machst du irgendwie was an der ganzen Google Cloud? Dir wahrscheinlich irgendwie benutzen? So, oder bist du wieder Administrator? Und was? Neue Emails, dann Kalender und. Jörg, Wenn es darum geht, dass es okay. Ist. Administrator für bist. Kannst du allerdings mal googeln. Ich weiß nicht, ist es vielleicht auch noch so, dass kein Ergebnis draufklicken wird? Höchstens die. Suchergebnisse. Dann kannst du probieren die Suchergebnisse dir. Na gut. So, jetzt fehlt aber auch noch eine Kleinigkeit. Aber wer weiß das. Erzählst du uns jetzt Worum handelt es sich bei Wallypothypot? Ich würde sagen, aber dazu hätten wir auch unseren Fabian. Das bestimmt auch hören wird fragen können. Nämlich der Fabian Hiller, die mir schon das eine oder andere Mal bei uns im Podcast hatten, der auch unsere Programmier.bar seite zum Großteil geschrieben hat. Hat einen OpenSource, eine OpenSource Library rausgebracht und zwar war die Bot eine Validierungslibrary. Man kennt also Typekit. JavaScript ist eigentlich würde ich sagen komplett dazu zu dem was man so kennt und ist auch vom Features her ziemlich vergleichbar. Ich glaube der größte Unterschied im Vergleich zu Day ist, dass es komplett modular aufgebaut ist. Also ist komplett Free Speech. Aber das heißt wirklich nur wirklich darauf geachtet, dass jede Funktion, die man irgendwie nutzt, um ein Schema zu validieren, eigentlich nur sich selbst als Dependency sozusagen hat. Das halt im Prinzip wird wirklich auf das Minimalste runtergestrickt macht, wie auch das, was er schreibt in seinem Blogbeitrag Super Unite stabil und so und deswegen super sicher das modulare Design und ist vom Feature Seht her so super nah an allen Typfunktionalitäten, die TypeScript so mit sich mitbringt gehalten. Also man hat Parcel s, man hat required merge pics um IDs und alle typischen Typen sind validierbar und sind auch so ein paar Convenience Dinge wie Email zum Beispiel dabei, weil er auch sagt, okay, man kann die Validation Library auch für Validierung im Frontend nutzen. Auf jeden Fall auch ein Super Use Case dafür und ist. Von der ganzen API sieht es auf jeden Fall schon mal super cool. Also dafür, das muss man direkt mal sagen Version 0,10 0.1 ist nicht 0,0 0.1 ist und Doku noch ein bisschen auf sich warten lässt. Es Fabian hat es auch geschrieben zum Dokumentation. Er macht halt jetzt gerade so nebenbei, wird dann bis zu 1.0 auf jeden Fall fertig sein. Ähm, aber ist im Moment noch ziemlich leer. Aber es ist auch. Also okay, schaltet den Code. Alles ist natürlich auch relativ verständlich, um uns einfach den Code anschaut und ich meine ist ja alles typisiert, das heißt die Imports kann man sich aber anschauen, was das für Imports liefert. Value both, Das ist ja dann relativ selbsterklärend. Also wenn man wir verlinken mal den Blogbeitrag auf Fabians Blog, er hat uns glaube ich auch parallel noch geschrieben. Ich glaube also pack mal, dass die schon uns wo die ganzen Finanzmittel dafür sind und schreiben mal alle Dokumentation zusammen, die es jetzt aktuell so gibt auf Bilder Punkt Io und die Homepage. Da steht auf jeden Fall alles erst mal drauf, was es so zu wissen gibt und klingt auf jeden Fall nach einer supercoolen Alternative. Also die ganze API Definition. Ich glaube er schreibt es natürlich noch nicht komplett Feature Parität mit allen Validierungslabels da draußen. Aber von dem was ich gesehen habe, so dass den Großteil, die man auf jeden Fall braucht dafür. Klingt auf jeden Fall cool. Er schreibt auch, ist ja super aktiv im Quick und solide Ökosystem und es wird in der Übersicht integriert, in Quick und auch in vielen Projekten in das solide Ökosystem. Er hat ja auch unser uns mit abgehalten über Quick und sollte es bei uns ab wiederum auch die Podcast Programmier.bar folge dazu können wir einmal verlinken in den Shownotes und klingt auf jeden Fall nach einem spannenden Projekt. Wie gesagt 0.1, aber. So weit ich das sehe, klingt es, als könnte das eine sehr cool Alternative sein. Zu 2D und Alternativen dort draußen. Kunden sind gespannt, was damit passiert. Dann geht es noch mal um Z. Cpt 20 muss ich grad her denken. Wie lustig. Wir haben noch mal ein bisschen rum experimentiert mit Transkriptions für unseren Podcast, um den in Text zu wandeln. Eventuell Zusammenfassungen bzw Kapitelmarken, die sich immer mal wieder gewünscht werden einzuführen. Und äh, ich merke gerade, der Witz kommt auf der Audiospur nicht so richtig rüber, aber. ChatGPT wurde äh. Übersetzt als Chacibility, also ein Z über die Zelle. Billy. Was gibt es da neu oder worum geht es in dem Set? Das hört sich an wie, sondern wie. Und sind wir ein Pokemon oder so ein Tamagotchi oder so was? ChatGPT Ja. Weil ich reden einfach zu undeutlich. Ja, geredet, zu undeutlich. Und ich meine, könnte. Ich meine, das Paper worüber es redete könnten natürlich auch ähnliche Dinge zB bitte unterstellen, dass es vielleicht selbst irgendwann seinen seinen eigenen Namen vielleicht mal falsch schreibt, weil es gibt ein Paper mit dem Titel Haus Cherrypetis Behavioral Changing Overtime von Forschern der Stanford University und Berkeley. Und da hat glaube ich einen ziemlich großen Nerv in so der ganzen ED HTTP Trussitz Community getroffen, weil es so ein bisschen die These aufstellt, dass die Performance der Modelle sie vergleichen. Äh, Stand März und Stand Juni von GBT 3.5 als Activity vier schlechter geworden ist. Also es gibt ja von Z iPad in der API Snapshot der jeweiligen Modelle und sie haben sozusagen die Snapshot des März und Juni miteinander verglichen und in vier verschiedenen Kategorien getestet. In zwei verschiedenen Kategorien haben Sie dann angeblich eine Verschlechterung der Performance gesehen. Das eine wären mathematische, eine mathematische Problemproblematik, bei der es angeblich so gewesen sei, als auch Code Generation. Und wenn man sich das Ganze aber mal ein bisschen genauer anschaut ehrlicherweise ist es so, also wir können als Beispiel nehmen die mathematischen Problem es waren 500 Ja Nein Fragen und da ging es darum, Primzahlen zu erkennen. Also Sie haben immer gefragt okay sind ist folgende Zahl eine eine Primzahl und hatten dann die Erkenntnis okay Typ die 3.5 ist von März zu Juni sogar besser geworden bei dieser Frage. Also hat er im März weniger Primzahlen erkannt und jetzt im Juni erkennt es mehr gibt die vier hatte im März glaube ich nur XY von den Primzahlen von Paaren 80 % 85 oder so was und hat jetzt im in der Juni Variante unter 10 % irgendwie dreieinhalb oder 4 % der Primzahlen erkannt und das in Verbindung mit Video Coaching Recht, wo ich jetzt auf den Beitrag gar nicht so ganz eingehen will, da gibt es einige Artikel jetzt schon zu dieser Zeit. Ist immer ein bisschen überfragt. Habe gesagt okay, die genauso wie die, dass es halt viel davon abhängt, wie sozusagen einfach evaluiert wurde und man daraus nicht so richtig ableiten kann, dass es schlechter geworden ist. Aber im Primzahlen Punkt erkennt man es ganz gut, weil was nämlich das ist zum Beispiel der Artikel, den wir auch in den Shownotes verlinken werden. Ähm, wurde im Endeffekt dann verglichen. Na ja, gut, Sie fragen eben nur Hier sind 500 Zahlen, alle von denen sind Primzahlen. Und sag mir, ist das eine Primzahl? Ja oder nein? Das heißt, die komplett richtige 100 % akkurat. Sie wäre ja alles sind Primzahlen und. Aber wenn man das Ganze noch gemacht hätte mit 500 Zahlen, die keine Primzahlen sind, würde man erkennen, wir vergleichen jetzt mal gibt ihr die hat der Typ. Die vier hat im März fast alle Zahlen als Primzahlen deklariert und im Juni nicht. Das heißt, wenn man sich jetzt nur die Primzahlen anguckt, ist es, ist die Performance schlechter geworden, wenn man sich nur zusammengesetzte Zahlen anguckt. Sie performen sogar besser geworden. Das heißt, es ist einfach nur, weil im Endeffekt ja ChatGPT kein mathematical Riesending hat und nicht wirklich mathematisch überprüft. Also in der in der Antwort schreibt es dann wirklich okay. Folgende Zahlen sind Primzahlen, die die Zahl ist nicht die Primzahl. Die Primzahl ist nicht durch diese teilbar. Deswegen ist es eine Primzahl, wo sagen wir mal, die die Schlussfolgerung richtig ist, aber sie hat dann nicht also ChatGPT iert, nicht wirklich überprüft ist es teilbar, sondern hat für den Schritt sozusagen übersprungen. Das heißt, diese Ableitung, die jetzt kam und das hat, glaube ich, deswegen hat es auch so großen Aufsehen erregt in der Community, weil viele schon ein bisschen der Annahme waren, dass gerade auch als irgendwie das hat mir so eines diese ganzen architektonischer Leaks in Richtung die die vier waren und so dass ja schon viele gesagt haben, sie merken eine Performance degradation und so Degradierung und ob mehr hat sie auch dazu offen öffentlich geäußert meint nein, das ist nicht der Fall. Also sie die. Werden nicht aus Kostengründen jetzt irgendwie performt von Zschäpe, die schlechter machen. Aber natürlich, so meint die Foundation, die Models werden nicht nur trainiert. Dann wird eine neue Jessy vier Version geben mit Neu gibt Version geben, aber es wird natürlich ständig das gefallen tut und das Feintuning wird wiederholt und irgendwie adaptiert. Und eigentlich das, was man aus dem Paper nur ableiten kann. Was natürlich trotzdem ne gute Erkenntnis ist, ist, dass der Output sich einfach verändert. Also man kann nicht davon ausgehen, dass wenn ich im März einfach den den Lad stand, der verschiebt, die vier der API nutze und das im Juni noch mal mache, dass die gleichen Ergebnisse rauskommen. Und das wiederum ist natürlich schon eine Erkenntnis, die denke ich mal viele hatten, aber nicht wirklich was mit der schlechter performt, sondern einfach nur einer anderen Performance zu tun hat. Also und es natürlich jetzt gerade, wo man natürlich viel Prompt Engineering betreibt und irgendwie weiß, okay, die vier kann sehr viel, aber ich muss halt den Richtigen prompt schreiben, um den für mich richtigen Output da rauszuholen. Ist natürlich die Erkenntnis Hey, ich muss eigentlich mein Projekt an manchen Stellen, wenn das Feintuning sich verändert hat, mich vielleicht wieder komplett neu anpassen und muss irgendwie wieder prompt Engineering betreiben, um dasselbe Dieses die selbe Qualität von Ergebnis zu bekommen. Ist natürlich auch jetzt nicht unbedingt die die schönste Erkenntnis. Deswegen liefert OpenAI ja auch Snapshot aus dieser dieser Version weiterhin über die API aus. Aber ich glaube das auch nur maximal drei Monate in die Vergangenheit. Also das ist natürlich etwas, was man natürlich bedenken muss, wenn man ChatGPT in seinem Workflow einbindet und viel prompt Engineering gemacht hat. Und ich glaube, was man schlussendlich sagen kann Es wird die schlechtere Performance, aber sie wird anders, weil eben das Feintuning als immer weiter gefallen tun wird oder anders gefallen tut wird. Aber ich glaube, das war echt so Ist das auch witzig? Ich habe selbst an keine Ahnung. Es war, glaube ich. Vorgestern mit Kumpels von mir essen. Wo das alles eher Nutzer von Zschäpe. Die sind jetzt nicht wirklich oder sind auch noch nicht mal alles. Ja, ich habe ja auch gehört, Zschäpe wird ja auch schlechter über die Zeit und so und ich glaube, das ist mal einfach ein Paper, was eine These gestützt hat, die viele Leute schon vorher hatten. Deswegen wird es auch nicht so im Detail angeschaut. Aber wir kennen das eigentlich eher, es verändert wurde verändert und nicht schlechter. Ja, und ich weiß gar nicht, ich glaube das auch. Das war ja ein bisschen Interpretation tatsächlich von dem Paper. Also es ist ja gar nicht so, dass das eine Aussage war, die die Autoren von dem Paper selbst getroffen haben, dass sie gesagt haben, es ist schlechter geworden. Sondern das war dann irgendwie die Erkenntnis, die die Menschen, die es gesehen haben, daraus gelesen haben. Aber ja, wird spannend sein. Aber sie haben schon zum Beispiel. Äh, äh, also der, wie heißt der mal? T Zakaria hat in seinem Twitter Post zumindestens gesagt also viele haben ja schon sich gefragt, ob sich die Performance verändert über die Zeit. Also haben wir es mal gemessen und wir haben große Veränderungen und includings vom LAG. Die Crisis in Sachen Pop Problem soll Wind haben. Also haben wir schon gesagt okay, in den Proben sind sie schlechter geworden. Und wenn man jetzt das Primzahlen Beispiel nimmt, kann man ja schon hier sehen. Ja, so einfach ist es dann vielleicht doch nicht zu interpretieren. Selbst das selbst diese. Erkenntnis. Aber ja klar, ich meine, das ist auch das ist ja so ein bisschen eine Art des neuen Entwickelnden. Also ich meine, wir sind historisch gewohnt. Wenn wir ein Algorithmus schreiben, dann verhält er sich immer gleich und das wird irgendwie gleich bleiben. Aber mit Modellen, wo irgendwelche sprachabhängigen Sachen drin sind, die sich weiterentwickeln, es ist halt nicht mehr so 100 %. Tatsächlich fand ich relativ interessant, ich meine das. Mittlerweile sind wir hier mit einiges ja schon vorangeschritten, aber das wenn man diese Temperaturparameter eines Modells auf auf null stellt, dass das wirklich deterministisch ist, also dass immer das gleiche, die gleiche Antwort rauskommt, das hatte ich gar nicht so auf dem Schirm, dass das tatsächlich lange Zeit nicht um das ist eine. Das immer auch das Gleiche ausspucken kann, oder? Ja, und trotzdem wird sich das immer weiter anpassen. Und auch unser Trump Engineering und alles das, was wir drumherum bauen, wird irgendwie eine gewisse Art von Flexibilität verlangen. Da ist ja die Frage, ob man. Will man wirklich so deterministisch und die Temperatur auf null tritt. Ich meine, man kann natürlich sagen Temperatur auf Null. Durchaus ist ein Modell selbst und man nimmt eben den Stand, mit dem es einmal implementiert ist. Aber ich meine, die Schönheit ist ja oftmals ist es vielleicht nicht ganz deterministisch ist. Ich glaube die Algorithmen, die man halt dafür entwickelt, sind halt nicht mehr komplett deterministisch. Aber ähm, in manchen UTKs möchte man es vielleicht und halt auch. Wenn am Ende der Prophet aber kaputt ist und dann einfach etwas, was zwar nicht deterministisch ist, aber dann einfach falsch ist und nicht mehr das Ding liefert, dann wird es halt blöd. Auf jeden Fall. Spannend. Gut. Dann Fabi. Dann Dennis. Haben wir so. Viel Spaß in der Türkei. Ich wünsche dir viel Spaß in Portugal. Ich wär noch drauf gekommen und unseren Hörern und Hörerinnen wünschen wir auch eine schöne Sommerzeit. Schreibt uns gerne noch mal eine Mail, was ihr euch wünscht, mit welchem neuen Feature mit was wir neu starten, wenn wir dann aus der Sommerpause zurückkommen? Podcast Programmier.bar bar oder über unser Kontaktformular auf der Webseite. Vielen, vielen Dank! Auf jeden Fall schon mal für das viele Zuhören. Im ersten Halbjahr 2023. Wir tanken ein bisschen Energie und freuen uns umso mehr, im September wieder mit euch durchzustarten. Bis dann. Bis dann. Macht es gut. Ciao. Tata!

Verwandte Podcasts

  • 18 Ai News

    News AI #18: Apple MM1 // Mistral // Grok // Inflection & Microsoft // Open Interpreter

  • News Asset50

    News 50/23: Epic vs. Google // iOS 17.2 // Cloudflare "Year in Review" // App Store 2023 // JetBrains AI Assistent

  • 135 Not Deep Dive

    !Deep Dive

  • 08 Ai News

    News AI #8: OpenAI DevDays // State of AI // DallE3 // Zephyr // Fuyu 8B

  • News Asset42

    News 42/23: ChatGPT Voice // Visual Copilot // DockerCon // Node.js 21

  • 07 Ai News

    News AI #7: Cloudflare AI - Serverless Workers, AI Gateway, Vector DB // Meta AI // LeoLM // Mistral AI 7B // LocalPilo

  • News Asset40

    News 40/23: Java 21 // Hacktoberfest 2023 // Deno-Queues

  • 05 Ai News

    News AI #5: Falcon 180 B // SD XL 1.0 // IDEFICS // GPT Finetuning // CodeLlama // Coreweave 2.3B$ AI Kredit

  • News 28 23

    News 28/23: Tailwind 3.4 // Threads // Vercel Skew Protection // ChatGPT-4 API

  • News 26 23

    News 26/23: Svelte 4 // Langchain & Colab // Google I/O Connect Amsterdam

Feedback
[object Object]