KI-Nachrichten: Erkundung des Fortschritts von OpenAI in Richtung AGI und neueste Entwicklungen
Erkunden Sie den Fahrplan von OpenAI für die Entwicklung von AGI, von Chatbots bis hin zu KI-Organisationen. Erfahren Sie mehr über ihre neue Strawberry-Reasoning-Technologie und die neuesten Nachrichten und Kontroversen rund um OpenAI. Entdecken Sie, wie KI Bildung, Videoproduktion und vieles mehr transformiert. Bleiben Sie auf dem Laufenden über die schnelllebige Welt der KI-Nachrichten und -Entwicklungen.
13. Januar 2025
Entdecken Sie die neuesten Fortschritte in der künstlichen Intelligenz, vom Fortschritt von OpenAI in Richtung AGI bis hin zur Veröffentlichung neuer KI-Modelle und -Tools, die Ihre Arbeit revolutionieren können. Dieser Blogbeitrag bietet einen umfassenden Überblick über die wichtigsten KI-Nachrichten und -Entwicklungen, die Sie kennen müssen.
Open AIs Fünf Stufen zum AGI
Erdbeere: Open AIs neue Reasoning-Technologie
Bedenken zu den Praktiken von Open AI
Mögliche Aktualisierungen des Dolly-Bildmodells
Neue Demos von Sora
HubSpots Ressourcen für den Einsatz von ChatGPT bei der Arbeit
Andre Karpathys neue Bildungsgesellschaft Eureka Labs
Anthropic veröffentlicht CLA für Android
Neue KI-Funktionen von Google: Gemini Answers, Google Vids und YouTube Music Sound Search
Kontroverse über KI-Trainingsdaten und gestohlene YouTube-Videos
Microsoft Designer-Integration in Apps
Mistol veröffentlicht Cod Stroll Mamba Language Model
Amazon startet den KI-Einkaufsassistenten Rufus
Meta schränkt multimodale Modelle in der EU ein
Steuerung von Stable Diffusion mit einem MIDI-Gerät
KI-App verwandelt Selfies in 3D-druckbare Charaktere
KI bestimmt Geschlecht genau aus Zahnröntgenaufnahmen
Open AI veröffentlicht GPT-4 Mini
Nvidia und Mistol kooperieren bei Mistol Nemo Model
Google-KI bei den Olympischen Spielen 2024 vertreten
Open AIs Fünf Stufen zum AGI
Open AIs Fünf Stufen zum AGI
Open AI hat fünf Stufen des Fortschritts in Richtung Künstlicher Allgemeiner Intelligenz (AGI) skizziert:
-
Chatbots und KI mit Konversationssprache: Diese Stufe repräsentiert den aktuellen Stand von Chatbots und Sprachmodellen wie ChatGPT, Claude und LLaMA.
-
Denker, die menschenähnliches Problemlösen können: Open AI behauptet, dass sie dieser Stufe sehr nahe sind, die Systeme umfasst, die auf menschlichem Niveau denken und Probleme lösen können.
-
Agenten oder Systeme, die in unserem Namen handeln können: Diese Stufe umfasst KI-Agenten, die Aufgaben wie Flugbuchungen, E-Mail-Beantwortung und andere Handlungen in unserem Namen ausführen können.
-
Innovatoren-KI, die bei der Erfindung helfen kann: KI-Systeme auf dieser Stufe können neuartige Ideen schaffen und den Erfindungsprozess unterstützen.
-
Organisationen und KI, die die Arbeit einer Organisation erledigen können: Die letzte Stufe umfasst KI-Systeme, die die Arbeit einer gesamten Organisation ausführen können.
Open AI glaubt, dass sie sich derzeit an der Schwelle zur zweiten Stufe befinden und erwarten, diese Stufen auf dem Weg zur echten AGI zu durchlaufen.
Erdbeere: Open AIs neue Reasoning-Technologie
Erdbeere: Open AIs neue Reasoning-Technologie
Open AI arbeitet an einer neuen Reasoning-Technologie mit dem Codenamen "Strawberry". Laut einem durchgesickerten internen Dokument entwickeln Teams bei Open AI dieses Projekt mit dem Ziel, ein Modell zu schaffen, das nicht nur Antworten auf Anfragen generieren, sondern auch im Voraus planen und das Internet autonom für "tiefe Recherchen" nutzen kann.
Die Schlüsselfähigkeiten, die Open AI mit Strawberry anstrebt, umfassen:
- Durchführung von Aufgaben mit langem Zeithorizont und komplexen Problemen, die Planung und eine Reihe von Handlungen über einen längeren Zeitraum erfordern.
- Nutzung dieser Fähigkeiten, um Recherchen durchzuführen, indem das Internet autonom durchsucht wird, mit Unterstützung eines Computeragenten, der basierend auf seinen Erkenntnissen Handlungen ergreifen kann.
Während Details zum genauen Status von Strawberry begrenzt sind, scheint es ein bedeutender Schritt in Richtung des Ziels von Open AI zu sein, die fünf Stufen der KI-Fähigkeiten zu durchlaufen und sich der echten Künstlichen Allgemeinen Intelligenz (AGI) anzunähern. Das Projekt war zuvor als "QAR" bekannt, was jedoch nicht offiziell bestätigt wurde.
Bedenken zu den Praktiken von Open AI
Bedenken zu den Praktiken von Open AI
Open AI steht wegen seiner Geschäftspraktiken unter Beobachtung, wobei Whistleblower behaupten, das Unternehmen halte Mitarbeiter illegal davon ab, mit Regierungsbehörden über Probleme am Arbeitsplatz zu sprechen und entziehe ihnen ihre Rechte auf Belohnungen für Whistleblowing.
In einem Schreiben an den SEC-Vorsitzenden wird behauptet, dass Open AI eine Politik hat, die Mitarbeiter daran hindert, geschützte Offenlegungen zu machen. Dies ist nicht das erste Mal, dass die Richtlinien und Verträge von Open AI unter Beobachtung stehen, da das Unternehmen zuvor dafür bekannt war, Menschen zu zwingen, Nicht-Herabwürdigungs-Vereinbarungen zu unterzeichnen, die zum Verlust von Beteiligungsrechten führen könnten, wenn sie schlecht über das Unternehmen sprechen.
Während Open AI diese Anschuldigungen zurückweist und erklärt, dass sie eine Politik zum Schutz der Rechte von Whistleblowern haben, deuten die Berichte darauf hin, dass das Unternehmen aufgrund der zunehmenden öffentlichen Aufmerksamkeit und seines Wachstums seine Verträge überarbeiten könnte. Diese Anschuldigungen werfen Bedenken hinsichtlich des Umgangs von Open AI mit seinen Mitarbeitern und der Transparenz in Bezug auf mögliche Probleme innerhalb der Organisation auf.
Mögliche Aktualisierungen des Dolly-Bildmodells
Mögliche Aktualisierungen des Dolly-Bildmodells
Es gibt Spekulationen, dass das Dolly-Bildmodell von OpenAI möglicherweise kürzlich ein Update erhalten hat. Dies basiert auf Beobachtungen, dass sich die Fähigkeit des Modells, Text in Bilder einzubinden, verbessert hat, wobei der Text nun lesbarer erscheint als zuvor.
Insbesondere zeigt ein Beitrag des Nutzers "angry penguin" auf X (ehemals Twitter) ein von Dolly erstelltes Bild, das deutlich den Text "evolve" anzeigt - eine erhebliche Verbesserung im Vergleich zu den früheren Schwierigkeiten des Modells bei der Erzeugung lesbarer Texte.
Außerdem wird beobachtet, dass wenn man Dolly auffordert, ein Bild eines "Roboters zu erstellen, der ein Schild mit der Aufschrift Bitte abonnieren hält", der resultierende Text nun viel klarer erscheint als zuvor.
Diese Beobachtungen legen nahe, dass OpenAI möglicherweise Updates am Dolly-Modell vorgenommen und seine Textgenerierungsfähigkeiten verbessert haben könnte. Der Umfang und die Details möglicher Updates werden jedoch vom Unternehmen nicht offiziell bestätigt.
Es ist auch erwähnenswert, dass man, wenn man keinen Zugang zu einem ChatGPT Plus-Konto hat, das Dolly 3-Modell kostenlos auf der Bing Image Creator-Website nutzen kann. Dies könnte eine praktische Option für diejenigen sein, die das Dolly-Modell ohne ein kostenpflichtiges Abonnement ausprobieren möchten.
Neue Demos von Sora
Neue Demos von Sora
Wir erhalten mehr Demovideos von Sora, was die Leute nur noch ungeduldiger macht, es selbst in die Hand zu nehmen. Allerdings haben wir Werkzeuge wie Runway Gen 3 und Lumas Dream Machine, die ziemlich gute KI-generierte Videos erstellen können, was die Aufregung um Sora etwas gedämpft hat.
Trotzdem, da Sora viel längere Videos erstellen kann und Open AI bei fast allem, was sie herausbringen, den Standard setzt, bin ich immer noch aufgeregt darüber. Die neuen Demovideos, die auf Matthew Bermans X-Konto geteilt wurden, sehen ziemlich beeindruckend aus und zeigen Schwarz-Weiß-Clips und Szenen mit brechendem Ozean. Auch wenn wir einige Werkzeuge haben, um diesen Bedarf vorerst zu stillen, ist das Potenzial der Fähigkeiten von Sora nach wie vor hoch erwartet.
HubSpots Ressourcen für den Einsatz von ChatGPT bei der Arbeit
HubSpots Ressourcen für den Einsatz von ChatGPT bei der Arbeit
Wenn Sie jemand sind, der KI bei der Arbeit einsetzt oder darüber nachdenkt, KI bei der Arbeit einzusetzen, müssen Sie sich unbedingt das völlig kostenlose Paket von HubSpot mit dem Titel "Fünf unverzichtbare Ressourcen für den Einsatz von ChatGPT bei der Arbeit" ansehen.
Diese Ressource enthält:
- Interessante Flussdiagramme dazu, wann Sie ChatGPT einsetzen sollten oder nicht
- Eine Vorlage, um sicherzustellen, dass der von ChatGPT generierte Inhalt zur Marke passt
- Eine Checkliste zur Verfeinerung von KI-generiertem Inhalt
- Eine umfassende Checkliste für die Einführung von KI am Arbeitsplatz
- Eine Anleitung, wie Sie Ihren Tag mit ChatGPT aufpeppen können, einschließlich 100 Möglichkeiten, es heute auszuprobieren
Der Link zu dieser völlig kostenlosen Ressource von HubSpot befindet sich in der Beschreibung unten. Wenn Sie KI noch nicht eingesetzt haben, denken Sie daran, was Nvidia-CEO Jensen Huang gesagt hat - KI wird die transformativste Technologie des 21. Jahrhunderts sein und jede Branche und jeden Aspekt unseres Lebens beeinflussen. Wenn Sie KI also nicht nutzen, um Ihre Arbeit zu beschleunigen und zu verbessern, tun das Ihre Wettbewerber wahrscheinlich.
Andre Karpathys neue Bildungsgesellschaft Eureka Labs
Andre Karpathys neue Bildungsgesellschaft Eureka Labs
Andre Karpathy, der zuvor bei OpenAI gearbeitet und sich dann kürzlich zurückgezogen hat, hat gerade ein neues Unternehmen angekündigt, an dem er arbeitet. Er sagte, er sei "begeistert, mitteilen zu können, dass ich ein KI-plus-Bildungsunternehmen namens Eureka Labs gründe".
Bei Eureka Labs bauen sie eine neue Art von Schule auf, die "KI-native" ist. Sie sagen, dass Fachexperten, die tief engagiert, hervorragende Lehrer, unendlich geduldig und in allen Sprachen der Welt bewandert sind, sehr rar sind und nicht persönlich alle 8 Milliarden von uns auf Abruf unterrichten können.
Die Ankündigung legt nahe, dass Eureka Labs eine Online-Bildungsplattform schafft, bei der der Lehrer zwar weiterhin die Kursmaterialien erstellt, aber von einem KI-Lehrassistenten unterstützt, genutzt und skaliert wird. Dieser KI-Assistent ist darauf optimiert, die Studenten durch die Kursinhalte zu führen.
Während die Details begrenzt sind, scheint das Konzept zu sein, dass das Fachwissen und die Lehrmaterialien des Lehrers in das KI-Modell trainiert werden, so dass die KI den Studenten in jeder Sprache personalisierte Nachhilfe und Unterstützung bieten kann. Dies könnte die Reichweite und Wirkung einzelner Fachexperten enorm erweitern.
Anthropic veröffentlicht CLA für Android
Anthropic veröffentlicht CLA für Android
Wenn Sie ein Fan von Anthropics CLA sind und kein iPhone haben, dann gibt es gute Nachrichten - sie haben es gerade für Android veröffentlicht. Es ist schon seit ein paar Monaten auf iOS erhältlich und sie haben jetzt auch die Android-Version herausgebracht.
Persönlich bin ich immer noch etwas mehr Fan der ChatGPT-App, hauptsächlich weil der Sprachkonversationsteil der ChatGPT-App wirklich beeindruckend ist. Wenn ich am Computer bin, nutze ich normalerweise entweder CLA oder Perplexity. Aber wenn ich auf meinem Handy bin, tendiere ich immer noch zur ChatGPT-App.
Das gesagt, verstehe ich, dass die meisten Leute wahrscheinlich keine separaten Chat-Abonnements haben möchten. Wenn Ihnen also die Möglichkeit, sich mit einem KI-Assistenten zu unterhalten, wichtig ist, ist die ChatGPT-App immer noch die beste Wahl. Wenn Sie das aber nicht interessiert und Sie einfach das beste Modell in der Hand haben möchten, ist CLA wahrscheinlich die bessere Option. Und jetzt gibt es auch eine Android-App dafür.
Neue KI-Funktionen von Google: Gemini Answers, Google Vids und YouTube Music Sound Search
Neue KI-Funktionen von Google: Gemini Answers, Google Vids und YouTube Music Sound Search
Gemini, Googles KI-Assistent, beantwortet jetzt allgemeine Fragen, wenn Ihr Android-Smartphone gesperrt ist. Dieses Feature ermöglicht es Ihnen, schnell Informationen zu erhalten, ohne Ihr Gerät entsperren zu müssen.
Google hat außerdem Google Vids angekündigt, eine KI-gesteuerte Videoerzeugungsapp, die für die Arbeit konzipiert ist und tief in die Google Workspace-Suite integriert ist. Google Vids ermöglicht es Ihnen, Präsentationsvideos zu erstellen, indem Sie eine Aufforderung eingeben, einen Stil auswählen und eine Sprachaufnahme und Stockaufnahmen hinzufügen.
Außerdem führt YouTube eine neue Funktion namens YouTube Music Sound Search ein. Mit dieser Funktion können Sie ein Lied summen oder singen, und YouTube identifiziert den Titel. Es funktioniert ähnlich wie Shazam, ist aber direkt in die YouTube-Plattform integriert.
Diese neuen KI-gesteuerten Funktionen von Google zielen darauf ab, die Produktivität, Kreativität und Benutzererfahrung über verschiedene Google-Dienste und -Plattformen hinweg zu verbessern.
Kontroverse über KI-Trainingsdaten und gestohlene YouTube-Videos
Kontroverse über KI-Trainingsdaten und gestohlene YouTube-Videos
Es gab diese Woche etwas Kontroverse um die Herkunft der Trainingsdaten für verschiedene KI-Modelle. Ein Artikel auf Proof News behauptet, dass Apple, Nvidia und Anthropic Tausende von gestohlenen YouTube-Videos verwendet haben, um ihre KI-Modelle zu trainieren.
Das Problem entsteht aus einem Unternehmen namens Uther AI, das ein Open-Source-Projekt ist, das einen großen Datensatz namens "the Pile" aus öffentlich zugänglichen Daten sammelt. Es stellt sich heraus, dass ein erheblicher Teil dieser Daten direkt aus YouTube-Videos transkribiert wurde.
Viele YouTuber, darunter beliebte Ersteller wie MKBHD, Mr. Beast und PewDiePie, haben bemerkt, dass ihre Inhalte in diesem Datensatz verwendet wurden. Proof News hat sogar eine Suchmaschine erstellt, mit der Leute überprüfen können, ob ihre Videos enthalten sind.
Nachdem die Kontroverse bekannt wurde, hat Apple zwar eingeräumt, den Pile für einige Forschungszwecke verwendet zu haben, aber erklärt, dass das in Apple Intelligence verwendete Modell nicht auf diesen Daten trainiert wurde. Auch Microsofts Designer-Plattform, die KI zur Bildgenerierung nutzt, wurde mit der Verwendung von gestohlenen YouTube-Inhalten in Verbindung gebracht.
Die Verwendung von urheberrechtlich geschütztem Material ohne Genehmigung zum Training von KI-Modellen hat Bedenken hinsichtlich der ethischen und rechtlichen Auswirkungen dieser Praktiken aufgeworfen. Da sich die KI-Technologie weiterentwickelt, wird die Frage der Datenherkunft und der Rechte von Inhaltserstellern wahrscheinlich eine anhaltende Herausforderung für die Branche bleiben.
Microsoft Designer-Integration in Apps
Microsoft Designer-Integration in Apps
Microsoft hat seine Plattform namens Designer eingeführt, die sehr ähnlich wie Canva ist. Es ist eine Plattform zum Erstellen verschiedener Inhalte wie YouTube-Miniaturansichten, Banner-Anzeigen, Instagram-Bilder und mehr. Diese Designer-Plattform wird nun in eine Vielzahl von Microsoft-Apps integriert.
Die Schlüsselmerkmale dieser Integration um
FAQ
FAQ