Microsoft hat DeepSpeed angekündigt, eine neue Deep-Learning-Bibliothek, die das Training sehr großer KI-Modelle unterstützen kann

Microsoft Research sorgte kürzlich für Aufsehen in der Forschungswelt der künstlichen Intelligenz (KI), als es die erfolgreiche Entwicklung von DeepSpeed ankündigte, einer Deep-Learning-Optimierungsbibliothek, mit der riesige KI-Modelle mit einer Skalierung von bis zu 100 Milliarden Parametern trainiert werden können.

Beim KI-Training ist die Genauigkeit umso höher, je größer die natürlichen Sprachmodelle sind. Allerdings nimmt das Training großer natürlichsprachlicher Modelle viel Zeit in Anspruch und die damit verbundenen Kosten sind nicht gering. DeepSpeed wurde geboren, um alle oben genannten Schwierigkeiten zu überwinden: Geschwindigkeit, Kosten, Trainingsumfang und Benutzerfreundlichkeit verbessern.

Darüber hinaus erwähnte Microsoft auch, dass DeepSpeed auch ZeRO (Zero Redundancy Optimizer) enthält, eine parallele Optimierungstechnik, die dazu beiträgt, den Ressourcenbedarf für Modelle zu minimieren und gleichzeitig die Anzahl der Parameter zu erhöhen. Zahlen können trainiert werden. Mit einer Kombination aus DeepSpeed und ZeRO konnten Microsoft-Forscher erfolgreich ein neues Turing Natural Language Generation (Turing-NLG)-Modell entwickeln – das derzeit größte Sprachmodell mit 17 Milliarden Parametern.

Einige Highlights von DeepSpeed:

Maßstab: Aktuelle große, fortschrittliche KI-Modelle wie OpenAI GPT-2, NVIDIA Megatron-LM und Google T5 haben einen Maßstab von 1,5 Milliarden, 8,3 Milliarden bzw. 11 Milliarden Parametern. ZeRO Stufe 1 in DeepSpeed kann Systemunterstützung für die Ausführung von Modellen mit bis zu 100 Milliarden Parametern bieten, was zehnmal größer ist als das größte Modell von Google.
Geschwindigkeit: Die aufgezeichneten Durchsatzsteigerungen variieren je nach Hardwarekonfiguration. Auf NVIDIA-GPU-Clustern mit Verbindungen mit geringer Bandbreite (ohne NVIDIA NVLink oder Infiniband) erreicht DeepSpeed eine 3,75-fache Durchsatzverbesserung im Vergleich zur alleinigen Verwendung von Megatron-LM für das Standard-GPT-2-Modell mit 1,5 Milliarden Parametern. Auf NVIDIA DGX-2-Clustern mit Verbindungen mit hoher Bandbreite ist DeepSpeed bei Modellen mit 20 bis 80 Milliarden Parametern drei- bis fünfmal schneller.
Kosten: Durch Geschwindigkeitsverbesserungen werden auch die Schulungskosten deutlich optimiert. Um beispielsweise ein Modell mit 20 Milliarden Parametern zu trainieren, benötigt DeepSpeed dreimal weniger Ressourcen als üblich.
Benutzerfreundlichkeit: Es sind nur wenige geringfügige Codeänderungen erforderlich, damit aktuelle Modelle auf die Verwendung von DeepSpeed und ZeRO umsteigen können. DeepSpeed erfordert kein Code-Redesign oder Modell-Refactoring.

Microsoft stellt sowohl DeepSpeed als auch ZeRO auf GitHub als Open-Sourcing zur Verfügung , siehe.

Einen Kommentar hinterlassen

Die ChatGPT-Task Force wird von Europa eingerichtet

Das Gremium, das die nationalen Datenschutzbeauftragten Europas vereint, gab am Donnerstag bekannt, dass es eine Task Force für ChatGPT eingerichtet habe

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

Dänische und amerikanische Wissenschaftler haben gemeinsam ein KI-System namens life2vec entwickelt, das den Zeitpunkt des menschlichen Todes mit hoher Genauigkeit vorhersagen kann.

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Ein KI-Algorithmus namens Audioflow kann auf das Geräusch des Urinierens hören, um abnormale Urinflüsse und entsprechende Gesundheitsprobleme des Patienten effektiv und erfolgreich zu identifizieren.

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Japans alternde und schrumpfende Bevölkerung hat dazu geführt, dass dem Land eine erhebliche Zahl junger Arbeitskräfte fehlt, insbesondere im Dienstleistungssektor.

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Ein Reddit-Benutzer namens u/LegalBeagle1966 ist einer von vielen Benutzern, die in Claudia verliebt sind, ein Mädchen wie ein Filmstar, das auf dieser Plattform oft verführerische Selfies, sogar nackte, teilt.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Microsoft hat gerade angekündigt, dass zwölf weitere Technologieunternehmen an seinem AI for Good-Programm teilnehmen werden.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Benutzer @mortecouille92 hat die Leistungsfähigkeit des Grafikdesign-Tools Midjourney genutzt und einzigartig realistische Versionen berühmter Dragon Ball-Charaktere wie Goku, Vegeta, Bulma und Elder Kame erstellt. .

7 Techniken zur Verbesserung von ChatGPT-Antworten

Durch einfaches Hinzufügen einiger Bedingungen oder Einrichten einiger Szenarien kann ChatGPT relevantere Antworten auf Ihre Fragen geben. Schauen wir uns einige Möglichkeiten an, wie Sie die Qualität Ihrer ChatGPT-Antworten verbessern können.

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Midjourney ist ein künstliches Intelligenzsystem, das aufgrund seiner äußerst schönen Gemälde, die denen echter Künstler in nichts nachstehen, in letzter Zeit in der Online-Community und der Künstlerwelt für „Fieber“ gesorgt hat.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Tage nachdem China den Ausbruch bekannt gegeben hatte, konnte das KI-System von BlueDot mit Zugriff auf weltweite Flugscheinverkaufsdaten die Ausbreitung des Wuhan-Corona-Virus nach Bangkok, Seoul, Taipeh und Tokio weiterhin genau vorhersagen.

Microsoft hat DeepSpeed ​​angekündigt, eine neue Deep-Learning-Bibliothek, die das Training sehr großer KI-Modelle unterstützen kann

Einen Kommentar hinterlassen

Die ChatGPT-Task Force wird von Europa eingerichtet

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

7 Techniken zur Verbesserung von ChatGPT-Antworten

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Microsoft hat DeepSpeed angekündigt, eine neue Deep-Learning-Bibliothek, die das Training sehr großer KI-Modelle unterstützen kann