Gemma2-2B: Mai Mic, Mai Sigur, Mai Transparent: Avansând AI Responsabil cu Gemma

Jul 31, 2024

Creează chatbotul personalizat cu BotGPT!

Poți construi chatbotul pentru suport clienți în câteva minute.

AI are potențialul de a aborda unele dintre cele mai urgente provocări ale umanității, dar acest lucru se poate întâmpla doar dacă toată lumea are acces la instrumentele necesare. De aceea Google a introdus Gemma la începutul acestui an—o familie de modele deschise, ușoare și de vârf, dezvoltate folosind aceleași cercetări și tehnologii din spatele modelelor Gemini. Gama Gemma s-a extins de atunci pentru a include CodeGemma, RecurrentGemma și PaliGemma, fiecare proiectat pentru sarcini specifice de AI și ușor accesibil prin parteneriate cu platforme precum Hugging Face, NVIDIA și Ollama.

Google lansează acum oficial Gemma 2 pentru cercetători și dezvoltatori din întreaga lume. Disponibil în dimensiuni de 9 miliarde (9B) și 27 miliarde (27B) de parametri, Gemma 2 depășește și este mai eficient în inferență decât predecesorul său, cu îmbunătățiri semnificative în ceea ce privește siguranța. La 27B, oferă alternative competitive la modele de peste două ori dimensiunea sa, atingând niveluri de performanță care erau posibile anterior doar cu modele proprietare, începând din decembrie. Această performanță este acum realizabilă pe un singur GPU NVIDIA H100 Tensor Core sau pe un gazdă TPU, reducând semnificativ costurile de desfășurare.

Gemma este o familie de modele deschise, ușoare și de vârf de la Google, construite din aceleași cercetări și tehnologii utilizate pentru a crea modelele Gemini. Acestea sunt modele de limbaj mare, text-la-text, doar decoder, disponibile în limba engleză, cu greutăți deschise, variante pre-antrenate și variante ajustate prin instrucțiuni. Modelele Gemma sunt bine adaptate pentru o varietate de sarcini de generare a textului, inclusiv răspunsuri la întrebări, rezumate și raționare. Dimensiunea lor relativ mică le face posibile a fi desfășurate în medii cu resurse limitate, cum ar fi un laptop, desktop sau propria infrastructură cloud, democratizând accesul la modele AI de vârf și ajutând la stimularea inovației pentru toată lumea.

Gemma 2: Un Nou Standard de Model Deschis pentru Eficiență și Performanță

Gemma 2 este construit pe o arhitectură reproiectată, concepută pentru performanță excepțională și eficiență în inferență. Iată ce o deosebește:

Performanță Excepțională

La 27B, Gemma 2 oferă cea mai bună performanță în clasa sa de dimensiune, oferind alternative competitive la modele de mai mult de două ori dimensiunea sa. Modelul Gemma 2 de 9B oferă, de asemenea, performanță de clasă superioară, depășind Llama 3 8B și alte modele deschise din categoria sa. Pentru o detaliere a performanței, consultă raportul tehnic.

Eficiență Neîntrecută și Economii de Costuri

Modelul Gemma 2 de 27B este conceput pentru a rula inferență eficient la precizie completă pe un singur gazdă Google Cloud TPU, GPU NVIDIA A100 80GB Tensor Core sau GPU NVIDIA H100 Tensor Core. Acest lucru reduce semnificativ costurile, menținând în același timp o performanță ridicată, făcând desfășurările AI mai accesibile și prietenoase cu bugetul.

Inferență Rapidă pe Diferite Hardware

Gemma 2 este optimizată pentru a rula la viteze incredibile pe diverse platforme hardware, de la laptopuri de gaming puternice și desktopuri high-end, până la configurații bazate pe cloud. Poți încerca Gemma 2 la precizie completă în Google AI Studio, debloca performanța locală cu versiunea cuantificată folosind Gemma.cpp pe CPU-ul tău sau rula pe computerul tău acasă cu un NVIDIA RTX sau GeForce RTX prin Hugging Face Transformers.

Gemma 2 benchmarks

Benchmark-uri Gemma 2

Gemma 2 2B: Experimentează Performanța de Next-Gen, Acum pe Dispozitive

În iunie, lansarea Gemma 2 a marcat un moment semnificativ în lumea AI, introducând două noi modele cu 27 de miliarde (27B) și 9 miliarde (9B) de parametri. Aceste modele au atras rapid atenția pentru performanța lor, în special modelul de 27B, care a câștigat popularitate pe tabloul de clasament LMSYS Chatbot Arena. Nu doar că a excelat, dar a depășit și alte modele populare de peste două ori dimensiunea sa în conversații reale.

Succesul Gemma 2 nu se datorează doar performanței sale. Dezvoltarea Gemma este profund înrădăcinată în principiile AI responsabile, punând accent pe siguranță și accesibilitate. Această angajare față de AI responsabil a dus la introducerea a trei noi adăugiri incitante la familia Gemma 2:

Gemma 2 2B – O nouă iterație a modelului cu 2 miliarde (2B) de parametri, având caracteristici avansate de siguranță și un echilibru optim între performanță și eficiență.
ShieldGemma – O suită de modele clasificate de conținut pentru siguranță, concepute pentru a filtra intrările și ieșirile modelului AI, asigurând siguranța utilizatorului.
Gemma Scope – Un instrument de interpretabilitate care oferă perspective fără precedent asupra funcționării interne a modelelor AI.

Aceste noi instrumente permit cercetătorilor și dezvoltatorilor să creeze experiențe mai sigure pentru clienți, să obțină perspective mai profunde asupra modelelor AI și să desfășoare AI puternic în mod responsabil, fie pe dispozitive, fie în cloud, deschizând astfel noi posibilități pentru inovație.

Gemma 2 2B: Experimentează Performanța de Next-Gen, Acum pe Dispozitive

Modelul Gemma 2 2B, o adăugire foarte așteptată la linia Gemma 2, este acum disponibil. Acest model ușor obține rezultate remarcabile printr-un proces numit distilare, unde învață de la modele mai mari. În ciuda dimensiunii sale mai mici, Gemma 2 2B depășește toate modelele GPT-3.5 pe Chatbot Arena, demonstrând capacitățile sale excepționale în AI conversațional.

Scorurile tabloului de clasament LMSYS Chatbot Arena

*Scorurile tabloului de clasament LMSYS Chatbot Arena la 30 iulie 2024. Scor Gemma 2 2B ± 10.*

Gemma 2 2B: Avantajele Cheie

Gemma 2 2B oferă mai multe avantaje esențiale:

Performanță Excepțională: Acest model oferă performanțe de top pentru dimensiunea sa, depășind alte modele open din categoria sa.
Implementare Flexibilă și Rentabilă: Poate rula eficient pe o gamă largă de hardware, de la dispozitive edge și laptopuri la medii cloud robuste, precum Vertex AI și Google Kubernetes Engine (GKE). Modelul este optimizat cu biblioteca NVIDIA TensorRT-LLM și este disponibil ca NIM NVIDIA, sprijinind desfășurările în centre de date, cloud, stații de lucru locale, PC-uri și dispozitive edge utilizând GPU-uri NVIDIA RTX, NVIDIA GeForce RTX sau module NVIDIA Jetson. În plus, se integrează perfect cu Keras, JAX, Hugging Face, NVIDIA NeMo, Ollama, Gemma.cpp și, în curând, MediaPipe.
Deschis și Accesibil: Modelul este disponibil conform termenilor Gemma prietenoși cu comercianții, atât pentru aplicații de cercetare, cât și comerciale. Este suficient de compact pentru a rula pe nivelul gratuit al GPU-urilor T4 în Google Colab, facilitând experimentarea și dezvoltarea mai mult ca niciodată.

Începând de astăzi, greutățile modelului pentru Gemma 2 pot fi descărcate de pe Kaggle, Hugging Face și Vertex AI Model Garden. Utilizatorii pot explora, de asemenea, capacitățile sale în Google AI Studio.

ShieldGemma: Protejând Utilizatorii cu Clasificatori de Siguranță de Vârf

Asigurarea că ieșirile AI sunt captivante, sigure și inclusive necesită un efort semnificativ. Pentru a sprijini dezvoltatorii în această activitate, a fost introdus ShieldGemma. ShieldGemma constă din clasificatori avansați de siguranță, proiectați pentru a detecta și a atenua conținutul dăunător în intrările și ieșirile modelului AI. Acești clasificatori se concentrează pe patru domenii critice de daune:

Discurs de ură
Hărțuire
Conținut sexual explicit
Conținut periculos

Acești clasificatori deschiși îmbunătățesc Toolkit-ul existent pentru AI Responsabil, care include metodologii pentru construirea de clasificatori adaptați la politici specifice cu date limitate, alături de clasificatori gata de utilizare de la Google Cloud, disponibili prin API.

ShieldGemma

Figura 1: ShieldGemma

ShieldGemma oferă mai multe beneficii pentru crearea de aplicații AI mai sigure:

Performanță de Vârf: Bazat pe Gemma 2, ShieldGemma reprezintă clasificatorii de siguranță de vârf din industrie.
Dimensiuni Flexibile: Disponibil în diverse dimensiuni pentru a satisface nevoile diverse. Modelul 2B este ideal pentru sarcini de clasificare online, în timp ce modelele de 9B și 27B oferă performanțe superioare pentru aplicații offline, unde latența nu este o problemă. Toate modelele beneficiază de optimizări de viteză NVIDIA pentru performanță eficientă pe diverse hardware-uri.
Deschis și Colaborativ: Natura deschisă a ShieldGemma promovează transparența și colaborarea în cadrul comunității AI, contribuind la viitorul standardelor de siguranță din industria învățării automate.

„Pe măsură ce AI continuă să se maturizeze, întreaga industrie va trebui să investească în dezvoltarea evaluatorilor de siguranță de înaltă performanță. Suntem încântați să vedem Google făcând această investiție și așteptăm cu nerăbdare continuarea implicării lor în Grupul nostru de Lucru pentru Siguranța AI.”
~ Rebecca Weiss, Director Executiv, ML Commons

ShieldGemma

Rezultatele evaluării bazate pe F1 optim (stânga) și AU-PRC (dreapta), cu scoruri mai mari fiind mai bune, folosește 𝛼=0 și T=1 pentru calculele probabilităților. ShieldGemma (SG) Prompt și SG Response sunt seturi de date interne de testare, în timp ce OpenAI Mod/ToxicChat servesc ca benchmark-uri externe. Performanța modelului de bază pe seturi de date externe este sursă din Ghosh et al. (2024) și Inan et al. (2023).

Pentru mai multe informații despre ShieldGemma

Pentru mai multe informații despre ShieldGemma, inclusiv rezultatele complete ale evaluării, consultați raportul tehnic și începeți să construiți aplicații AI mai sigure cu ajutorul cuprinzătorului Toolkit pentru AI Generativ Responsabil.

Gemma Scope: Iluminând Deciziile AI cu Autoencodere Sparse Deschise

Gemma Scope oferă un nivel fără precedent de transparență în procesele de decizie ale modelelor Gemma 2. Acționând ca un microscop puternic, Gemma Scope utilizează autoencodere sparse (SAE) pentru a se concentra pe puncte specifice din model, făcând funcționarea sa internă mai interpretabilă.

SAE sunt rețele neuronale specializate care transformă informațiile dense și complexe procesate de Gemma 2 într-o formă mai analizabilă. Studiind aceste viziuni extinse, cercetătorii pot obține informații valoroase despre modul în care Gemma 2 identifică modele, procesează informații și face predicții. Scopul Gemma Scope este de a ajuta comunitatea de cercetare AI să dezvolte sisteme AI mai ușor de înțeles, responsabile și fiabile.

Caracteristicile cheie ale Gemma Scope includ:

SAE Deschise: Peste 400 de SAE disponibile gratuit, acoperind toate straturile Gemma 2 2B și 9B.
Demonstrații Interactives: Utilizatorii pot explora caracteristicile SAE și analiza comportamentul modelului fără a necesita scrierea de cod, folosind Neuronpedia.
Repository Ușor de Utilizat: Repository-ul include cod și exemple pentru interfațarea cu SAE și Gemma 2.

Pentru mai multe detalii despre Gemma Scope, vizitați blogul Google DeepMind, consultați raportul tehnic și accesați documentația pentru dezvoltatori.

Un Viitor Construibil pe AI Responsabil

Lansarea acestor noi instrumente subliniază un angajament continuu de a oferi comunității AI resursele necesare pentru a construi un viitor în care AI-ul beneficiază pe toată lumea. Accesul deschis, transparența și colaborarea sunt considerate componente esențiale în dezvoltarea unui AI sigur și benefic.

Începeți Astăzi:

Experimentați puterea și eficiența Gemma 2 2B descărcând-o sau testând-o cu NVIDIA NIM sau Google AI Studio.
Explorați ShieldGemma și dezvoltați aplicații AI mai sigure.
Încercați Gemma Scope pe Neuronpedia și obțineți informații despre funcționarea internă a Gemma 2.

Alăturați-vă călătoriei către un viitor AI mai responsabil și benefic!

Bot Personalizat Gratuit ChatGPT cu BotGPT

Pentru a valorifica pe deplin potențialul LLM-urilor pentru nevoile dumneavoastră specifice, luați în considerare crearea unui chatbot personalizat adaptat la datele și cerințele dumneavoastră. Explorați BotGPT pentru a descoperi cum puteți profita de tehnologia avansată AI pentru a construi soluții personalizate și a vă îmbunătăți proiectele de afaceri sau personale. Prin îmbrățișarea capabilităților BotGPT, puteți rămâne cu un pas înainte în peisajul în evoluție al AI-ului și debloca noi oportunități de inovație și interacțiune.

Descoperiți puterea asistentului nostru virtual versatil, alimentat de tehnologia de vârf GPT, adaptat pentru a satisface nevoile dumneavoastră specifice.

Funcții

Îmbunătățiți Productivitatea: Transformați fluxul de lucru cu eficiența BotGPT. Începeți
Integrare Seamless: Integrați cu ușurință BotGPT în aplicațiile dumneavoastră. Aflați Mai Multe
Optimizați Crearea de Conținut: Creșteți procesul de creare și editare a conținutului cu BotGPT. Încercați Acum
Asistență Virtuală 24/7: Accesați BotGPT oricând, oriunde pentru suport instantaneu. Explorați Aici
Soluții Personalizabile: Adaptați BotGPT pentru a se potrivi perfect cerințelor afacerii dumneavoastră. Personalizați Acum
Informații Bazate pe AI: Descoperiți informații valoroase cu capabilitățile avansate ale BotGPT. Descoperiți Mai Multe
Deblocați Funcții Premium: Faceți upgrade la BotGPT pentru funcții exclusive. Faceți Upgrade Astăzi

Despre BotGPT

BotGPT este un chatbot puternic alimentat de tehnologia avansată GPT, conceput pentru integrare seamless pe diverse platforme. Îmbunătățiți productivitatea și creativitatea cu asistența virtuală inteligentă oferită de BotGPT.

Conectați-vă cu noi la BotGPT și descoperiți viitorul asistenței virtuale.