Gemini (dil modeli)

Gemini dil modeli, Google DeepMind tarafından geliştirilmiş olan ve LaMDA ve PaLM 2'nin ardılı olarak hizmet veren çok modlu büyük dil modelleri ailesinin adıdır. Gemini Ultra, Gemini Pro ve Gemini Nano'dan oluşan bu ürün, OpenAI'nin GPT-4'üne rakip olarak konumlandırılarak 6 Aralık 2023'te duyuruldu. Aynı adı taşıyan üretken yapay zeka sohbet robotunun ardındaki esas gücü oluşturmaktadır.

Google Gemini
Geliştirici(ler)Google DeepMind
İlk yayınlanma6 Aralık 2023
Erişilebilirlik46 dil[1]
239 ülke[1]
TürDil modeli
LisansSahipli yazılım
Resmî sitesihttps://deepmind.google

Tarihçe

Geliştirme Süreci

Google, 10 Mayıs 2023'teki Google I/O açılış konuşmasında, yan kuruluşu Google DeepMind tarafından geliştirilen büyük bir dil modeli (LLM) olan Gemini'yi duyurdu. Etkinlikte de tanıtılan PaLM 2'nin daha güçlü bir halefi olarak konumlandırıldı.[2]

Google CEO'su Sundar Pichai, Gemini'nin hâlâ erken gelişim aşamalarında olduğunu açıkladı. Diğer LLM'lerden farklı olarak Gemini'nin, yalnızca bir metin külliyatı üzerinde eğitilmemesi ve çok modlu olacak şekilde tasarlanması nedeniyle benzersiz olduğu söyleniyordu; bu, metin, resimler, ses, video ve bilgisayar kodları da dahil olmak üzere birden fazla veri türünü aynı anda işleyebileceği anlamına geliyordu.[3]

Google DeepMind olarak birleştirilen Google'ın iki kolu olan DeepMind ve Google Brain arasındaki işbirliğiyle geliştirildi[4][5] DeepMind CEO'su Demis Hassabis, Wired ile yaptığı bir röportajda, Gemini'nin gelişmiş yeteneklerinin övgüsünü yaptı; bu yeteneklerin, algoritmanın, Google'ın LaMDA ve Bard ile birlikte artan popülaritesine agresif bir şekilde meydan okuyan OpenAI'nin GPT-4 üzerinde çalışan ChatGPT'sini geride bırakmasına olanak sağlayacağına inandığını söyledi.[4][6]

Hassabis, 2016 yılında Go şampiyonu Lee Sedol'u yenerek dünya çapında ilgi gören DeepMind'ın AlphaGo programının güçlü yönlerini vurguladı ve Gemini'nin AlphaGo ve diğer Google – DeepMind LLM'lerin gücünü birleştireceğini açıkladı.[7]

Ağustos 2023'te The Information’ın yaptığı açıklamada Google, çoğu LLM'de bulunan konuşma metni yeteneklerini birleştirerek OpenAI ve diğer rakiplerini geçmeyi umuyordu. Yapay zeka destekli görüntü oluşturma özelliği, bağlamsal görüntüler oluşturmasına ve daha geniş bir kullanım senaryosuna uyarlanmasına olanak tanıyor.[8] Bard gibi[9] Google'ın kurucu ortağı Sergey Brin ise, Google Brain ve DeepMind'dan yüzlerce diğer eski mühendislerle birlikte Gemini'nin geliştirilmesine yardımcı olmak üzere emeklilikten çağrılıp Gemini'ye katkıda bulunan kişiler olarak anılmıştır.[10] Gemini, YouTube videolarının transkriptleri konusunda eğitim aldığından, adil kullanım materyalleri filtrelemek için deneyimli avukatlar çağrıldı.[8]

Lansman

6 Aralık 2023'te Pichai ve Hassabis, sanal bir basın toplantısında "Gemini 1.0"ı duyurdu. Üç modelden oluşuyordu: Gemini Ultra, "Son derece karmaşık görevler" için Gemini Pro, "çok çeşitli görevler" için ve Gemini nano ise “cihaz içi temel görevler" için kullanıcılara üç model sunuluyordu.[11] Lansman sırasında Gemini Pro ve Nano sırasıyla Pixel 8 akıllı telefonlara entegre edilecek, Gemini Ultra ise "Bard Advanced"ı güçlendirip geliştiriilerek sadece yazılım geliştiricileri için kullanımına sunulacak.[12]

Google'ın insan davranışlarını taklit etmek üzere tasarlanmış "en büyük ve en yetenekli yapay zeka modeli" olarak lanse edilen[13] Gemini'nin "kapsamlı güvenlik ihtiyacı" nedeniyle gelecek yıla kadar yaygın olarak kullanıma sunulmayacağını söyledi.[14]

Gemini, Google'ın Tensör İşleme Birimleri (TPU) üzerinde çalıştırılır ve bu birim tarafından desteklenir ve adı, NASA'nın Gemini Projesi'nin yanı sıra DeepMind-Google Brain birleşmesine de bir göndermedir[15] Gemini Ultra'nın çeşitli endüstri karşılaştırmada ise GPT-4, Anthropic'in Claude 2'si, Inflection AI'nin Inflection-2'sinden, Meta'nın LLaMA 2'sinden ve xAI'nin Grok 1'inden daha iyi performans gösterdiği söyleniyor.[16] Gemini Pro ise diğerlerinden daha iyi bir performans gösterdiği saptandı. Gemini Ultra aynı zamanda insan uzmanlardan daha iyi performans gösteren ilk dil modeliydi ve 57 konuluk Massive Multitask Language Understanding (MMLU) testinde 100 üzerinden 90 puan aldı.[17]

Gemini Pro, 13 Aralık'ta AI Studio ve Vertex AI aracılığıyla Google Cloud müşterilerinin kullanımına sunulacak, Gemini Nano ise Android geliştiricilerinin kullanımına sunulacak.[18]

Hassabis ayrıca DeepMind'ın Gemini'nin "dünyayla fiziksel etkileşime geçmek için robotikle nasıl birleştirilebileceğini" araştırdığını açıkladı.[19]

Google, ABD tarafından imzalanan idari emir uyarınca Gemini Ultra'nın test sonuçlarını ABD federal hükûmetiyle paylaşacağını belirtti. Başkan Joe Biden Ekim ayında. Benzer şekilde şirket, Kasım ayında Bletchley Park'ta düzenlenen Yapay Zeka Güvenlik Zirvesi'nde ortaya konan ilkelere uymak için Birleşik Krallık hükûmetiyle görüşmelerde bulunuyor.[3]

Güncellemeler

Google, Ocak 2024'te Gemini Nano ve Gemini Pro'yu Galaxy S24 akıllı telefon serisine entegre etmek için Samsung ile anlaşmıştı.[20]

Önceki ay Google, 1.0 Ultra'dan daha güçlü ve yetenekli bir model olarak konumlanan "Gemini 1.5"i sınırlı versiyon ile piyasaya sürdü.. Aynı ay Google, Gemini'nin lite versiyonu diye tabir edilen ücretsiz ve açık kaynaklı Gemma'yı piyasaya sürdü.[21]

Ayrıca bakınız

  • Gato
  • Gemini
  • Gemma (chatbot)
  • XAI (şirket)
  • Grok
  • OpenAI

Kaynakça

  1. ^ a b "Where you can use Bard". Google Support. 12 Mayıs 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 13 Temmuz 2023. 
  2. ^ "Every major AI feature announced at Google I/O 2023". ZDNET (İngilizce). 10 Mayıs 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  3. ^ a b Milmo, Dan; editor, Dan Milmo Global technology (6 Aralık 2023). "Google says new AI model Gemini outperforms ChatGPT in most tests". The Guardian (İngilizce). ISSN 0261-3077. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  4. ^ a b Levy, Steven. "Sundar Pichai on Google's AI, Microsoft's AI, OpenAI, and … Did We Mention AI?". Wired (İngilizce). ISSN 1059-1028. 11 Eylül 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  5. ^ "About Google DeepMind". Google DeepMind (İngilizce). 17 Nisan 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  6. ^ "Google's Bard builds on controversial LaMDA bot that engineer called 'sentient'". ZDNET (İngilizce). 5 Eylül 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  7. ^ Knight, Will. "Google DeepMind CEO Demis Hassabis Says Its Next Algorithm Will Eclipse ChatGPT". Wired (İngilizce). ISSN 1059-1028. 26 Haziran 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  8. ^ a b "The forced marriage at the heart of Google's AI race". The Information. 15 Ağustos 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  9. ^ "Google ChatGPT artifical intelligence". Nytimes. 20 Ocak 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 20 Ocak 2023. 
  10. ^ Seetharaman, Miles Kruppa and Deepa. "WSJ News Exclusive | Sergey Brin Is Back in the Trenches at Google". WSJ (İngilizce). 21 Temmuz 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  11. ^ Kruppa, Miles. "Google Announces AI System Gemini After Turmoil at Rival OpenAI". WSJ (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  12. ^ Edwards, Benj (6 Aralık 2023). "Google launches Gemini—a powerful AI model it says can surpass GPT-4". Ars Technica (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  13. ^ Thorbecke, Brian Fung, Catherine (6 Aralık 2023). "Google launches Gemini, its most-advanced AI model yet, as it races to compete with ChatGPT | CNN Business". CNN (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  14. ^ "Google launches Gemini, upping the stakes in the global AI race - CBS San Francisco". www.cbsnews.com (İngilizce). 6 Aralık 2023. 7 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  15. ^ Pierce, David (6 Aralık 2023). "Google launches Gemini, the AI model it hopes will take down GPT-4". The Verge (İngilizce). 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  16. ^ "Google DeepMind Unveils Its Most Powerful AI Offering Yet". TIME (İngilizce). 6 Aralık 2023. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  17. ^ Knight, Will. "Google Just Launched Gemini, Its Long-Awaited Answer to ChatGPT". Wired (İngilizce). ISSN 1059-1028. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  18. ^ "Google Opens Access to Gemini, Racing to Catch Up to OpenAI". Bloomberg.com (İngilizce). 6 Aralık 2023. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  19. ^ Knight, Will. "Google DeepMind's Demis Hassabis Says Gemini Is a New Breed of AI". Wired (İngilizce). ISSN 1059-1028. 6 Aralık 2023 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  20. ^ Chokkattu, Julian. "Samsung's Galaxy S24 Phones Call on Google's AI to Spruce Up Their Smarts". Wired (İngilizce). ISSN 1059-1028. 29 Şubat 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024. 
  21. ^ "Google Delves Deeper Into Open Source with Launch of Gemma AI Model". Bloomberg.com (İngilizce). 21 Şubat 2024. 21 Şubat 2024 tarihinde kaynağından arşivlendi. Erişim tarihi: 17 Nisan 2024.