Grok-1.5 modeli duyuruldu! GPT-4’ten daha mı iyi?

13 Nisan 2024Seher Alp

Ünlü iş insanı Elon Musk tarafından Mart 2023’te kurulan xAI şirketi, Grok adlı sohbet botu için Grok Grok-1.5 modelini duyurdu. İlk sürüme kıyasla oldukça gelişmiş olduğu paylaşılan bu modelin OpenAI tarafından geliştirilen GPT-4‘ten de daha performanslı olduğu söyleniyor. İşte Grok-1.5 modeli ile ilgili ayrıntılar…

Grok-1.5 modeli, GPT-4’ü geride bırakıyor!

xAI, resmi web sitesi üzerinden Grok-1.5 modelini duyurdu. Şirket tarafından paylaşılan bilgilere göre yeni model, artık belgeler, diyagramlar, çizelgeler, ekran görüntüleri ve fotoğraflar da dahil olmak üzere görsel işleyebiliyor.

Çok yönlü modlu modeller ile rekabet edebildiği belirtilen Grok-1.5 ile ilgili paylaşılan örneklere baktığımızda modelin tabloyu CSV’ye dönüştürme, koddaki hatayı çözme, diyagramı kodu dönüştürme ve meme açıklama gibi yetenekleriyle öne çıktığını görüyoruz.

Grok-1.5, xAI tarafından gerçekleştirilen MMMU testlerinde yüzde 53.6 oranında başarı elde etti. Karşılaştırma yapacak olursak, GPT-4 aynı testlerde yüzde 56.8 başarı sağladı. Ancak matematikle ilgili testlerde Grok-1.5, yüzde 52.8‘lik bir başarı elde ederek GPT-4‘ü geride bıraktı. Ayrıca xAI‘ın yeni modeli AI2D, metin okuma ve anlama ile gerçek dünya anlayışı testlerinde de rakiplerini zorladı.

Grok-1.5 ve rakip modellerin Benchmark sonuçları şu şekilde;

Benchmark	Grok-1.5V	GPT-4V	Claude 3 Sonnet	Claude 3 Opus	Gemini Pro 1.5
MMMU (Çok Disiplinli)	53.6%	56.8%	53.1%	59.4%	58.5%
Matematik	52.8%	49.9%	47.9%	50.5%	52.1%
AI2D	88.3%	78.2%	88.7%	88.1%	80.3%
Metin okuma	78.1%	78.0%	–	–	73.5%
ChartQA	76.1%	78.5%	81.1%	80.8%	81.3%
Belgeler	85.6%	88.4%	89.5%	89.3%	86.5%
Gerçek Dünya Anlayışı	68.7%	61.4%	51.9%	49.8%	67.5%

xAI, Grok-1.5 modelini yakın zamanda kullanıcılar ile test etmeye başlayacağını ve X‘teki Grok sohbet botuna entegre edeceğini açıkladı. Bilmeyenler için bu bota erişebilmek için X Premium abonesi olmak gerekiyor.

Peki siz bu konu hakkında neler düşünüyorsunuz? Grok-1.5 modelinin yeteneklerini ve Benchmark sonuçlarını nasıl buldunuz? Görüşlerinizi aşağıdaki Yorumlar kısmından bizimle paylaşabilirsiniz.

Bu mendil kanamaları durduruyor! Uzay şartlarında test edildi…

Güvenlik güçlerinin ihtiyaçları için geliştirilen kanama durdurma çözümü, NASA’nın uzay testi koşulları ile simüle edildiği Uzay Araştırmaları Merkezinde başarılı sınav verdi.

TECNO CAMON 30 Serisi Türkiye’de Resmi Olarak Piyasaya Sürüldü

Mobil Fotoğrafçılık Bir Sonraki Seviyeye Ulaşıyor

Çinli otomobil üreticisi BYD’nin beş milyonuncu yeni enerjili aracı üretildi

Çin’in önde gelen yeni enerjili araç (NEV) üreticisi BYD tarafından üretilen beş milyonuncu NEV, Çarşamba günü üretim hattından çıktı. BYD Yönetim Kurulu Başkanı Wang Chuanfu, şirketin aynı gün düzenlediği basın toplantısında, BYD’nin otomobil üretmeye başlamasından bu yana Çinli otomobil üreticilerinin başarılı olabileceğini kanıtlamak durumunda kaldığını söyledi. Üretilen beş milyonuncu otomobil olan Denza N7, Çin’in otomobil endüstrisinin gelişimi konusunda bir başka kilometre taşını işaret ediyor. Çin Binek Otomobil Birliği Genel Sekreteri Cui Dongshu, Çin’deki yeni enerjili binek otomobillerinin 2022 yılında dünyadaki yeni enerjili binek otomobil pazar payının yüzde 63’ünü oluşturduğunu söyledi. Cui, elektrifikasyon, istihbarat, ağ oluşturma ve paylaşıma yönelik küresel teknolojik ilerleme bağlamında, Çin’de üretilen NEV’lerin küresel otomotiv endüstrisindeki değişikliklere öncülük eden sağlam bir güç haline geldiğini sözlerine ekledi.

Related Posts

Bir yanıt yazın Yanıtı iptal et