0850 441 46 28 info@imbt.net ATATÜRK MAH 865 SK NO:51/1 09:00-17:30
Son Haberler
TikTok'un sonsuz kaydırma özelliği yasaklanıyor mu? Getir’in kurucuları Mubadala’ya karşı büyük bir dava açtı Android Auto bildirim sorunu çözüldü: Yeni güncellenme nasıl yapılır? Microsoft'un "Jumpstart" bilmecesi: Dev üreticilere gizli baskı mı yapılıyor? OpenAI, GPT-4o modelini yayından kaldırıyor Android 17 güncellemesi alacak Xiaomi, Redmi ve POCO modelleri! İki bakanlıktan ortak influencer eğitimi 2026 Model Dacia Sandero Stepway Türkiye'de: İşte Fiyatı ve Özellikleri! Bedeli Çok Ağır Olmuş: 119 GB'lık GTA 5'in Boyutu 2.5 GB'a Düşürüldü Yapay zekâ en zor matematik sınavından nasıl sonuç aldı? “First Proof” sonuçları tartışma yarattı Yakın Gelecekte Ekran Kartı Bulmakta da Zorlanacağız! Yapay Zekâ Ekran Kartı Pazarını da Ele Geçirdi... Ucuz MacBook'tan Yeni Bilgiler Geldi: İşte Cihazda Beklediğimiz Tüm Özellikler TikTok'un sonsuz kaydırma özelliği yasaklanıyor mu? Getir’in kurucuları Mubadala’ya karşı büyük bir dava açtı Android Auto bildirim sorunu çözüldü: Yeni güncellenme nasıl yapılır? Microsoft'un "Jumpstart" bilmecesi: Dev üreticilere gizli baskı mı yapılıyor? OpenAI, GPT-4o modelini yayından kaldırıyor Android 17 güncellemesi alacak Xiaomi, Redmi ve POCO modelleri! İki bakanlıktan ortak influencer eğitimi 2026 Model Dacia Sandero Stepway Türkiye'de: İşte Fiyatı ve Özellikleri! Bedeli Çok Ağır Olmuş: 119 GB'lık GTA 5'in Boyutu 2.5 GB'a Düşürüldü Yapay zekâ en zor matematik sınavından nasıl sonuç aldı? “First Proof” sonuçları tartışma yarattı Yakın Gelecekte Ekran Kartı Bulmakta da Zorlanacağız! Yapay Zekâ Ekran Kartı Pazarını da Ele Geçirdi... Ucuz MacBook'tan Yeni Bilgiler Geldi: İşte Cihazda Beklediğimiz Tüm Özellikler

Gemini 3 Flash'ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, Gemini gibi ileri seviye modellerin genellikle dünyayı tek bir statik bakışta işlediğini belirtiyor. Bu modeller, mikroçipteki seri numarası veya

28.01.2026 09:00 2 dk okuma 13 görüntülenme
Gemini 3 Flash'ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash için Agentic Vision yeteneklerini duyurdu. Şirket, Gemini gibi ileri seviye modellerin genellikle dünyayı tek bir statik bakışta işlediğini belirtiyor. Bu modeller, mikroçipteki seri numarası veya uzaktaki bir sokak levhası gibi ince ayrıntıları kaçırırlarsa, tahmin yapmak zorunda kalıyor. Gemini 3 Flash'taki Agentic Vision ise görüntü anlamayı statik bir eylemden ajansal bir sürece dönüştürüyor. Agentic Vision'ı Gemini 3 Flash modelinin, cevapları görsel kanıtlara dayandırarak görüntüyle ilgili görevleri daha doğru hale getirmek için geliştirdiği yeni bir yetenek olarak tanımlayabiliriz. 

Model, görsel muhakemeyi, Agentic Vision tarafından desteklenen ilk araçlardan biri olan kod yürütme ile birleştirerek, görüntüleri adım adım yakınlaştırmak, incelemek ve işlemek için planlar oluşturuyor. Şirketin belirttiğine göre; Gemini 3 Flash ile kod yürütmeyi etkinleştirmek, çoğu görme ölçütünde (benchmarkında) tutarlı bir şekilde yüzde 5 ila 10 arasında kalite artışı sağlıyor. 

Agentic Vision, özellikle “Düşün, Harekete Geç, Gözlemle" döngüsünü kullanıyor. Düşün adımında model, kullanıcı sorgusunu ve ilk görüntüyü analiz ederek çok adımlı bir plan oluşturuyor. Hareket et adımında model, görüntüleri aktif olarak işlemek veya analiz etmek için Python kodu oluşturuyor ve bu kodu çalıştırıyor. Gözlemle adımında ise dönüştürülen görüntü, modelin bağlam penceresine ekleniyor. Bu son adım, modelin nihai yanıtı oluşturmadan önce yeni verileri daha iyi bir bağlamda incelemesini sağlıyor.

Şirketin paylaştığı bilgilere göre Gemini 3 Flash, kendisine verilen bir görüntüyü sadece tanımlamanın ötesinde, kod çalıştırarak doğrudan tuval üzerine çizim yapabiliyor ve böylece mantığını temellendirebiliyor. Bununla beraber, Gemini 3 Flash, görüntüdeki ince ayrıntıları algıladığında yakınlaştırıyor. Agentic Vision'ın yüksek yoğunluklu tabloları ayrıştırabildiği ve bulguları görselleştirmek için Python kodunu çalıştırabildiği de belirtiliyor. Kısacası görsellere zoom yapabilen, bir görselde bulunan elin parmaklarını sayabilen ve aritmetik hesaplar yapabilen bir görme yeteneğinden söz ediyoruz. 

Agentic Vision yeteneği, Thinking modeli ile Gemini uygulamasına sunulmaya başlanıyor. Geliştiriciler, bu yeni yeteneğe Google AI Studio ve Vertex AI'daki Gemini API ile erişebilir. 

Teklif Al