Google Bert Güncellemesi Yayınlandı
Google Search’te 15 yıldır çalışmaktan öğrendiğim bir şey varsa, o da insanların merakları sonsuz olduğudur. Her gün milyarlarca arama görmekteyiz ve sözkonusu sorguların yüzde 15’i daha önce hiç görmediklerimizdendir bu nedenle, tahmin edemediğimiz sonuçları getirmek için çözümler inşa ettik. Sen veya ben gibi insanlar Search’e geldiklerinde, bir sorguyu en iyi şekilde formüle etme yolunun ne olduğu hususunda her zaman tam olarak emin değiliz. Kelimelerin doğru kullanımlarını ya da bir şeyin nasıl heceleneceğini bilebiliriz, çünkü çoğu zaman, Search’e öğrenmek için gelmekteyiz-başlamak için gerekli olan bilgiye sahip değiliz.
Search, özünde dili anlamakla alakalıdır. Sorgunuzda kelimeleri nasıl heceler ya da kombine ederseniz edin, neyi aradığınızı çözmek ve web’den yararlı bilgiyi ortaya çıkarmak bizim işimizdir.
Yıllar boyunca dili anlama kapasitemizi geliştirmeye devam ederken, özellikle karmaşık ve konuşmalarla alakalı sorgular sözkonusu olduğunda, bazen tam manasıyla doğru yapamayabiliyoruz. Aslında, insanların sık sık “keyword-ese” veya “anlayacağımızı düşündükleri sözcük dizilerini yazarak, ancak aslında doğal olarak bir soru sormayarak” kullanma sebebi budur.
Dil anlama bilimindeki araştırma ekibimizdeki son ilerlemelerle-makine öğrenimi sayesinde mümkün olan- sorguları anlamada, son beş yılda öne çıkan en büyük gelişimi ve Search tarihinde öne çıkan en büyük sıçramayı temsil etme konusunda önemli bir gelişme kaydetmekteyiz.
BERT modellerini Search’e Uygulamak
Geçtiğimiz yıl, sinir ağına dayalı, Transformatörlerden Çift Yönlü Kodlayıcı Temsilciliği ya da kısaca BERT olarak isimlendirdiğimiz doğal dil işleme (NLP) ön-eğitim sinir tekniğini tanıttık ve açık kaynak haline getirdik. Bu teknoloji, herhangi bir kişiye, kendi teknoloji harikası bir sorulara cevap sistemini eğitmelerini mümkün kılmaktadır.
Bu buluş,dönüştürücüler üzerindeki Google araştırmasının bir sonucuydu: cümle içindeki tüm diğer sözcüklerle ilgili kelimeleri sırayla değil, tek tek işleyen modeller. Bu nedenle, BERT modelleri, bir kelimenin tam anlamıyla, kendisinden önce ve sonra gelen kelimelere bakarak değerlendirebilmektedir-arama sorgularının arkasındaki amacı anlamak için özellikle yararlıdır.
Ancak bunu mümkün kılan sadece yazılımdaki gelişmeler değildir: Yeni bir donanıma da ihtiyacımız vardı. BERT ile inşa edebileceğimiz bazı modeller o kadar karmaşık ki, geleneksel donanımlar kullanarak yapabileceklerimizin sınırlarını zorlamaktadır, nu nedenle, daha ilk kez, arama sonuçlarını iletmek ve daha mantıklı bilgileri hızlı bir şekilde sizlere sunmak için en son Bulut TPU’larını kullanmaktayız.
Sorgularınızı kırmak
Dolayısıyla, bir sürü teknik detay mevcuttur, ancak bunların sizin için anlamı nedir? Şöyle ki, Search’te hem sıralamada hem de özellik taşıyan parçalara BERT modelleri uygulayarak, faydalı bilgiler bulmanıza yardımcı olmak adına çok daha iyi bir iş yapabiliriz. Sıralama sonuçları söz konusu olduğunda esasen, BERT, Search’e ABD’deki 10 aramadan birini İngilizce’de daha iyi anlaması için yardımcı olacaktır ve ayrıca bunu zamanla daha fazla dile ve yerel konuma uygulayacağız.
Özellikle, “için” ve “-mek” edatlarının çok sayıda anlam ifade edebildiği daha uzun ve daha fazla konuşma metninin geçtiği sorgu ve aramalar için, Search sorgunuzdaki kelimelerin içeriğini anlayabilecektir. Sizin için doğal hissi verecek ir arama yapabilirsiniz.
Bu gelişmeleri başlatmak için, değişikliklerin fiili olarak daha faydalı olmasını sağlamak adına birçok test gerçekleştirdik. İşte, BERT’in aramanızın amacını anlama yeteneğini gösteren değerlendirme sürecimizi gösteren örneklerden bazıları.
İşte burada, “2019 Brezilya gezgini ABD’ye vize ihtiyacı duymaktadır” gibi bir arama vardır. “-e” ifadesi ve bu ifadenin sorguda diğerleriyle olan ilişkisi anlamı kavramak için özellikle önemlidir. Bu, tersi doğru olmamakla birlikte, Amerika’ya seyahat eden Brezilyalılar hakkındadır. Önceden, algoritmalarımız bu bağlantının önemini algılayamamaktaydı ve Brezilya’ya seyahat eden Amerika vatandaşları hakkında sonuçlar almaktaydık. BERT ile, Search bu nüansı kavrayabilmekte ve yaygın bir şekilde bilinen “-e” ifadesinin burada çok önemli olduğunu bilmektedir. Böylece bu sorgu için çok daha alakalı bir sonuç sağlayabilmekteyiz.
Kaynak : https://www.blog.google/products/search/search-language-understanding-bert/