Araştırmacılar sadece insanlar gibi dinlemek için AI antreman

Araştırmacılar sadece insanlar gibi dinlemek için AI antreman

Yapay zeka araştırmacıları insanların yaptığı gibi, tek başına ses girişinden konuşmasını anlamak için eğitim AI sistemleri kendi hedeflerine yönelik ilerleme kaydedilmektedir.

Şu anda, AI çoğunluğu sadece ilk metin haline çevirerek konuşma tanıyabilirsiniz. ilerleme bir sürü kelime hata oranlarının düşürülmesi ve dil desteği sayısının artırılması bakımından yapılmıştır.

Ancak, sahip AI MIT Bilgisayar Bilimi ve Yapay Zeka Laboratuvarı araştırmacıları görüntüleri ziyade metne haritalama konuşması ile ona doğru bir adım atmış bulunuyoruz böylece ses girişi üzerinden konuşma yalnız, bu aşamada bir büyük sıçrama olduğunu anlıyorum.

AI seni duyuyorum

Bu yüzeyde çok gibi gelmiyor, ama ifade o olabilirdi ne kadar büyük bir etki açıkça yapar ‘Bir resim bin kelimeye bedeldir’.

Sinir Bilgi İşleme Sistemleri toplantısında araştırmacılar yazdık bir kağıda dayalı bir sunum kendi yöntemini gösterdi.

onların araştırma arkasındaki fikir birkaç kelime tek bir akraba görüntünün altında toplanabilir eğer AI sıkı bir eğitim ihtiyaç duymadan “muhtemel” çeviri yapmak mümkün olmasıdır.

AI sistemleri için bir eğitim veri kümesi oluşturmak için, araştırmacılar 2.5 milyondan fazla görüntü 205 farklı konuda bölünmüş vardır Places205 veri kümesi kullanılmıştır. Araştırmacılar ses kayıtları aracılığıyla veri kümesi dört rastgele görüntüler her ne gördüm tanımlamak için insanların gruplar ödedi. Onlar 1163 kişiden üzerinde 120.000 başlıkları toplamak başardınız.

AI sonra en doğru çeviri seçmek için her eşleştirme benzerliği puanlama, ilgili görüntülere her yazısı kelimeleri bağlamak için eğitilmiştir. Bir başlık görüntüye alakalı ise düşük puan gerekir değilse bu, yüksek puan olmalıdır.

 

Testlerde, ağ veri tabanına kaydedilmiş bir resim açıklayan ses kayıtları beslenmiş ve en iyi ses başlık eşleşti on görüntüleri seçmek için istendi. Ne yazık ki, seçilen on görüntülerin dışarı doğru biri sadece zaman orada% 31 olacaktır.

onun anlaşılmasına yardımcı için herhangi bir metin veya dil veri olmadan kelimeleri tanımak için eğitim AI oldukça temel bir yolu olarak bu araştırmacılar için bir hayal kırıklığı skor.

Ancak, iyileştirme ile, bu konuşma tanıma yazılımı farklı dillere daha çabuk adapte ve çevirmek için öğretim yeni bir araç sağlamak yardımcı olabilir eğitim anlamına gelir inanılıyor. Görüntü tanıma Rosetta Stone tarafından sunulan böyle dil öğrenme yazılımı ile, zaten insan beyni üzerindeki yeni diller öğrenme nasıl çalıştığını görebiliyoruz.

araştırma, Jim Cam detaylandırma kağıt yazarlarından, “Bu çalışmanın amacı daha insanlar yapmak yolu gibi dil öğrenmek için makine almak için çalışmaktır.” dedi

denetimsiz öğrenme bu tür sağlanması eğitim AI çok daha fazla maliyet ve zaman etkin yanı sıra geniş topluma daha yararlı hale olabilir. Açıkçası olsa da, çok daha fazla gelişmeler bu mümkün önce gerçekleşmesi gerekir.

Sosyal Medyada Paylaş

Bunları Okudunuz mu?

Peki Siz Bu Konuda Ne Düşünüyorsunuz?