ini Parti, kecerdasan buatan baru Google untuk membuat gambar fotorealistik

Kecerdasan buatan menjanjikan untuk menandai sebelum dan sesudah di banyak bidang, tetapi satu khususnya mengambil hampir semua pusat perhatian tahun ini. Pada bulan April kami berbicara tentang kemungkinan besar DALL-E 2AI yang mampu menghasilkan gambar dari teks. kemudian datang DALL-E Minipembangkit yang dia mengejutkan kami dengan ciptaannya yang mengigau. Sekarang giliran Parti, alternatif yang bertaruh pada model baru dan menjanjikan untuk menghasilkan gambar fotorealistik.

Tidak seperti DALL-E dan variannya, yang menggunakan model “broadcast” untuk menghasilkan gambar dari teks, Parti (Pathways Autoregressive Text-to-Image) mengandalkan model autoregressive yang memungkinkan input teks lebih panjang dan mampu melakukan komposisi kompleks. Seperti yang dapat kita lihat pada gambar unggulan, hasil Parti lebih seperti sebuah karya seni daripada figur amorf seperti yang ditawarkan oleh DALL-E Mini (gambar di bawah).

Dall E Mini

Gambar yang dihasilkan dengan Dall-E Mini

Pembuat gambar baru Google

Peneliti Google mengandalkan posting blog yang menguji Parti pada empat skala (350M, 750M, 3B, dan 20B) di bawah parameter yang sama, yaitu dengan input teks yang sama. Setelah pengujian, mereka menemukan bahwa skala yang terakhir terutama unggul pada petunjuk yang abstrak, membutuhkan pengetahuan tentang dunia, perspektif khusus, dan representasi simbol.

Googe Bagian 3

Gambar yang dihasilkan dengan Parti

Dalam salah satu upaya, mereka menggunakan teks masukan berikut: “Peta Amerika Serikat yang terbuat dari sushi. Itu ada di atas meja di sebelah segelas anggur merah (Peta Amerika Serikat yang terbuat dari sushi. Itu ada di atas meja di sebelah segelas anggur merah)”. Seperti yang bisa kita lihat, skala 350M menghadirkan representasi yang membingungkan, segalanya membaik di 750M, mereka menghadirkan “kreativitas” di 3B dan hasil yang luar biasa di 20B.

  Chau WhatsApp: itu akan berhenti bekerja pada ponsel ini mulai Oktober | Kronik

Kita juga dapat melihat tes di mana para peneliti mengevaluasi pekerjaan Parti dalam skenario kompleks yang berbeda. Mereka memasukkan teks “Potret harimau mengenakan topi kondektur kereta api dan memegang skateboard yang memiliki simbol yin-yang di atasnya (Potret seekor harimau dengan topi kondektur kereta api yang memegang papan luncur dengan simbol yin-yang)“.

Pesta 12

Gambar yang dihasilkan dengan Parti

Dan mereka meminta variasi fotografi, ilustrasi komik, lukisan cat minyak, patung marmer, dan lain-lain. Anehnya, AI menunjukkan kemampuannya untuk mematuhi format dan gaya gambar tertentu, meskipun tidak selalu dengan hasil yang baik. “Sementara Parti menghasilkan hasil berkualitas tinggi untuk berbagai indikasi, model ini tetap memiliki banyak keterbatasan,” tunjukkan dari Google.

Raksasa Mountain View akan terus melatih dan meningkatkan model AI-nya untuk “meningkatkan kreativitas dan produktivitas manusia.” Perlu dicatat bahwa untuk alasan keamanan (Google ingin mencegah penyalahgunaan), Parti tidak tersedia untuk umum, seperti DALL-E Mini, jadi kami tidak akan dapat membuat gambar kami sendiri dari teks. Namun, kita dibiarkan dengan alternatif untuk melihat sejumlah besar contoh di halaman proyek kamu lihat investigasi lengkapnya.

Di Xataka | Hakim pertama yang dibuat oleh kecerdasan buatan cukup tidak memihak. Kabar buruk (dan baik) untuk keadilan

Sumber