Jakarta, Unbox.id — OpenAI mengumumkan model AI generatif andalan baru pada hari Senin yang mereka sebut GPT-4o. Di mana huruf “o” adalah singkatan dari “omni”, mengacu pada kemampuan model tersebut untuk menangani teks, ucapan, dan video.
GPT-4o akan meluncur “secara berulang” di seluruh pengembang perusahaan dan produk konsumen selama beberapa minggu ke depan. CTO OpenAI Mira Murati mengatakan bahwa GPT-4o mampu meningkatkan kemampuan GPT-4 di berbagai modalitas dan media.
“GPT-4o mendukung suara, teks, dan penglihatan,” kata Murati dalam presentasi yang disiarkan secara langsung di kantor OpenAI di San Francisco pada hari Senin. “Dan ini sangat penting, karena kita melihat masa depan interaksi antara kita dan mesin.”
Kemampuan Canggih dari GPT-4o OpenAI Terbaru
GPT-4 Turbo, model “tercanggih” terdepan dari OpenAI sebelumnya, terlatih memproses kombinasi gambar dan teks dan dapat menganalisis gambar dan teks. Ia menyelesaikan tugas seperti mengekstrak teks dari gambar atau bahkan mendeskripsikan konten gambar tersebut.
Sementara itu, versi terbaru GPT-4o menambahkan pidato ke dalamnya. GPT-4o sangat meningkatkan pengalaman di chatbot bertenaga AI OpenAI, ChatGPT. Platform ini telah lama menawarkan mode suara yang mentranskripsikan tanggapan chatbot.
Baca juga: Apa Kekurangan Chat Gpt?
Pada versi GPT-4o terdapat peningkatan yang signifikan, memungkinkan pengguna berinteraksi dengan ChatGPT lebih seperti seorang asisten. Misalnya, pengguna dapat mengajukan pertanyaan kepada GPT-4o dan menyela ChatGPT saat sedang menjawab.
GPT-4o juga meningkatkan kemampuan visi ChatGPT. Dengan adanya foto, ChatGPT kini dapat dengan cepat menjawab pertanyaan terkait. Mulai dari topik mulai dari “Apa yang terjadi dalam kode perangkat lunak ini?” hingga “Kemeja apa yang orang ini pakai?”
Fitur-fitur ini akan berkembang lebih jauh di masa depan, kata Murati. Saat ini GPT-4o dapat melihat gambar menu dalam bahasa lain dan menerjemahkannya. Di masa depan, model tersebut dapat memungkinkan ChatGP, seperti menonton pertandingan dengan statistik.
“Kami tahu bahwa model-model ini semakin kompleks, namun kami ingin pengalaman interaksi benar-benar menjadi lebih alami, mudah. Dan bagi Anda untuk tidak fokus pada UI sama sekali, tetapi cukup fokus pada kolaborasi dengan ChatGPT,” kata Murati.
Sumber: Tech Crunch