September 26, 2023

Pada hari Selasa, Meta mengumumkan Llama 2, versi baru dari mannequin bahasa besarnya.

Banyak perhatian telah diberikan kepada LLM seperti GPT-4 OpenAI yang mendukung ChatGPT dan Google PaLM 2 yang mendukung Bard, tetapi jangan tidur pada upaya Meta untuk bersaing di area AI generatif. Tidak seperti GPT-4 dan PaLM 2, yang merupakan mannequin tertutup, Llama 2 adalah open-source (lebih lanjut di bawah). Itu sudah mencetak skor serupa pada tolok ukur tertentu, dan mungkin hanya akan menjadi lebih baik dengan masukan dari publik.

Inilah yang perlu diketahui tentang Sleeper-hit LLM Meta:

LIHAT JUGA:

Apa itu Claude 2? Cara mengakses pesaing ChatGPT ini.

Llama 2 adalah open-source, tidak seperti pesaing utamanya

Meta telah menjadikan Llama 2 open-source dan free of charge untuk penelitian dan penggunaan komersial, karena memberikan lebih banyak kesempatan kepada publik untuk membentuk dan memanfaatkan teknologi transformatif.

“Memberi bisnis, startup, pengusaha, dan peneliti akses ke alat yang dikembangkan pada skala yang akan menantang untuk membangun diri mereka sendiri, didukung oleh daya komputasi yang mungkin tidak dapat mereka akses, akan membuka dunia peluang bagi mereka untuk bereksperimen, berinovasi dengan cara yang menarik, dan pada akhirnya mendapat manfaat dari ekonomi dan sosial,” kata posting weblog yang mengumumkan rilis tersebut.

Google dan OpenAI belum membagikan element tentang bagaimana LLM milik mereka dikembangkan, seperti spesifik tentang jumlah parameter atau information apa yang digunakan untuk melatih mannequin. Sebaliknya, Llama 2 dapat diakses secara bebas melalui Hugging Face, Amazon Internet Companies, dan Microsoft Azure, yang berarti pengembang memiliki akses ke kode dan datanya, yang memungkinkan mereka membangun dan meningkatkan mannequin. Llama 2 memiliki tiga ukuran mannequin pra-pelatihan yang berbeda: 7 miliar, 13 miliar, dan 70 miliar parameter, yang semuanya dapat diakses.

Microsoft Azure adalah ‘mitra pilihan’ Llama 2

Bersamaan dengan perilisan Llama 2 Meta, Meta juga mengumumkan kemitraan dengan platform komputasi awan Microsoft, Azure. Mulai minggu ini, pelanggan Azure dapat menggunakan Llama 2 sebagai opsi untuk membuat aplikasi. Ya, Anda dapat mengunduh Llama 2 secara langsung, tetapi melalui platform AI Azure, Anda mendapatkan fitur penyempurnaan, keamanan, dan inferensi yang dirancang khusus untuk bekerja dengan LLM.

Kemitraan ini selaras dengan sikap publik kedua raksasa teknologi tersebut dalam mendemokratisasi AI. Azure adalah langganan berbayar, tetapi Microsoft telah membuat alat Bing dan Edge bertenaga AI free of charge untuk digunakan. Dan alat tersebut didukung oleh GPT-4 OpenAI, yang telah menerima investasi besar dari Microsoft. Artinya, Microsoft bekerja keras pada AI generatif dan memanfaatkan kemitraan yang kuat untuk mewujudkannya. Bagi Meta, kemitraan Microsoft adalah saluran yang berharga bagi pengembang Azure untuk menggunakan Llama 2.

Bagaimana Llama 2 dibandingkan dengan ChatGPT

Cukup dengan latar belakangnya, apakah Llama 2 benar-benar bisa melengserkan ChatGPT sebagai LLM terbaik? Jawaban singkatnya belum, tapi mungkin pada akhirnya.

Dalam makalah penelitian Meta, ia membandingkan kinerja Llama 2 pada berbagai tolok ukur akademis dengan mannequin lain, termasuk GPT-3.5 dan GPT-4 OpenAI dan PaLM dan PaLM 2 Google. Llama 2 tidak mendapat skor setinggi pada kumpulan information yang mengukur pengetahuan umum, matematika sekolah dasar, atau kemampuan pengkodean, tetapi Meta melakukan penelitian lain menggunakan evaluasi manusia yang memiliki hasil yang menarik. Manusia mencetak 4.000 petunjuk tentang “manfaat” membandingkan berbagai mannequin. Dalam hal ini, Llama 2 mengalahkan ChatGPT, menghasilkan 35,9 persen “kemenangan” melawan 32,5 persen ChatGPT.

Skor ini diukur terhadap mannequin tertutup, tetapi ketika datang ke perbandingan tolok ukur mannequin sumber terbuka lainnya, Llama 2 telah mengalahkannya. LLM Meta mengungguli mannequin sumber terbuka lainnya (MPT dan Falcon) secara keseluruhan.

Secara kasar, kecerdasan Llama 2 dinilai mirip dengan GPT-3.5, dan dinilai sedikit lebih bermanfaat daripada ChatGPT dalam bentuk chatbot. Secara teoritis, dengan upaya dari komunitas pengembang, Llama 2 hanya akan menjadi lebih baik dari sini.