Anthropic telah mempercepat siklus rilisnya pada tahun 2026 dengan pengumuman Claude Opus 4.7. Diposisikan sebagai model perusahaan yang paling cerdas yang tersedia untuk umum, rilis baru ini menandai langkah maju yang signifikan dalam penalaran hibrid, meskipun model ini menempati tempat unik dalam hierarki kecerdasan Anthropic.
Hirarki Intelijen: Opus vs. Mitos
Untuk memahami pentingnya rilis ini, penting untuk dicatat bahwa Opus 4.7 bukanlah model Anthropic yang paling kuat. Perusahaan tersebut baru-baru ini mengembangkan Claude Mythos, sebuah model yang menunjukkan tingkat kecerdasan yang lebih tinggi namun dianggap terlalu berpotensi berbahaya untuk dipublikasikan ke masyarakat umum.
Oleh karena itu, Opus 4.7 berfungsi sebagai “langit-langit” saat ini untuk AI yang aman dan dapat diakses oleh konsumen, bertindak sebagai jembatan antara model penalaran standar dan tingkat Mythos yang eksperimental dan berkemampuan tinggi.
Peningkatan dan Kemampuan Utama
Claude Opus 4.7 dirancang untuk penalaran multi-langkah yang kompleks dan tugas-tugas teknis tingkat tinggi. Menurut Anthropic, model ini unggul dalam beberapa bidang tertentu:
- Pengkodean Tingkat Lanjut: Pengguna dilaporkan dapat mendelegasikan proyek pengkodean yang kompleks dan sudah berjalan lama ke model dengan keyakinan lebih tinggi, karena model kini dapat memverifikasi keluarannya sendiri dan mengikuti instruksi rumit dengan lebih teliti.
- Kecerdasan Visual dan Dokumen: Model ini menunjukkan peningkatan nyata dalam menganalisis data visual dan memproses dokumen padat.
- Profesionalisme Kreatif: Anthropic mendeskripsikan model ini sebagai “lebih berselera tinggi”, yang menunjukkan performa yang lebih baik dalam menghasilkan aset profesional berkualitas tinggi seperti dek slide, antarmuka pengguna, dan dokumen.
Catatan tentang Penggunaan Token: Meskipun harganya tetap sama dengan pendahulunya (Opus 4.6), pengguna harus menyadari bahwa Opus 4.7 “berpikir lebih banyak” pada tingkat upaya yang lebih tinggi. Proses penalaran yang lebih mendalam ini menghasilkan konsumsi token keluaran yang lebih tinggi, yang mungkin berdampak pada biaya bagi pengguna API.
Performa Tolok Ukur: Perbandingannya
Dalam kartu model terperinci, Anthropic membandingkan Opus 4.7 dengan pemimpin industri lainnya, termasuk Gemini 3.1 Pro dari Google dan GPT-5-4 Pro dari OpenAI.
Pada tolok ukur Ujian Terakhir Kemanusiaan (HLE) yang menantang—sebuah tes yang dirancang untuk mengukur tingkat kesulitan ekstrem—Opus 4.7 memiliki posisi kompetitif. Tanpa menggunakan alat luar, hasilnya sebagai berikut:
| Model | Skor HLE (Tanpa Alat) |
|---|---|
| Mitos Claude | 56,8% |
| Claude Opus 4.7 | 46,9% |
| Gemini 3.1 Pro | 44,4% |
| GPT-5-4 Pro | 42,7% |
| Claude Opus 4.6 | 40,0% |
Ketika alat digunakan, kondisinya sedikit berubah, dengan GPT-5-4 Pro memimpin kelompok konsumen dengan 58,7%, sementara Opus 4.7 menyusul dengan 54,7%. Perlu dicatat bahwa Anthropic mengklarifikasi bahwa Opus 4.7 mengikuti tren kemampuan yang ada dan bukan mewakili lompatan eksponensial yang tiba-tiba dalam pengembangan AI.
Keamanan, Kejujuran, dan Halusinasi
Pilar inti pengembangan Anthropic adalah “Keamanan AI”. Dengan pembaruan 4.7, perusahaan sangat fokus pada pengurangan kelemahan yang melekat pada model bahasa besar:
- Mengurangi Halusinasi: Model ini dilaporkan lebih faktual dan kecil kemungkinannya untuk menciptakan informasi yang salah.
- Peningkatan Kejujuran: Anthropic melaporkan pengurangan signifikan dalam “kelalaian penting”—contoh ketika model gagal menyebutkan informasi penting.
- Hadiah Peretasan Lebih Rendah: Model ini menunjukkan penurunan kecenderungan untuk menemukan “jalan pintas” untuk memenuhi perintah yang menyimpang dari maksud sebenarnya pengguna.
Ketersediaan
Claude Opus 4.7 segera tersedia melalui saluran berikut:
– Claude AI (antarmuka web)
– ClaudeAPI
– Microsoft Foundry dan mitra Anthropic lainnya
Kesimpulan: Claude Opus 4.7 membuktikan dirinya sebagai model penalaran tingkat profesional berkemampuan tinggi yang memprioritaskan keandalan dan presisi pengkodean, bahkan ketika Anthropic menyimpan teknologi “Mythos” yang paling kuat sebagai cadangan demi alasan keamanan.




























