Logo JawaPos
Author avatar - Image
Selasa, 28 Januari 2025 | 23.25 WIB

Mengenal DeepSeek, Pesaing Baru Platform Kecerdasan Buatan Asal Tiongkok yang Guncang Industri AI

Ilustrasi AI. (istockphoto.com) - Image

Ilustrasi AI. (istockphoto.com)

JawaPos.com – Dunia artificial intelligence (AI) tengah dihebohkan dengan kehadiran DeepSeek asal Tiongkok. Platform kederdasan buatan ini telah menarik perhatian global dengan pendekatan inovatifnya dalam pengembangan model AI.

DeepSeek didirikan pada Mei 2023 di Hangzhou, Zhejiang oleh Liang Wenfeng, yang juga merupakan pendiri hedge fund High-Flyer. Perusahaan ini sendiri berfokus pada pengembangan model bahasa besar (Large Language Models atau LLM) sumber terbuka.

Sejarah DeepSeek

Liang Wenfeng mendirikan High-Flyer pada tahun 2016 sebagai hedge fund yang berfokus pada pengembangan dan penggunaan algoritma perdagangan berbasis AI. Pada tahun 2021, High-Flyer sepenuhnya mengandalkan AI dalam aktivitas perdagangannya. 

Pada April 2023, High-Flyer mendirikan laboratorium AI yang didedikasikan untuk penelitian dan pengembangan alat AI di luar bisnis keuangan mereka, yang kemudian berkembang menjadi DeepSeek pada Mei 2023.

Perkembangan Model AI

  1. DeepSeek LLM (November 2023)

Model pertama mereka yang dirilis secara gratis untuk peneliti dan pengguna komersial. Model ini memiliki 67 miliar parameter dan dirancang untuk bersaing dengan LLM lain yang ada pada saat itu, dengan performa mendekati GPT-4.

  1. DeepSeek-V2 (Mei 2024)

Model ini menawarkan kinerja yang kuat dengan harga yang lebih rendah dibandingkan pesaingnya, memicu perang harga model AI di Tiongkok. DeepSeek-V2 menempati peringkat ketujuh dalam leaderboard LLM yang disusun oleh University of Waterloo Tiger Lab.

  1. DeepSeek-V3 (Desember 2024)

Dengan 671 miliar parameter, model ini dilatih dalam waktu sekitar 55 hari dengan biaya sekitar USD 5,58 juta, menggunakan sumber daya yang lebih sedikit dibandingkan pesaingnya.

Benchmark menunjukkan bahwa DeepSeek-V3 mengungguli Llama 3.1 dan Qwen 2.5 serta sebanding dengan GPT-4o dan Claude 3.5 Sonnet.

  1. DeepSeek-R1 (Januari 2025)*

Model ini dirancang untuk pemecahan masalah yang kompleks dan mencapai peringkat sepuluh besar secara global dalam hal performa.

DeepSeek-R1 dibangun lebih cepat, dengan lebih sedikit chip AI yang kurang kuat, dan dengan biaya yang lebih rendah dibandingkan model AS lainnya.

Pengakuan dan Dampak Global

DeepSeek telah mendapatkan pengakuan internasional atas pendekatan sumber terbukanya. Kepala Ilmuwan AI di Meta, Yann LeCun menyoroti pentingnya model AI sumber terbuka yang memungkinkan manfaat bagi semua pihak. 

Kemudian Marc Andreessen, kapitalis ventura terkemuka di Silicon Valley, menyebut DeepSeek-R1 sebagai salah satu terobosan paling menakjubkan dan mengesankan yang pernah dilihat dan sebagai sumber terbuka, hadiah yang mendalam bagi dunia.

Editor: Bayu Putra
Tags
Jawa Pos
JawaPos.com adalah bagian dari Jawa Pos Group, perusahaan media terkemuka di Indonesia. Menyajikan berita terkini, akurat, dan terpercaya.
Graha Pena Lt.2 Jl. Raya Kby. Lama No.12, Grogol Utara, Kec. Kebayoran Lama, Kota Jakarta Selatan, Daerah Khusus Ibukota Jakarta 12210
Download Aplikasi JawaPos.com
Download PlaystoreDownload Appstore