OPTIMALISASI STRATEGI PENJUALAN DENGAN SISTEM REKOMENDASI & ANALISIS PASAR INTERAKTIF MENGGUNAKAN METODE USER-BASED COLLABORATIVE FILTERING
Pemilihan dataset dalam project ini didasarkan pada urgensi pemahaman dinamika pasar e-commerce di Indonesia yang
sangat fluktuatif. Dataset yang digunakan merupakan data primer hasil akuisisi teknik Web Scraping dari
platform marketplace (Tokopedia/Shopee). Data ini telah melalui proses filtering yang ketat dan disimpan dalam
format filtered_products.csv.
Dataset ini dipilih karena mengandung variabel multidimensi yang krusial untuk mata kuliah Pemrosesan Visual Data, yaitu: kategori produk, harga, rating, jumlah ulasan, dan lokasi geografis (kota). Dengan memanfaatkan data ini, kita dapat mensimulasikan skenario nyata bagaimana sebuah sistem cerdas (AI) dapat membantu pelaku bisnis melakukan intervensi strategis berdasarkan pola perilaku konsumen, bukan sekadar intuisi.
Project ini mentransformasi data mentah tersebut menjadi seperangkat wawasan strategis (*Actionable Insights*):
Tujuan utama dari implementasi pemrosesan dan visualisasi data dalam project ini adalah:
Lingkup pengerjaan dan batasan dataset dalam project ini meliputi:
Bagian ini menguraikan secara teknis alur kerja sistem, dimulai dari akuisisi data mentah hingga transformasi menjadi data visual yang bermakna.
Data diperoleh langsung dari sumbernya di marketplace melalui dua tahapan teknik otomasi:
Proses Crawling dilakukan untuk menavigasi struktur halaman kategori (misal: Aksesoris Mobil) secara otomatis. Sistem menyisir halaman demi halaman (pagination) untuk mengumpulkan URL unik setiap produk yang memenuhi kriteria awal (seperti filter rating > 4.0).
Setelah mendapatkan daftar URL, proses Scraping dijalankan untuk mengekstraksi elemen data spesifik dari setiap halaman detail produk. Atribut yang diambil meliputi nama produk, harga, lokasi toko, dan metrik kepuasan pelanggan.
Data mentah dari scraping seringkali mengandung *noise* (kata kunci spam pada judul). Tahap ini menggunakan script Python untuk membersihkan dan memperkaya dataset.
Teknik Regular Expression (Regex) digunakan untuk "membaca" spesifikasi teknis yang tertanam dalam teks judul secara otomatis.
# Cuplikan Kode Python: Ekstraksi Watt & Ampere
def extract_specs(name):
# Regex untuk menangkap angka Watt (e.g., 30W, 65 Watt)
watts = re.findall(r'(\d+)\s*[Ww]att|(\d+)[Ww]', name, re.IGNORECASE)
# Regex untuk menangkap angka Ampere (e.g., 2.4A, 3 Amp)
amps = re.findall(r'(\d+\.?\d*)\s*[Aa]mp|(\d+\.?\d*)[Aa]', name, re.IGNORECASE)
return watts, amps
Analisis: Dengan teknik ini, sistem dapat mengelompokkan produk berdasarkan kapasitas dayanya (misal: Charger 30W vs 65W), sebuah fitur yang tidak disediakan oleh data mentah marketplace.
Sistem melakukan pencocokan kata kunci (*keyword matching*) terhadap daftar brand ternama (seperti Baseus, Anker, Xiaomi) untuk memisahkan nama produsen dari deskripsi produk. Hal ini penting untuk analisis pangsa pasar per brand.
Filtering terakhir adalah menyusun ulang judul produk menjadi format standar yang bersih, menggunakan formula:
[Brand] + [Core Keyword] + [Specs].
def generate_title(row):
# Logika penyusunan judul baru yang bersih
brand = clean_brand_name(row['name'])
watt, amp = extract_specs(row['name'])
# Mapping keyword inti berdasarkan kategori
if row['category'] == 'Car Charger':
keywords = "Car Charger Fast Charging"
return f"{brand} {keywords} {watt if watt else amp}"
Berikut adalah representasi visual alur sistem dari hulu ke hilir:
Sistem ini menerapkan algoritma User-Based Collaborative Filtering untuk memprediksi produk diminati.
// Cuplikan Logika PHP (RecommendationService.php)
private function calculateCosineSimilarity($u1, $u2) {
// Menghitung kemiripan pola belanja antar user
$dotProduct = 0; $norm1 = 0; $norm2 = 0;
// ... kalkulasi vektor ...
return $dotProduct / ($denominator);
}
Analisis: Hasil perhitungan Similarity Score menunjukkan bahwa algoritma ini efektif dalam memberikan rekomendasi silang (*cross-selling*). Produk yang dibeli oleh user dengan profil serupa (User A dan User B) memiliki probabilitas konversi yang lebih tinggi.
Data hasil olahan ditampilkan dalam dashboard bertema Command Center.
Berdasarkan implementasi dan pengujian sistem, dapat disimpulkan:
[1] J. S. Breese, D. Heckerman, and C. Kadie, "Empirical analysis of predictive algorithms for collaborative filtering," in Proc. 14th Conf. Uncertainty in Artificial Intelligence (UAI-98), 1998.
[2] V. Geroimenko and C. Chen, Visualizing the Semantic Web: XML-based Internet and Information Visualization. London: Springer-Verlag, 2002.
[3] Chart.js Documentation, "Chart.js 3.x Migration Guide," Available: https://www.chartjs.org/.
[4] Laravel Documentation, "Eloquent ORM & Database Seeding," Available: https://laravel.com/.