Langkau ke kandungan utama

Generasi AI: Apa yang ingin dilahirkan? Data Scientist atau Prompt Engineer

Kita sering terdengar, AI telah menyebabkan ribuan orang kehilangan kerja!

Betul ke?... Kenapa ia berlaku?

Ya betul! AI berfungsi untuk mengantikan pekerjaan rutin seperti menjawab soalan lazim, membuat kerja yang berulang seperti memeriksa kerosakkan produk yang hanya ada dua pilihan "Terima" atau "Tolak", mengumpul dan menyisih data dan banyak lagi.

Faham... Faham...

Bagaimana kita nak berhadapan dengan keadaan ini?.

Aku melihat jawapan ini ada dua, ini yang paling mudahlah... Dari sudut pandang akademik dan TVET.

Sebagai pengkaji Akademik aku berpandangan kita perlu melahirkan seramai mungkin Data Scientist.

Dari pengalaman sebagai pengajar TVET selama 27 Tahun aku berpendapat kita memerlukan seramai mungkin Prompt Engineer.

Ini rangka besar... Untuk memudahkan perbincangan. Anak-anak kecil kita biarkan dulu. Fahami punca dulu, baru bincang mengenai kesan.

Disclaimer:
Oleh kerana artikel ini bersifat santai kebanyakkan maklumat aku copy paste dari GPT, you know me. Biar santai asal sampai...



Data Scientist (Sumber imej: ChatGPT)

Prompt Engineer (Sumber imej: ChatGPT)

Apa itu Data Scientist?
Bayangkan kamu mempunyai sebuah buku besar yang penuh dengan nombor dan maklumat tentang pelbagai perkara, seperti jualan di kedai, ramalan cuaca, atau tabiat orang membeli-belah. Buku besar ini sangat besar dan penuh dengan maklumat, tetapi ia kelihatan sangat rumit dan susah difahami.

Nah, Data Scientist adalah seperti detektif data yang pandai membaca dan memahami buku besar ini. Mereka menggunakan alat khas (seperti komputer dan program) untuk mencari corak atau jawapan dalam maklumat yang rumit itu. Contohnya:
  • Jika kamu mahu tahu produk apa yang paling laris di kedai, Data Scientist boleh menganalisis data jualan dan memberitahu kamu.
  • Jika kamu mahu meramal berapa ramai orang akan datang ke acara tertentu, Data Scientist boleh menggunakan data masa lalu untuk membuat tekaan yang bijak.
Jadi, Data Scientist adalah orang yang pandai mencari makna dalam data yang kelihatan rumit, dan mereka membantu orang lain membuat keputusan yang lebih baik berdasarkan maklumat itu!

Prompt engineer apa pula?

Bayangkan kamu mempunyai sebuah robot yang sangat pandai yang boleh menjawab soalan, menulis cerita, atau melukis gambar. Tetapi, robot ini tidak tahu apa yang kamu mahu kecuali kamu memberitahunya dengan arahan yang jelas.

Nah, Prompt Engineer adalah seperti guru bahasa untuk robot ini. Mereka pandai menulis arahan (dipanggil "prompt") yang jelas dan tepat supaya robot itu boleh melakukan apa yang kamu mahu. Contohnya:

  • Jika kamu mahu robot menulis cerita tentang naga, Prompt Engineer akan menulis arahan seperti: "Tulis cerita pendek tentang naga yang tinggal di gunung dan suka menolong orang."
  • Jika kamu mahu robot melukis gambar, mereka akan menulis arahan seperti: "Lukiskan gambar pantai dengan matahari terbenam dan pokok kelapa."

Jadi, Prompt Engineer adalah orang yang pandai berkomunikasi dengan AI (robot pintar) supaya ia boleh menghasilkan jawapan, cerita, atau gambar yang sesuai dengan kehendak kita. Mereka seperti penterjemah antara manusia dan AI!


Apa kemahiran yang perlu ada untuk menjadi Data Scientist dan Prompt Engineer?

Berikut adalah perbezaan utama antara Data Scientist dan Prompt Engineer, berdasarkan skop kerja, kemahiran, dan tumpuan tugas:


1. Definisi & Tujuan


Data ScientistPrompt Engineer
  • Menganalisis data untuk mengekstrak insight bisnes, membina model ML/DL, dan menyelesaikan masalah kompleks dengan pendekatan data-driven.
  • Merancang dan mengoptimumkan prompt (arahan/input teks) untuk model bahasa besar (LLM) seperti GPT-4, Claude, atau DALL-E agar menghasilkan output yang tepat dan relevan.
  • Contoh tugas: Ramalan jualan, klasifikasi pelanggan, analisis sentimen.
  • Contoh tugas: Mencipta prompt untuk chatbot AI, meningkatkan kualiti jawapan LLM, atau menghasilkan imej dari teks dengan model generatif.

2. Kemahiran Utama

Data ScientistPrompt Engineer
  •  Pemrograman: Python/R, SQL.
  • Statistik & Matematik: Regresi, ujian hipotesis.
  • Machine Learning: Algoritma (cth: XGBoost, CNN), Scikit-learn, TensorFlow/PyTorch.
  •  Visualisasi Data: Tableau, Matplotlib.
  • Pengurusan Data: ETL, pangkalan data.
  • Pemahaman LLM: Cara model bahasa berfungsi (cth: tokenization, attention mechanism).
  • Kreativiti Bahasa: Menulis prompt yang jelas, spesifik, dan berstruktur.
  • Pengetahuan Domain: Memahami konteks aplikasi (cth: perubatan, kewangan) untuk reka bentuk prompt.
  • Analisis Output: Menilai kualiti respons AI dan menyesuaikan prompt.

3. Alat & Teknologi

Data ScientistPrompt Engineer
  • Python/R, Jupyter Notebook.
  • SQL/NoSQL (PostgreSQL, MongoDB).
  • Spark, Hadoop (Big Data).
  • AWS/GCP/Azure (cloud computing).
  •  Git, Docker.
  • Antaramuka LLM: OpenAI API, Hugging Face, Midjourney.
  • Alat Uji Prompt: Playground OpenAI, PromptBase.
  •  Penyeliaan Output: LangChain, LMQL.
  •  Analisis Bahasa: NLTK, spaCy.

Machine learning tools (Source: Google)

4. Fokus Kerja

Data ScientistPrompt Engineer
  • Data: Membersihkan data, feature engineering, eksperimen model.
  • Model: Latihan, penalaan, deployment.
  • Penyelesaian Masalah: Menggunakan data untuk menjawab soalan bisnes.
  • Interaksi Manusia-AI: Merangka prompt yang memandu LLM menghasilkan output yang diinginkan.
  • Pengoptimuman: Mengurangkan halusinasi AI, meningkatkan ketepatan/kerelevanan.
  • Etika: Memastikan output AI tidak bias/berbahaya.


5. Contoh Projek

Data ScientistPrompt Engineer
  • Membangunkan sistem cadangan produk untuk e-commerce.
  • Memprediksi kegagalan mesin menggunakan data sensor IoT.
  • Analisis churn rate pelanggan.
  • Membina chatbot pelanggan yang memahami konteks kompleks.
  • Mencipta prompt untuk model teks-ke-gambar (cth: "Lukiskan pemandangan futuristik dengan gaya anime").
  • Menulis templat prompt untuk penjanaan kod Python yang efisien.

6. Gaya Kerja

Data ScientistPrompt Engineer
  • Teknikal: Banyak coding, matematik, dan eksperimen model.
  • Berdasarkan Data: Keputusan disokong oleh analisis kuantitatif.
  • Jangka Panjang: Model perlu dilatih semula/dikemas kini secara berkala.
  • Eksperimen Iteratif: Uji banyak variasi prompt untuk hasil terbaik.
  • Kualitatif: Bergantung pada penilaian subjektif kualiti output.
  • Cepat & Adaptif: Perlu responsif terhadap perubahan model LLM.

7. Industri & Permintaan

Data ScientistPrompt Engineer
  • Digunakan di hampir semua sektor (fintech, kesihatan, e-dagang).
  • Permintaan stabil tetapi semakin kompetitif.
  • Lebih tertumpu pada syarikat yang membangunkan/mengintegrasikan AI generatif (cth: OpenAI, start-up AI).
  • Permintaan meningkat pesat sejak kebelakangan ini kerana populariti LLM.

Perbezaan Ketara


Bidang Ilmu:
Data Scientist: Statistik, matematik, sains komputer.
Prompt Engineer: Linguistik, psikologi kognitif, kreativiti bahasa

Interaksi dengan AI:
Data Scientist: Membina model AI dari data.
Prompt Engineer: Mengarahkan model AI sedia ada melalui bahasa semula jadi.

Output:
Data Scientist: Model/insight yang boleh diukur (cth: accuracy 95%).
Prompt Engineer: Respons AI yang memenuhi keperluan pengguna (cth: jawapan ringkas atau kreatif).


Persamaan

  • Kedua-dua bidang memerlukan pemahaman tentang AI/ML.

  • Bergantung pada penyelesaian masalah dan eksperimen.

  • Memerlukan kemahiran komunikasi untuk menterjemah keperluan bisnes ke dalam teknikal.


Kesimpulan

Data Scientist lebih "teknikal" dengan fokus pada data dan model.
Prompt Engineer lebih "bahasa" dengan fokus pada interaksi manusia-AI.
Kedua-duanya penting dalam ekosistem AI, tetapi skop dan kemahiran berbeza!

Ulasan

Catatan popular daripada blog ini

Stereng kuasa elektrik (Electric power steering)

Stereng kuasa elektrik (EPS) digunakan untuk menggantikan sistem stereng kuasa hidraulik dalam kebanyakan kenderaan baru. Kelebihan sistem ini ialah ia tidak memerlukan pam stereng kuasa, pam stereng kuasa memerlukan antara kuasa 8 hingga 10hp semasa terbeban. Sistem ini juga menghapuskan kebocoran minyak hidraulik serta keperluan untuk memeriksa paras cecair stereng kuasa. EPS juga telah menghapuskan bunyi bising yang dihasilkan oleh pam stereng kuasa, serta mengurangkan penggunaan paip dan injap hidraulik. Ia juga menghasilkan kawalan sistem stereng yang lebih baik.   Stereng kuasa elektrik menyediakan bantuan kuasa walaupun semasa enjin tidak bekerja. Ia juga menjimatkan penggunaan bahan api kerana ia lebih ringan dan digerakkan oleh motor elektrik arus terus (DC motor) hanya menggunakan kuasa elektrik apabila bantuan kuasa diperlukan sahaja. EPS digerakkan menggunakan motor 12V dan tidak menggunakan kuasa enjin sebagai punca kuasa, ini menyebabkan tiada perubahan pada cara k...

Fungsi sistem pelinciran kenderaan

Sistem pelinciran merupakan sistem yang penting di dalam enjin kenderaan.  Pemilik kenderaan hendaklah memastikan bahawa minyak pelicir yang digunakan adalah bersesuaian dengan keadaan enjin semasa dan kuantiti minyak pelincir yang terdapat di dalam enjin sentiasa berada pada paras yang mencukupi. Fungsi utama sistem pelinciran enjin ialah untuk membekal minyak pelincir ke komponen enjin yang bergerak seperti aci engkol (crankshaft), omboh (piston), rod penghubung (connecting rod), pemasangan injap (valve mechanism) dan gear.  Cylinder head Cylinder Block Valve Mechanism Piston Crankshaft Penggunaan minyak enjin yang tidak sesuai atau kuantiti enjin yang tidak mencukupi akan menimbulkan kerosakkan seperti  silinder menjadi calar, bearing terbakar atau haus dengan cepat. Palam pencucuh kotor, gelang omboh melekat, endap cemar enjin dan kadar penggunaan bahan api meningkat . Sistem pelinciran juga berfungsi untuk: Mengurangkan gesera...

Komponen utama kenderaan hibrid

Kenderaan hybrid terdiri daripada: •        Enjin pembakaran dalam •        Motor Generator 1 (MG1) •        Motor Generator 2 (MG2) •        Planetary gear set •        Inverter •        HV battery •        HV ECU   Komponen utama kenderaan hybrid                                Motor generator 1 (MG 1) MG 1 berfungsi untuk menjana tenaga elektrik dan berfungsi sebagai motor penghidup (starter motor) untuk menghidupkan enjin. Ia mengandungi elemen kawalan untuk memisahkan planetary gear set yang berfungsi untuk mengawal fungsi continous variable gear ratio pada tran...