Edit model card

You need to agree to share your contact information to access this model

This repository is publicly accessible, but you have to accept the conditions to access its files and content.

Log in or Sign Up to review the conditions and access this model content.

SkillQuest-Nusantara-2.7b-Indo-Chat

Deskripsi Model:

SkillQuest-Nusantara-2.7b-Indo-Chat adalah model berbasis transformer yang dirancang khusus untuk pembangkitan teks percakapan dalam bahasa Indonesia. Model ini dilatih menggunakan dataset percakapan yang luas dan dioptimalkan untuk menghasilkan tanggapan yang relevan dan kohesif dalam bahasa Indonesia. Model ini cocok untuk berbagai aplikasi seperti chatbot, virtual assistant, atau aplikasi berbasis AI lainnya yang berfokus pada bahasa Indonesia.

Dikembangkan oleh: SkillQuest
Tipe Model: Language Model (Generative, Causal Language Model)
Bahasa: Bahasa Indonesia
Lisensi: Apache License 2.0
Model Terkait: Nusantara Series (versi 2.7b)

Cara Memulai dengan Model

Untuk memulai menggunakan model ini, Anda bisa mengikuti langkah-langkah berikut menggunakan Python dan library transformers:

Contoh Penggunaan Model

from transformers import AutoModelForCausalLM, AutoTokenizer

# Memuat tokenizer dan model
tokenizer = AutoTokenizer.from_pretrained("gabrielb/SkillQuest-Nusantara-2.7b-Indo-Chat")
model = AutoModelForCausalLM.from_pretrained("gabrielb/SkillQuest-Nusantara-2.7b-Indo-Chat")

# Contoh input teks
input_text = "Halo, bagaimana saya bisa membantu Anda hari ini?"

# Tokenisasi input
inputs = tokenizer(input_text, return_tensors="pt")

# Menghasilkan teks
outputs = model.generate(inputs['input_ids'], max_length=150, do_sample=True)

# Dekode hasil output
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

Cara Mengunduh Model untuk Penggunaan Offline

model.save_pretrained("./SkillQuest-Nusantara-2.7b-Indo-Chat")
tokenizer.save_pretrained("./SkillQuest-Nusantara-2.7b-Indo-Chat")

Kemudian memuat model dari direktori lokal:

Penggunaan:

Model SkillQuest-Nusantara-2.7b-Indo-Chat dapat digunakan untuk berbagai keperluan, seperti:

  • Pembangunan chatbot berbasis AI
  • Virtual assistant untuk layanan pelanggan
  • Pembangkitan teks otomatis dalam aplikasi percakapan
  • Latihan dan simulasi percakapan dalam bahasa Indonesia
  • Tanya jawab terkait pemrograman, membantu pengguna dalam menemukan solusi untuk masalah kode dan konsep pemrograman.
  • Generate kode otomatis dalam berbagai bahasa pemrograman, termasuk Python, JavaScript, C++, dan lainnya, untuk mendukung berbagai tugas pemrograman.

Misuse and Out-of-scope Use

Model ini tidak boleh digunakan untuk menghasilkan konten yang menyinggung, memprovokasi, atau merugikan individu atau kelompok. Selain itu, model ini tidak dilatih untuk memberikan jawaban yang 100% faktual, sehingga tidak direkomendasikan untuk digunakan sebagai sumber informasi kritis atau ilmiah.

Risiko, Keterbatasan, dan Bias

Meskipun model ini dilatih menggunakan dataset yang luas, ia mungkin memiliki beberapa keterbatasan, seperti:

  • Bias Data: Model ini dilatih menggunakan data publik, sehingga mungkin mengandung bias atau stereotip yang ada dalam data tersebut.
  • Konten Tidak Sesuai: Model ini dapat menghasilkan konten yang tidak sesuai atau tidak akurat dalam konteks tertentu.
  • Pengguna model harus berhati-hati saat menggunakan model ini dalam skenario sensitif atau kritis. Berikut adalah contoh bagaimana bias dapat muncul:

Pelatihan

Data Pelatihan

Model SkillQuest-Nusantara-2.7b-Indo-Chat dilatih menggunakan dataset percakapan berbahasa Indonesia yang mencakup berbagai konteks, termasuk percakapan sehari-hari, interaksi layanan pelanggan, dan diskusi dalam berbagai topik.

Prosedur Pelatihan

Proses pelatihan model ini menggunakan teknik transformer-based language modeling yang dioptimalkan untuk menghasilkan teks percakapan yang alami dalam bahasa Indonesia. Model ini di-fine-tune menggunakan GPU dengan memanfaatkan framework PyTorch.

Sumber Daya

Model ini dilatih menggunakan infrastruktur GPU. Berikut adalah rincian dampak lingkungan dari proses pelatihan:

Tipe Perangkat Keras: GPU A100 80GB
Durasi Penggunaan: 7 jam

Credit

Model dilatih oleh Gabriel Batavia, Member of MechaMinds

Downloads last month
6
Safetensors
Model size
2.76B params
Tensor type
F32
·
Inference Examples
Inference API (serverless) is not available, repository is disabled.

Model tree for gabrielb/SkillQuest-Nusantara-2.7b-Indo-Chat

Finetuned
this model