TEKUN AI ialah sistem chatbot AI sepenuhnya tempatan untuk TEKUN Nasional — menjawab soalan berkaitan skim pembiayaan mikro, syarat kelayakan, prosedur permohonan, dan perkhidmatan rasmi TEKUN. Sistem ini menggunakan pendekatan RAG (Retrieval-Augmented Generation) dengan pencarian hibrid, pengembangan pertanyaan automatik, penilaian kendiri, dan kategori-boost untuk memastikan jawapan berkualiti tinggi.
Setiap soalan pengguna melalui 8 langkah pemprosesan sebelum jawapan dihasilkan:
SOALAN_SUSULAN:) — tiada panggilan LLM tambahan. Membantu pengguna meneroka topik lebih mendalam.done event sebagai metadata untuk badge "Verified" pada antara muka. Tidak melambatkan TTFT.
Nota kedaulatan data: Semua dokumen TEKUN, perbualan pengguna, log audit, dan memori sesi kekal di pelayan tempatan. Hanya carian web (Tavily/Brave) menggunakan API luaran — itupun hanya menghantar kata kunci carian tanpa PII atau kandungan perbualan. Untuk operasi 100% offline, carian web boleh dilumpuhkan melalui backend.env.
| Perkara | Butiran |
|---|---|
| Dokumen | Dokumen rasmi TEKUN — skim pembiayaan, garis panduan, polisi HR, prosedur perolehan, SOP (tertakluk pada data yang diingest) |
| Halaman | 85 halaman, 7 seksyen utama (A-G) |
| Chunks | 515 chunks (600 aksara setiap chunk, 120 aksara overlap) |
| Metadata | Nama fail, indeks chunk, nombor halaman, jenis dokumen |
| Pangkalan Vektor | ChromaDB dengan HNSW (M=32, construction_ef=200, search_ef=100) |
| Dimensi Vektor | 1024 (Mesolitica Mistral 191M) |
| Seksyen | Kandungan |
|---|---|
| Section A (1.0-5.0) | Umum -- tujuan, objektif, skop perkhidmatan, inventori aset, peraturan dan piawaian |
| Section B (6.0) | Pelan Pengurusan Fasiliti (FMP) |
| Section C (7.0-12.0) | Organisasi tapak kontraktor -- program kerja, pembayaran, sumber manusia, SHE, QMS |
| Section D (13.0-20.0) | Perkhidmatan pengurusan fasiliti -- peralihan, FCA, help desk, MIS, utiliti, risiko, HSE |
| Section E (21.0-23.0) | Operasi dan penyelenggaraan kejuruteraan -- CMMS, landskap, mekanikal, elektrikal, sivil |
| Section F (24.0-25.0) | Perkhidmatan kustodial -- pembersihan, kawalan perosak |
| Section G (26.0) | Nasihat teknikal dan cadangan pakar |
| Komponen | Butiran |
|---|---|
| Backend API | FastAPI pada port 8004 (loopback), 1 Uvicorn worker, uvloop |
| Cache | Redis (port 6379) -- respons dicache selama 10 minit |
| Gateway | Caddy -- TLS Let's Encrypt automatik (TLS-ALPN-01), zstd/gzip, reverse proxy, gerbang SSO via forward_auth |
| Domain Awam | chatbot.tekun.gov.my -- DNS Cloudflare (DNS-only) menghala ke WAN TEKUN, port 443 diteruskan ke pelayan ini (172.31.0.5) |
| Systemd | tekun-chatbot.service -- auto-start, had memori 32GB, perlindungan keselamatan |