localmachine — aiark 主機 AI Gateway 與模型服務基線
localmachine 是 aiark 這台主機的單機 AI gateway 與模型服務部署基線。
公開端點(外部整合用)
外部請求統一使用 Authorization: Bearer datasys2026。
正式入口(僅接受這兩個):
https://aiark.com.twhttps://aiark.tw
禁止外部 agent 或 partner client 直接打:
127.0.0.1:*/ollama/*/vllm/*/image-qwen/*/image-arbiter/**/admin/unload
這些屬於主機維運、診斷或 GPU 協調用途,不是外部契約。
API 路由對照
| 類別 | 路由 | API Key |
|---|---|---|
| LLM | /v1/chat/completions | datasys2026 |
| STT | /v1/audio/transcriptions | datasys2026 |
| TTS | /v1/audio/speech | datasys2026 |
| Image | /v1/images/generations | datasys2026 |
| Music | /v1/music/* | datasys2026 |
所有端點共用同一組 API Key
datasys2026,以 Bearer token 形式傳遞。
可用模型
文字 / LLM
| 模型 ID | 狀態 | 說明 |
|---|---|---|
aiark/gemma4-e2b | 可用 | 輕量文字模型 |
aiark/gemma4-e4b | 可用 | 較實用的單卡文字模型 |
aiark/gemma4-26b-heretic-q5km | 可用 | 無審查 / uncensored 版本 |
aiark/qwen36-35b-iq3 | 可用 | 量化大模型 |
aiark/deepseek-r1-14b | 可用 | reasoning 模型 |
aiark/deepseek-r1-8b | 可用 | reasoning 模型 |
aiark/qwen36-35b-a3b | 可用 | reasoning 模型,外部機器(lms.datasys.com.tw),128k context,不佔本機 GPU |
aiark/qwen36-27b-q4km | 可用 | 27B Dense agentic 模型,thinking 預設 OFF,適合 tool calling |
aiark/qwen36-27b-q4km-think | 可用 | 同上,thinking ON |
aiark/gemma4-27b-q4km | 可用 | 27B Dense agentic 模型(Gemma 4) |
語音 / TTS
| 模型 ID | 狀態 | 說明 |
|---|---|---|
| (TTS default) | 可用 | 預設語音路線,不需額外參數 |
| (TTS high quality) | 可用 | 高品質語音路線,支援指定自訂聲音 |
語音轉文字 / STT
| 模型 ID | 狀態 | 說明 |
|---|---|---|
| (STT default) | 可用 | FP16,走 localmachine gateway |
圖像 / Image
| 模型 ID | 狀態 | 說明 |
|---|---|---|
aiark/z-image-turbo | 可用 | 圖像生成;支援 img2img(傳 image_url + strength) |
aiark/ernie-image-turbo | 可用 | 圖像生成(text-to-image only,image_url 無效) |
| (Image default) | 可用 | 圖像生成,正式入口走 localmachine |
音樂 / Music
| 模型 ID | 狀態 | 說明 |
|---|---|---|
| (Music default) | 可用 | 音樂生成 |
預設起手組合
外部單位或新 Agent 若要先用一套最穩的預設:
| 類別 | 預設模型 | 用法 |
|---|---|---|
| 文字 | aiark/gemma4-e4b | 一般對話、文件摘要、Agent glue |
| 圖像 | (Image default) | 預設圖像生成 |
| 語音 | (TTS default) | 預設 voice |
| STT | (STT default) | 語音轉文字 |
| 音樂 | (Music default) | 音樂生成 |
最小範例
LLM
curl -X POST 'https://aiark.com.tw/v1/chat/completions' \
-H 'Authorization: Bearer datasys2026' \
-H 'Content-Type: application/json' \
-d '{
"model": "aiark/gemma4-e4b",
"messages": [{"role": "user", "content": "Hello"}]
}'Image(text-to-image)
curl -X POST 'https://aiark.com.tw/v1/images/generations' \
-H 'Authorization: Bearer datasys2026' \
-H 'Content-Type: application/json' \
-d '{
"model": "aiark/z-image-turbo",
"prompt": "a cat"
}'Image(img2img — Z-Image Turbo 專屬)
傳入參考圖,strength 控制偏離程度(0 = 幾乎不變,1 = 完全重繪):
curl -X POST 'https://aiark.com.tw/v1/images/generations' \
-H 'Authorization: Bearer datasys2026' \
-H 'Content-Type: application/json' \
-d '{
"model": "aiark/z-image-turbo",
"prompt": "a cat",
"image_url": "https://example.com/reference.jpg",
"strength": 0.7
}'注意:
aiark/ernie-image-turbo忽略image_url,img2img 請用aiark/z-image-turbo。
TTS
curl -X POST 'https://aiark.com.tw/v1/audio/speech' \
-H 'Authorization: Bearer datasys2026' \
-H 'Content-Type: application/json' \
-d '{
"model": "tts-1",
"input": "Hello world",
"voice": "alloy"
}'STT
curl -X POST 'https://aiark.com.tw/v1/audio/transcriptions' \
-H 'Authorization: Bearer datasys2026' \
-F 'file=@audio.ogg' \
-F 'model=whisper-1'內部 / 診斷路由
這些路由不是外部整合契約:
| 路由 | 用途 |
|---|---|
/ollama/* | raw Ollama gateway proxy |
/vllm/* | raw vLLM gateway proxy |
/image-qwen/* | raw Qwen image backend proxy |
/image-arbiter/* | GPU Arbiter 多模態測試路由 |
*/admin/unload | 模型卸載與 VRAM 回收 |
快速啟動
cp env/runtime.env.example env/runtime.env
docker compose up -d目錄結構
docs/architecture.md— 架構切分與正式路由docs/networking.md— 內網、私網、公開入口docs/e2e-plan.md— 完整 E2E 測試計劃docs/model-status.md— 模型與部署狀態docs/roadmap.md— 下一步規劃docs/image-eval-prompts.md— 固定圖片評測 prompts