Может ли 64 ГБ M4 Pro запустить ds4?

Нет для production: Flash q2 с asymmetric weights требует минимум 96 ГБ unified memory. Сначала арендуйте 128 ГБ cloud Mac посуточно для валидации, затем решайте вопрос покупки железа.

Проходит ли cloud ds4-трафик через сторонний API?

Нет. ds4-server слушает на вашей dedicated instance; укажите Cursor или Claude Code на этот хост. Weights и KV snapshots остаются на арендованном диске.

Может ли ds4 сосуществовать с Ollama?

Да на одной машине, но не загружайте два крупных model одновременно на полную. Резервируйте 96 ГБ+ для ds4 long-context sessions; мелкие model держите на Ollama.

2026 antirez ds4 на Mac: DeepSeek V4, порог 96 ГБ unified memory и аренда облачного Mac

Если нужны frontier-class open weights offline на Mac, блокер в 2026 — не software, а RAM. Автор Redis antirez выпустил в мае 2026 ds4 (DwarfStar 4): чистый C, Metal-first, только DeepSeek V4 Flash. Статья для AI-инженеров, упирающихся в нижнюю границу 96 ГБ unified memory: что делает ds4, quant/memory matrix и шестишаговый runbook для compile, load weights и подключения ds4-server к Cursor на cloud Mac с большим RAM — без покупки Studio за шесть цифр.

Что такое ds4 в 2026 и почему antirez выбрал single-model path

llama.cpp, Ollama и MLX уже грузят сотни GGUF. ds4 делает обратное: одно model family, end-to-end — Metal graph execution, asymmetric quants, on-disk KV snapshots, tool calling и ds4-server с OpenAI- и Anthropic-compatible endpoints. В своём тексте antirez формулирует: разрыв был не в «ещё одном runtime», а в «weights достаточно быстрых, чтобы заменить ежедневные вызовы Claude на personal hardware».

Momentum: github.com/antirez/ds4 за дни превысил 10k+ stars — разработчикам нужна глубина на одном checkpoint, а не ещё один generic loader.

Self-contained: без зависимости от llama.cpp; production path на macOS — Metal (CPU только debug; README предупреждает о macOS VM bugs с kernel panic при CPU inference).

Agent-ready: направьте Cursor, opencode или Claude Code на вашу instance — data остаётся на disk, не в hosted API.

Long context: design target до ~1M tokens с compressed KV и ds4 disk snapshots — sessions переживают restart.

Реальный blocker: 96–512 ГБ unified memory — именно это снимает аренда cloud Mac.

Metal, disk KV и 2-bit routing quants: чем ds4 отличается

Community reports на M-series Max указывают примерно 463 tok/s prefill и 34 tok/s generation для Flash — всегда benchmark на своей box перед подписанием SLA.

Capability	ds4	Generic Ollama / llama.cpp
Scope	DeepSeek V4 Flash path	сотни GGUF architectures
macOS GPU	Metal как primary target	multi-backend, меньше DS-specific tuning
KV state	RAM + disk snapshots	часто теряется при exit process
Quant	2-bit только на routed experts	один global quant tier
Coding agents	built-in tools + compatible APIs	дополнительная gateway assembly

Apple Silicon unified memory (UMA) даёт CPU и GPU один pool — поэтому ds4 связывает Metal с быстрым NVMe для KV persistence вместо того, чтобы считать Mac afterthought.

Baseline для ссылок: official docs привязывают production inference к Metal/CUDA; asymmetric 2/8-bit Flash weights ожидают 96 или 128 ГБ UMA — ниже supported path отсутствует.

Сколько RAM для DeepSeek V4 Flash и PRO: matrix 2026

Model / quant	Min unified RAM	Typical hardware	Buy-side order of magnitude
V4 Flash · q2	96 ГБ	MacBook Pro M3/M4/M5 Max	~$4k+ USD
V4 Flash · q4	256 ГБ	Mac Studio Ultra	~$8k+ USD
V4 PRO · q2	512 ГБ	Mac Studio M3 Ultra maxed	~$15k+ USD

Pilot tier (96–128 ГБ): достаточно для Flash q2 плюс Cursor tool-calling smoke tests — оптимально для посуточной cloud аренды.

Production coding (128–256 ГБ): parallel agents плюс long context — держите ~20% RAM headroom против swap thrash.

PRO experiments (512 ГБ): аренда понедельно на cloud bare metal вместо капитализации разовой покупки.

Шесть шагов: ds4 на cloud Mac end-to-end

Выбор RAM под quant: Flash pilot → 128 ГБ instance; q4 или PRO → 256 ГБ / 512 ГБ, чтобы не re-download weights mid-project.

Validate Metal: system_profiler SPDisplaysDataType; Command Line Tools через xcode-select -p.

Build ds4: git clone https://github.com/antirez/ds4.git && cd ds4 && make внутри tmux, чтобы SSH drop не убил compile.

Stage weights на local NVMe: следуйте repo для official vectors/GGUF paths — сотни ГБ; никогда iCloud-synced folders.

Start ds4-server: bind loopback или private IP; curl /v1/models — подтвердите Metal, не CPU debug backend.

Agent acceptance: tunnel или Tailscale Serve; tool-calling coding task; проверьте, что KV snapshots переживают reconnect без full prefill.

SSH port forward

ssh -N -L 8080:127.0.0.1:PORT user@your-cloud-mac.example.com
export OPENAI_BASE_URL=http://127.0.0.1:8080/v1

Без Mac за шесть цифр: аренда Flash, burst PRO по запросу

Покупка фиксирует capital и depreciation; cloud bare-metal превращает RAM в dial — 128 ГБ на этой неделе для Flash plugins, 512 ГБ на следующей для PRO benchmarks, затем power off.

Dimension	Buy Studio Ultra	Cloud Mac с большим RAM
Cash upfront	пятизначная покупка	hourly / daily / monthly
Elasticity	новая machine = новая покупка	resize 128 ГБ ↔ 512 ГБ
Team sharing	один laptop на человека	одна instance, SSH roles, shift inference
Privacy	physical control	dedicated bare metal — weights не покидают ваш disk

Generic Linux GPU VPS плохо подходят: supported macOS story ds4 — Metal. Свяжите ds4 с нашим parallel agent workflow — 64 ГБ cloud Mac как control plane, 128 ГБ+ box как heavy inference worker.

Командам, которым нужен stable Metal inference без шестизначной CapEx line, MESHLAUNCH high-RAM Mac mini / M4 Pro / Max bare-metal rental — pragmatic path: day-rent Flash, month-lock long-context production, burst PRO on demand — всё внутри dedicated instance, не third-party model API. См. цены аренды и центр помощи.

FAQ

Не на supported path — Flash q2 требует минимум 96 ГБ UMA. Сначала арендуйте 128 ГБ посуточно, затем решайте про hardware.

Нет — ds4-server работает на вашей rented instance; укажите IDE base URL туда. MESHLAUNCH не проксирует model payloads.

Да, но не загружайте два крупных model на full duty. Резервируйте 96 ГБ+ для ds4; мелкие model на Ollama — memory tables в центре помощи.

Назад в блог Арендовать

2026 antirez ds4 на MacDeepSeek V4, порог 96 ГБ, облачная аренда

Что такое ds4 в 2026 и почему antirez выбрал single-model path

Metal, disk KV и 2-bit routing quants: чем ds4 отличается

Сколько RAM для DeepSeek V4 Flash и PRO: matrix 2026

Шесть шагов: ds4 на cloud Mac end-to-end

Без Mac за шесть цифр: аренда Flash, burst PRO по запросу

2026 antirez ds4 на Mac
DeepSeek V4, порог 96 ГБ, облачная аренда