2026 Бесплатные ИИ-инструменты для кодинга: Gemini CLI, Codex, OpenCode — гайд по токенам
Июнь 2026 — редкий момент, когда free tier у coding-агентов щедрее, чем кажется по landing page: Gemini CLI отдаёт 1000 OAuth-запросов в сутки, Codex CLI периодически пускает free ChatGPT-аккаунты, OpenCode цепляется к API с нулевой или почти нулевой ценой — включая SiliconFlow, Alibaba Bailian и Zhipu. Ниже — матрица RPM/RPD, рабочие конфиги, анти-паттерны вроде /init на весь monorepo и схема remote Mac 7×24 до дедлайна 18 июня 2026, когда Google выключает персональный Gemini CLI.
1. Три боли: иллюзия квот, сетевой routing, ноутбук в sleep
Боль №1 — иллюзия «бесплатно навсегда». Маркeting пишет free, а в fine print — 5–15 тяжёлых запросов в день на Pro-модель или раздельные лимиты OAuth vs API key. Не прочитал RPM (requests per minute) и RPD (requests per day) — получил HTTP 429 посреди rebase. Классика: в понедельник demo на Gemini CLI, во вторник «сломался AI», в среду миграция на другой CLI без бэкапа ключей. Для гика это не магия — это отсутствие таблицы лимитов в README команды.
Боль №2 — routing и latency. Gemini CLI и Codex CLI по умолчанию бьют в US. Из РФ/СНГ без стабильного канала это jitter, обрывы OAuth и timeout на длинных agent loop'ах. Китайские free API (SiliconFlow, Bailian, Zhipu) дают OpenAI-compatible /v1 и часто лучший RTT из Азии — но данные уходят в PRC; для pet-project и open source ок, для prod с PII — отдельный threat model. OpenCode позволяет держать provider chain: US primary, CN fallback — без смены TUI.
Боль №3 — intermittently online hardware. Agent на ноутбуке с закрытой крышкой = мёртвый OAuth refresh, оборванный multi-file refactor и «тишина» в Telegram/WhatsApp gateway. macOS sleep и Windows hybrid sleep убивают 7×24 сценарии жёстче, чем нехватка VRAM. Free tier не компенсирует хост, который уходит в suspend в 23:00.
Плюс hard deadline: 18 июня 2026 Google отключает Gemini CLI для personal users (free и часть AI Pro/Ultra). Детали миграции — в статье про политику Gemini CLI и Antigravity. Окно OAuth 1000/day — последний шанс прогнать smoke tests до cutover.
2. Матрица free tier 2026 (copy-paste для wiki)
Таблица для internal RFC: что ставить primary, что — cold standby. Цифры округлены; проверяйте dashboard провайдера — marketing меняется быстрее, чем npm package.
| Tool / platform | Free quota | Direct без US VPN | Geek highlight |
|---|---|---|---|
| Gemini CLI (OAuth) | 1000/day, 60/min до 18.06.2026 | Часто нужен US path | Без карты; успей до cutoff |
| Codex CLI | ChatGPT Free (временно); BYOK | Custom base_url | OS sandbox, GPT-5.3-Codex |
| OpenCode | CLI free; API pay-as-you-go | 75+ providers | 146K★ GitHub; failover в JSON |
| GitHub Copilot Free | 2000 completions + 50 premium/mo | Да | Students → full Pro |
| Cursor Hobby | 2000 Tab + 50 slow premium/mo | Да | VS Code fork, agent mode limited |
| SiliconFlow | ~20M tokens signup | Да из CN/Asia | DeepSeek, Qwen, GLM endpoints |
| Alibaba Bailian | ~70M tokens, 70+ models | Да | Qwen3.5 family for code |
| Zhipu (GLM) | ~20M tokens signup | Да | GLM-5 multilingual codegen |
Типовой stack для homelab + side project: terminal — Gemini CLI (до 18.06) + Codex с SiliconFlow backup; IDE — Cursor Hobby или Copilot Free; automation — OpenCode + OpenClaw на одном remote Mac, разные launchd plist'ы. Какие CLI реально жрут токены в prod — смотрите OpenRouter CLI рейтинг июня 2026 (Hermes 4.94T не шутка).
Отдельно про rate limits: 429 — не «сломался интернет», а математика. Gemini 60 RPM означает burst refactor на 40 файлов может упереться в минутный потолок раньше, чем в daily 1000. SiliconFlow и Bailian тоже имеют скрытые QPS caps — читайте response headers и логируйте retry-after. Geek-правило: wrapper script с exponential backoff дешевле, чем ручной restart agent'а в 04:00.
3. SiliconFlow, Bailian, Zhipu — wiring без боли
Все три — OpenAI-compatible. Меняете base_url и model, CLI думает, что это «ещё один OpenAI». Это и есть правильный уровень абстракции для 2026: не vendor lock-in на бинарник, а swap строки в config.
SiliconFlow — endpoint https://api.siliconflow.cn/v1. Регистрация по email/phone, ~20M tokens на старте. Codex CLI — правка ~/.codex/config.toml:
openai_base_url = "https://api.siliconflow.cn/v1"
# model = "deepseek-ai/DeepSeek-V3"
# или Qwen/Qwen2.5-Coder-32B-Instruct
export OPENAI_API_KEY="sk-..." → codex doctor. Если doctor green — можно гонять agent loop. Не коммитьте ключ; для remote Mac положите в ~/.zshrc или launchd EnvironmentVariables.
Alibaba Bailian — самый жирный пакет (~70M tokens, 70+ models). Qwen3.5-Coder — разумный default для refactor задач. OpenCode: интерактивно /connect или статически в ~/.config/opencode/config.json — массив providers с priority. Failover: Bailian → SiliconFlow → Zhipu; при 429 OpenCode переключает строку без перезапуска TUI (зависит от версии — проверьте changelog).
Zhipu GLM — ~20M tokens, силён на mixed RU/EN комментариях и legacy codebases. Третий tier в chain — страховка от single-provider outage ночью, когда ты спишь, а cron job рефакторит migrations.
Ops note: rotate keys каждые 90 дней; rsync ~/.codex и ~/.config/opencode на remote Mac после локальной правки — иначе drift между laptop и prod agent guaranteed.
Пример минимального OpenCode provider block (упрощённо):
{
"providers": [
{ "id": "bailian", "baseURL": "https://dashscope.aliyuncs.com/compatible-mode/v1", "apiKey": "${BAILIAN_KEY}" },
{ "id": "siliconflow", "baseURL": "https://api.siliconflow.cn/v1", "apiKey": "${SF_KEY}" }
],
"defaultProvider": "bailian"
}
Подставьте реальные env vars; не храните JSON с plaintext keys в git. На remote Mac — тот же файл, те же переменные в launchd plist. Diff между staging и prod должен быть только в model id, не в секретах.
4. Шесть CLI/IDE — разбор стека
Gemini CLI — npm i -g @google/gemini-cli, gemini auth login, OAuth 1000/day @ 60 RPM. Flash models для exploration, Pro — для merge-critical diff'ов. OAuth refresh делайте на always-on хосте; callback URL должен резолвиться. После 18.06 — Antigravity CLI (следите за Google blog) или hard pivot на OpenCode. Smoke test calendar event на 17.06 — не на 19.06.
Codex CLI — terminal agent с OS-level sandbox (macOS Seatbelt реально работает, в отличие от random Docker на 512MB VPS). GPT-5.3-Codex тянет тяжёлые multi-step patch series. Free ChatGPT tier — лотерея; для reproducible pipeline — BYOK + documented endpoint. Anti-pattern: /init scan всего repo — один прогон сожжёт сотни тысяч tokens и выбьет daily cap за минуты. Policy: file-scoped prompts only.
OpenCode — OSS, 75+ providers, TUI знакомый если ты сидел на Claude Code/Codex. Нулевая подписка на tool; платишь только API. Идеальный post-Gemini primary: меняешь JSON — меняешь backend. Связка с OpenClaw: gateway в Telegram, coding loop в OpenCode — см. OpenClaw install guide.
GitHub Copilot Free — 2000 inline completions + 50 premium requests/month в IDE. Verified students → Copilot Pro free — если ты в универе, это no-brainer. Copilot для human-in-the-loop; batch night jobs — CLI agents.
Cursor Hobby — 2000 Tab + 50 slow premium/month, полноценный VS Code fork. Privacy Mode + .cursorignore before pointing at work repo. Agent mode на Hobby — для taste test; production agent fleet — Pro или remote Mac с isolated clone.
Combo pattern: днём Cursor/Copilot для ручного review, ночью Codex/Gemini CLI batch migrations на том же git HEAD на remote Mac — launchd стартует job в 02:00, утром merge request. Tokens не сгорают зря, sleep не убивает pipeline.
Hardware sanity check для agent host: Apple Silicon unified memory бьёт cheap VPS на задачах с параллельными sub-agents и локальным git index. Mac mini M4 16GB — sweet spot для OpenCode + один Docker sandbox; 32GB — если добавляете OpenClaw gateway + Ollama sidecar. RAM pressure manifest = swap thrashing = OAuth timeout — симптом, который часто маскируют под «модель тупит».
5. Пять шагов деплоя на remote Mac
- Pick primary + backup по матрице: есть стабильный US path → Gemini + SiliconFlow; только Asia direct → OpenCode + Bailian dual-key.
- Keys & OAuth: Google OAuth на remote Mac до 18.06; CN keys в env, не в repo;
chmod 600на config files. - Install CLIs:
npm i -g @google/gemini-cli; Codex по docs; OpenCode binary/release channel. Pin versions в internal doc — «latest» ломает CI без warning. - launchd 7×24: plist с
KeepAlive,StandardOutPathдля logs, disable sleep,caffeinate -dimsuесли нужно. OAuth callback на static IP — SFTPMAC node упрощает жизнь. - SFTP/rsync sync: code + agent configs; snapshot перед night job; rollback = rsync link-dest или git tag — pick your poison.
Bonus: cron на 80% quota alert — парсите provider dashboard API или ловите x-ratelimit-remaining headers в wrapper script. 429 в 03:00 бесит сильнее, чем слабая model.
Launchd snippet (conceptual): ProgramArguments указывает на wrapper shell, который export'ит keys из Keychain или /etc/secrets/agent.env (chmod 600), затем exec codex/opencode. StandardErrorPath и StandardOutPath — в /var/log/agent/ с logrotate. Without logs you're debugging blind when OAuth silently expires.
6. Экономия токенов и failover до 18 июня
Free tier не прощает lazy prompts. Один файл за request; Flash first; запрет /init full-repo в team policy. Оставшиеся дни Gemini OAuth — sandbox для prompt templates, которые потом поедут на Bailian/SiliconFlow с тем же AGENTS.md — только другой base_url.
Failover layers: (A) provider chain в OpenCode JSON, (B) второй remote Mac cold config, (C) versioned prompts в git. Monthly reset — Copilot/Cursor; permanent burn — CN signup credits (пополнение optional).
Даже если compliance пока разрешает CN API только на public forks — зарегистрируй Bailian и Zhipu сейчас и прогони hello-world. Cutover 18 июня не waits for your legal team forever.
Для SFTP-синка держите отдельный unix-user с chroot на project root: agent пишет только в /workspace, ваш laptop тянет diff через rsync -avz --delete после review. Так free CLI не получает write access на всю home directory — базовый hygiene, который многие пропускают в погоне за «бесплатными токенами».
7. FAQ
После 18 июня Gemini CLI? Antigravity CLI или OpenCode + backup API. Все launchd jobs с hardcoded gemini-cli path — migrate до deadline, иначе silent fail.
SiliconFlow для client code? Threat model: PII in comments = data in PRC. Open source / synthetic — ok; regulated — legal first.
Gemini CLI vs Codex CLI? До 18.06: volume на Gemini, sandbox ops на Codex. После: Codex + OpenCode failover. IDE layer: Cursor или Copilot.
Зачем remote Mac, не VPS? Seatbelt, launchd maturity, unified memory Apple Silicon, predictable OAuth — меньше 3am pages. См. также CLI рейтинг — top tools biased к macOS.
Copilot Free vs Cursor Hobby? Copilot глубже в GitHub PR flow; Cursor — agent mode и .cursorrules. Для open source maintainer часто достаточно обоих free tier'ов на разных repo; не смешивайте keys в одном workspace без .gitignore на agent artifacts и log dumps.
Можно ли только OpenCode без Gemini? Да, особенно после 18.06. Gemini до cutoff — бесплатный load test для prompt engineering; OpenCode — long-term shell. Два инструмента, один remote Mac, разные config dirs — zero conflict, zero port collision.
8. Итог: free tokens — топливо, remote Mac — двигатель
2026 даёт аномально щедрые free coding quotas — но RPM, routing и uptime решают, увидишь ты merge request или только 429 в log'е. Ноутбук в sleep и und tested failover — классические self-inflicted outages. Выжми Gemini CLI до 18 июня, подними CN backup, закрепи agents на always-on Apple Silicon — и zero-yuan stack начнёт отдавать measurable throughput.
Migration checklist на одну страницу: (1) export prompt templates и AGENTS.md, (2) duplicate config.toml с новым base_url, (3) dry-run на fork, (4) switch launchd ProgramArguments, (5) monitor logs 24h. Без checklist команда неизбежно вернётся к «работало вчера на ноутбуке» — и потеряет ещё одну неделю на повторную OAuth-магию.
SFTPMAC аренда remote Mac — ноды 7×24 под OpenClaw, Codex, Gemini CLI, OpenCode: launchd guardians, SFTP/rsync rollback workspace'ов, OAuth callback без NAT pain. Меньше «домашний Mac как server», больше predicable agent ops для тех, кто считает tokens и uptime, а не stars на GitHub.