Logo loFT LLC

    • Webサイトリニューアルのお知らせ
    • 子会社 Lorchestra株式会社 吸収合併のお知らせ
    • IT導入支援事業者に採択(2022年度)
    • IT導入支援事業者に採択(2021年度)
    • 子会社 Lorchestra株式会社 設立のお知らせ
    • IT導入支援事業者に採択(2020年度)
    • loFT合同会社 設立
      • Dagster + NATS JetStream イベントパイプラインの実装詳解
      • homelab インフラ再設計 -- PostgreSQL の storage/compute 分離と devstack 整備
      • 3ホスト基盤の再設計:Promtail 廃止から devstack 分割・config 一本化まで
      • devstack への MLflow 統合——Dagster と実験トラッキングの責務分離
      • rootless Quadlet で PostgreSQL 18 と pgvector を安定運用する構成メモ
      • AMD EPYC 9175F (Turin) 搭載ワークステーション「HPCT WCE51-GP」の構成検討
      • データ基盤のI/Oを最適化する:NVMe/SATAの使い分けとUIデモンの集約戦略
      • 内部インフラ向けQuteBrowser設定の最適化
      • CRS304でローカル10GbEと段階的な外部通信制御を両立する
      • MikroTik RouterOSのNetwatchを活用した状態連動型Syslog監視
      • Rootless Podman + Quadlet によるコンテナ運用基盤の構築: UID マッピング・権限設計・macOS DNS 問題の解決
      • Storage Server の常時稼働監視基盤: Prometheus・Loki・Promtail と Quadlet による構築記録
      • rootful / rootless をまたぐ exporter 運用を整理して smartctl-exporter を安定化した
      • EPYC 9175F + Podman によるローカル開発基盤の設計と構築
      • 最小構成UbuntuでQuadletを使った常駐サービス運用の実践メモ
      • EPYC単機でELTを安定運用するために整理したメモリ循環設計
      • tar.zstとrcloneでCompute Serverを20-30分で戻せる形にした
      • ローカルLLM基盤のコンテナ構成: vLLM/llama.cppとRust Proxyを連携するDocker Compose
      • Hugging Faceモデルをcoldからhotへ安全に移すときのrcloneとrsyncの分け方
      • Rust (axum) で OpenAI 互換プロキシを設計・実装した経緯と Go 移行に至るまで
      • Go + NATS + Dagster によるAIオーケストレーション基盤:設計思想からミドルウェア選定まで
      • familiar - ローカルLLMだけで動くマルチエージェント開発基盤を作った話
      • llm-jp-4-32b-a3b-base-NVFP4を翻訳運用で評価し、常駐translatorをやめてオンデマンドバッチへ切り替えた
      • 自作ハーネス familiar の検証: クラウドエージェント orchestrator と Qwen3-Coder-Next 80B / GLM-5.1 による実地観測
      • agent-gateway 構築記 -- Phase 1 リアルタイム知識パイプラインと埋め込みサービスの統合
      • Gemma 4 + Blackwell 2枚で組む familiar 推論スタックと model-foundry パイプライン
      • agent-gateway 全レイヤーリファクタリング — Clean Architecture 適用と Conflict 解消
      • agent-gateway v3 リデザイン — knowledge ドメイン分割と MLflow/Obsidian 統合
      • Rust + ONNX で embedding / rerank API を分離して組む設計を固めた
      • WordPressライクなDjangoブログ基盤をどう設計するかを整理した
      • Qwen3.5-122B-A10B ローカル推論による Django 5 旅行予約サイト生成テスト
      • Step-3.7-Flash-NVFP4をローカルのオーケストレータに: マルチエージェントでシステム開発
      • Gemma 4 31BをvLLM/SGLangで実測: NVFP4/FP8、MTP比較
      • MiMo V2.5 Pro IQ2_Sをローカルで動かす: RTX PRO 6000 Blackwell x1/x2 ベンチマーク
      • DwarfStar4 RTX PRO 6000 Blackwell: DeepSeek V4 Flash Q2 First Look 43 tok/s
      • Qwen3.6-27B NVFP4+MTPをvLLMで実測:RTX PRO 6000 Blackwell Max-Q x 2でTG ~190tok/s
      • DeepSeek-V4-Flash を llama.cpp WIP ブランチで動かす: Blackwell Max-Q 96GB x2 の初回ローカル推論
      • Qwen3.6-27B-FP8: ロール別ファインチューニング戦略と自作エージェントスタックへの統合
      • Kimi-K2.6 をローカルで実行: ik_llama.cpp と Blackwell で 1T MoE を実用化する
      • LLM-jp-4-32B-NVFP4 x CAT-Translate-7B-NVFP4で日本語データ生成パイプラインを検証する
      • GLM-5.1 IQ3_KS をローカルで動かす: CPU/GPU Hybrid 推論と expert layer 配置
      • MiniMax-M2.7 (229B MoE) を 2x Blackwell 96GB で回す: 平均71.9 t/s、ただし商用利用不可
      • Qwen3.5-397B-A17B 検証:Blackwell 96GB×2 で 55 t/s と 262k tool-use ループを実用運用する
      • GLM-5.1 + Qwen3-Coder-Next 構成最適化: orchestrator TG 実測と最終レイアウト設計
      • Dagster 会話リネージュ・評価・データセット生成システムの設計と実装
      • Qwen3.5のコーディング能力を静的デンタルクリニックサイトで評価する
      • GPUとCPUを分業させるローカルLLM構成の計画と、現実の試行錯誤
      • PLAMO-translate AI MODEL 向け日英双方向 system prompt の設計
      • LTX-2 動画生成プロンプトエンジニアリング:ホラー36シーンからシネマティック連続パイプラインまで
      • Hermes-4.3-36Bの量子化を比べて、常用モデルをどう決めるか
      • 40B Denseモデルの現実:IQuest-Coder-V1-40BをCPU/GPU/Aiderで回して分かったこと
      • Command-A Reasoning 08-2025 を Aider のコーディングループに入れて見えたこと
      • Serena MCPでローカルAIコーディング環境を組み直す構想
      • GLM-4.7-Flash Uncensored を試して見えた、使える場面と危ない場面
      • IQuest-Coder Loop-Instruct が aider で遅く感じる理由
      • Zedでは詰まり、VSCode Remote SSHでは通ったMCP運用の整理
      • なぜEPYC 9175Fの512MB L3キャッシュはMoE推論に効くのか:1Tモデル実測による仮説検証
      • MiniMax-2.5 (229B MoE) Expert Offload 運用と Web 生成検証:IQ5_K から IQ3_S まで
      • Qwen3.5-397B IQ4_NL実測:28回のランで平均22.5tok/s、ハイブリッドオフロード構成と400B級MoEの常用可能性
      • Llama-4-Scout-17B-16E実測:CPU Q6_K 17tok/s vs GPU nvfp4 60tok/s、キャッシュ戦略と100kコンテキスト境界
      • 1T級MoE Kimi-K2.5のCPU推論実測:スレッド最適化からLong Context運用設計まで
      • Llama-4-Maverick-17B-128E CPU推論:Q4_K_M vs Q8_0の速度・品質トレードオフ実測
      • Qwen3-Coder-Next 80Bを3モードで回す:BF16 CPU / IQ4_NL Hybrid / nvfp4 GPU実測比較
      • GLM-4.7-Flash IQ5_K ベンチマーク:CPU/Hybrid/Full GPUの3パターン実測比較
      • なぜDeepSeek-V3.2はKimi-K2.5より遅く見えるのか:プロンプトキャッシュ不一致とTGボトルネックの解析
      • Qwen3.5-397B 自律コード生成検証:歯科医院サイトから Django CMS 基盤まで
      • shelpa-mcp: ボツになった仮想パイプラインの設計記録
      • shelpa: ボツになったサンドボックスMCPの設計と教訓
      • voracle 開発記 vol.2 — research パイプラインの実戦投入と ONNX 推論エンジン刷新
      • 全部 Rust、全部自作 -- homelab MCP ツールチェーン 9本の設計と目的
      • shelpaからfilesystemへ — Rust MCPファイルシステムサーバーの全面再設計
      • voracle — Obsidian vault 向けセマンティック検索 MCP/CLI ツールの設計と実装
      • aichat の function calling ハングを symlink 環境で解消した記録
      • レスポンス語彙の設計で小規模 LLM の精度が 15 点変わる: pathfinder での実験記録
      • ローカル LLM の tool_call 失敗を減らすために MCP サーバーを自作した: pathfinder の設計と検証
      • よく使う言語だけ AST ベースでコードベース解析器を自作した: ctree の設計と pathfinder/Serena 連携
  • 新着ノート一覧
  • プロフィール
  • 写真
    Logo
    ご相談はこちらから
      • English
    • 移動
    • 選択
    • 閉じる
      • Home
      • 開発ノート
      • インフラストラクチャ
      On this page

      インフラストラクチャ

      サーバーハードウェア、ネットワーク構成、コンテナオーケストレーション、監視スタックに関するドキュメント。

      技術メモとして残していた ObsidianノートにAIの要約を利用しています。

      Dagster + NATS JetStream イベントパイプラインの実装詳解

      agent-gateway から fire-and-forget で publish されたイベントを Dagster sensor が pull subscribe し、asset …

      homelab インフラ再設計 -- PostgreSQL の storage/compute 分離と devstack 整備

      homelab 3台構成で PostgreSQL を on-demand GPU box から 24/7 Mac Mini に移行した設計判断の記録。pgvector 統合維持の判断、devstack …

      3ホスト基盤の再設計:Promtail 廃止から devstack 分割・config 一本化まで

      storage / desktop / compute の3台構成ホームラボで、Promtail → Vector 移行、devstack のホスト単位分割、Go config の …

      devstack への MLflow 統合——Dagster と実験トラッキングの責務分離

      agent-gateway の devstack に MLflow Tracking Server と MinIO を追加し、Dagster のオーケストレーション層と ML 実験トラッキング層を …

      rootless Quadlet で PostgreSQL 18 と pgvector を安定運用する構成メモ

      PostgreSQL 18をPodman + Quadletのrootless構成で動かし、LLVM JITとpgvectorを有効にしたうえで、設定・データ配置・起動管理・トラブルシュートまで一本に …

      AMD EPYC 9175F (Turin) 搭載ワークステーション「HPCT WCE51-GP」の構成検討

      AMD EPYC 9175F(Turin世代)搭載のHPCT WCE51-GPワークステーションについて、CPU・メモリ・拡張性・管理機能の観点から構成を検討した記録。

      データ基盤のI/Oを最適化する:NVMe/SATAの使い分けとUIデモンの集約戦略

      NVMe SSDとSATA SSDのI/O特性に基づくストレージ配置ポリシーと、管理UIを別ホストに集約する戦略についてまとめた。

      内部インフラ向けQuteBrowser設定の最適化

      内部インフラ(.home.arpa)の監視ダッシュボードに効率よくアクセスするための、QuteBrowserの専用設定をまとめた。

      CRS304でローカル10GbEと段階的な外部通信制御を両立する

      MikroTik CRS304をRouterOS兼10GbEスイッチとして使い、VLAN分離・allowlistベースのegress制御・Prometheus/Loki監視を一台で実現する設計と構成。

      MikroTik RouterOSのNetwatchを活用した状態連動型Syslog監視

      MikroTik RouterOS上でNetwatchによるSyslogサーバーの死活監視と、5分カウンタのUDP送信/NAND退避を自動切替する仕組みを実装した記録。

      Rootless Podman + Quadlet によるコンテナ運用基盤の構築: UID マッピング・権限設計・macOS DNS 問題の解決

      Ubuntu 24.04のPodman 4.9.xでQuadletを用いたsystemdサービス化、Rootless環境のUIDマッピングと権限設計(Lokiの実例)、macOSでPodman …

      Storage Server の常時稼働監視基盤: Prometheus・Loki・Promtail と Quadlet による構築記録

      Mac mini (Ubuntu 24.04) を常時稼働の監視ノードとして構築し、Prometheus・Loki・Promtail・MKTXP を Quadlet で …

      rootful / rootless をまたぐ exporter 運用を整理して smartctl-exporter を安定化した

      監視 exporter の rootful/rootless 配置ルールを整理し、smartctl-exporter v0.14.0 の NVMe 対応と daemon-reload 忘れ防止を含む運 …

      EPYC 9175F + Podman によるローカル開発基盤の設計と構築

      EPYC 9175F + RTX PRO 6000 MAX-Q のCompute Server、Mac Studio、Storage Serverの3台構成でローカル開発基盤を設計・構築した全記録 …

      最小構成UbuntuでQuadletを使った常駐サービス運用の実践メモ

      Ubuntu 24.04 minimized を土台に、Quadlet と systemd で常駐サービスを管理するための実践的な構成メモ。ファイアウォール、監査、バックアップまでを最初から一貫した運 …

      EPYC単機でELTを安定運用するために整理したメモリ循環設計

      512GBメモリプールをステップごとに循環利用し、In-Memory/Arrow IPC/Parquetを切り替えるELT実行設計の整理。

      tar.zstとrcloneでCompute Serverを20-30分で戻せる形にした

      rootless Podman環境のcompute-serverを、ZFSを使わずext4/XFS + tar.zst + rcloneで20-30分で完全復旧できるバックアップ設計。

      ローカルLLM基盤のコンテナ構成: vLLM/llama.cppとRust Proxyを連携するDocker Compose

      vLLM、llama.cpp、Qdrant、PostgreSQLをrootless Podman上でセキュアに連携させるDocker Compose構成の設計と運用手順。

      Hugging Faceモデルをcoldからhotへ安全に移すときのrcloneとrsyncの分け方

      Hugging Face形式のモデルをcold/hot間で転送する際に、blobsはrclone、snapshots/refsはrsyncと道具を分ける手順の整理。


      © 2017-2026 loFT LLC