SERVICE

システム開発サービス

AI導入・開発

2.3プライベートLLM構築・運用支援（準備中）

サービス概要

機密データを外部APIに送信せず、完全に社内環境で動作するLLMシステムを設計から実装、運用まで一貫してお届けする、エンジニアリング特化型サービスです。豊富な開発実績と高い技術力で、確実に動作するシステムを構築します。

このような課題を解決します

ChatGPTは便利だが、機密情報を外部に送信してはいけない
社内にAI環境を構築したいが、技術的なハードルが高い
既存SSO、権限制御、監査ログと連携したセキュアな運用をしたい
文書・ナレッジを活かすRAG基盤を導入したい
既存システムとLLMを連携させたい

提供サービス内容

1. 技術選定・環境構築

モデル選定支援: gpt-oss、DeepSeek R1、Qwen 3、Gemma 3、Llama 3、ELYZA、Swallow等から最適なモデルを選定
推論サーバー構築: vLLM、TGI、Ollama等を用いた高速推論環境の実装
GPU環境最適化: NVIDIA A100/H100等のGPU設定とCUDA環境構築
量子化対応: GPTQ、AWQ、GGUF形式での軽量化実装

2. システム実装

API開発: OpenAI互換APIサーバーの構築
RAGシステム実装: 社内文書検索と連携したLLMシステム開発
Fine-tuning環境構築: LoRA、QLoRAを用いた追加学習環境の実装
既存システム連携: REST API、gRPCでの既存業務システムとの接続

3. 運用・保守支援

監視システム構築: Prometheus、Grafanaによるパフォーマンス監視
ログ収集・分析: プロンプトログの収集と利用状況分析
バックアップ・リカバリ: モデルファイルとシステムのバックアップ体制構築
セキュリティ対策: アクセス制御、監査ログ、データ暗号化の実装

4. 運用・保守支援

要件定義書:
- 機能要件、非機能要件（SLO: レイテンシ・可用性・スループット）、セキュリティ・運用要件の明文化
基本設計書、詳細設計書:
- アーキテクチャ、データ・権限設計、RAG設計、監視・バックアップ、リリース方針
プログラム等一式:
- 前行程によって開発対象は変わるが、例えば、RAGパイプラインの処理や、Web UI、監視用ダッシュボードなどに関するプログラムなど
テスト報告書:
- テスト報告書、評価スイート（用途別テストケース一式）
運用マニュアル:
- 管理者ガイド、開発者ガイド、ユーザーガイド、障害対応手順など

技術スタック

フレームワーク: LangChain、LlamaIndex、Transformers
ベクトルDB: Qdrant、Milvus、Weaviate、ChromaDB、pgvector
インフラ: Docker、Kubernetes、NVIDIA Triton
開発言語: Python、TypeScript、Go

料金体系

初期構築: 300〜800万円（2〜4ヶ月）
運用保守: 月額20〜50万円
スポット対応: 80〜120万円/人月

なぜAltus-Fiveなのか

実装力: 「できない」と言われた技術課題も実現してきた実績
現場経験: SI事業で培った、実運用を考慮したシステム設計
柔軟な対応: お客様の環境・要件に合わせたカスタマイズ実装
継続的サポート: 構築後の運用支援、性能改善まで伴走