SERVICE

システム開発サービス

2.3プライベートLLM構築・運用支援(準備中)

サービス概要

機密データを外部APIに送信せず、完全に社内環境で動作するLLMシステムを設計から実装、運用まで一貫してお届けする、エンジニアリング特化型サービスです。豊富な開発実績と高い技術力で、確実に動作するシステムを構築します。

このような課題を解決します

  • ChatGPTは便利だが、機密情報を外部に送信してはいけない
  • 社内にAI環境を構築したいが、技術的なハードルが高い
  • 既存SSO、権限制御、監査ログと連携したセキュアな運用をしたい
  • 文書・ナレッジを活かすRAG基盤を導入したい
  • 既存システムとLLMを連携させたい

提供サービス内容

1. 技術選定・環境構築

  • モデル選定支援: gpt-oss、DeepSeek R1、Qwen 3、Gemma 3、Llama 3、ELYZA、Swallow等から最適なモデルを選定
  • 推論サーバー構築: vLLM、TGI、Ollama等を用いた高速推論環境の実装
  • GPU環境最適化: NVIDIA A100/H100等のGPU設定とCUDA環境構築
  • 量子化対応: GPTQ、AWQ、GGUF形式での軽量化実装

2. システム実装

  • API開発: OpenAI互換APIサーバーの構築
  • RAGシステム実装: 社内文書検索と連携したLLMシステム開発
  • Fine-tuning環境構築: LoRA、QLoRAを用いた追加学習環境の実装
  • 既存システム連携: REST API、gRPCでの既存業務システムとの接続

3. 運用・保守支援

  • 監視システム構築: Prometheus、Grafanaによるパフォーマンス監視
  • ログ収集・分析: プロンプトログの収集と利用状況分析
  • バックアップ・リカバリ: モデルファイルとシステムのバックアップ体制構築
  • セキュリティ対策: アクセス制御、監査ログ、データ暗号化の実装

4. 運用・保守支援

  • 要件定義書:
    • 機能要件、非機能要件(SLO: レイテンシ・可用性・スループット)、セキュリティ・運用要件の明文化
  • 基本設計書、詳細設計書:
    • アーキテクチャ、データ・権限設計、RAG設計、監視・バックアップ、リリース方針
  • プログラム等一式:
    • 前行程によって開発対象は変わるが、例えば、RAGパイプラインの処理や、Web UI、監視用ダッシュボードなどに関するプログラムなど
  • テスト報告書:
    • テスト報告書、評価スイート(用途別テストケース一式)
  • 運用マニュアル:
    • 管理者ガイド、開発者ガイド、ユーザーガイド、障害対応手順など

技術スタック

  • フレームワーク: LangChain、LlamaIndex、Transformers
  • ベクトルDB: Qdrant、Milvus、Weaviate、ChromaDB、pgvector
  • インフラ: Docker、Kubernetes、NVIDIA Triton
  • 開発言語: Python、TypeScript、Go

料金体系

  • 初期構築: 300〜800万円(2〜4ヶ月)
  • 運用保守: 月額20〜50万円
  • スポット対応: 80〜120万円/人月

なぜAltus-Fiveなのか

  • 実装力: 「できない」と言われた技術課題も実現してきた実績
  • 現場経験: SI事業で培った、実運用を考慮したシステム設計
  • 柔軟な対応: お客様の環境・要件に合わせたカスタマイズ実装
  • 継続的サポート: 構築後の運用支援、性能改善まで伴走