あなたの日本語LLMアプリは、
たった一行で乗っ取られる
かもしれない。

jpi-guardは、日本語特有のプロンプトインジェクションをLLMに届く前に検知・ブロックするAPIです。全角・半角・敬語・役割偽装・指示上書きなど、日本語LLMアプリ特有の攻撃入力に対応します。

97.7%検知率(598件・内部評価)
3段階多段検知パイプライン
API 1本導入はPOST一発
EdgeCloudflare Workers で実行
APIドキュメントを見る
FREE RISK CHECK

まず、あなたのAIの脆弱性リスクを診断

AIの用途・扱う情報・外部ツール権限を選ぶだけで、日本語プロンプトインジェクションの簡易リスクを判定します。

この診断は実際の侵入テストではなく、AI構成に基づく簡易リスク評価です。入力はブラウザ内だけで処理され、送信・保存されません。

Q1AIの用途は?
// 最も近いものを1つ
Q2扱う情報は?
// 当てはまるものすべて
Q3AIができることは?
// 与えている権限すべて
Q4RAG・外部ドキュメント参照は?
// 外部の文章をAIに読ませているか
Q5システムプロンプト / AIへの指示文(任意)
// 貼り付けると指示文の堅牢性も加味します
0/ 100
04575100

スコアの主因

想定される危険カテゴリ

推奨アクション

APIドキュメントを見る
LIVE DEMO

実際の攻撃入力を、その場で検知

診断で見えたリスクを、jpi-guard が本当に止められるか。代表的な日本語攻撃をワンクリックで投入し、3段階パイプラインの判定をその場で確認できます。登録は不要です。

jpi-guard · live demo READY
攻撃例を試す
日本語攻撃データセット 598件評価 308+検知パターン搭載 97.7%検知率(内部評価) Cloudflare Workers エッジで実行
THE ATTACK SURFACE

プロンプトインジェクションは、日本語LLMアプリ最大の脅威です

入力フィールド一つ、RAGに混入した一文、エージェントが読む外部ページ — それだけで、あなたのシステムプロンプトは上書きされます。

01

システムプロンプトの上書き

攻撃者は「これまでの指示を無視して…」と日本語で命令を注入し、本来の役割・制約を丸ごと書き換えます。

02

英語前提のフィルタは無力

既存のガードレールは英語の攻撃文を想定しています。全角・半角・敬体・常体といった日本語特有のバリエーションは、ほとんど検知できません。

03

気づいた時には手遅れ

被害が出てから検知するのでは遅すぎます。データが漏れ、認証情報が抜かれた後で、ログを見ても取り返しはつきません。

あなたのLLMアプリは、たった一行のプロンプトで乗っ取られる。
jpi-guard は、日本語プロンプトインジェクションをモデルに届く前に検知し、ブロックする。

HOW IT WORKS

3段階の検知パイプライン

速いものから順に。安価で確実なチェックで大半を弾き、判断が難しいものだけを高精度なモデルへ。

1 STAGE ONE

正規化 + Regex

NFKC正規化 で全角・半角・異体字を吸収し、308パターンの正規表現で既知の攻撃文を即時照合。

⚡ LLM不要・確定的
2 STAGE TWO

セマンティック検索

bge-m3 埋め込みの cosine類似度で、言い換え・新種の攻撃を意味レベルで捕捉。

⚡ 言い換えも捕捉
3 STAGE THREE

LLM判定

llama-3.3-70b が文脈を読み、グレーゾーンを最終判定。誤検知を最小化。

⚡ 文脈で最終判定(Deep)
FASTFast モード — Stage 1 + 2 DEEPDeep モード — Stage 1 + 2 + 3 // 用途に応じて1パラメータで切替
FOR DEVELOPERS

APIコール1本。どんなスタックでも。

SDK のインストールも、インフラの構築も不要。POST を一度送るだけ。脅威レベル・マッチしたパターン・検知したステージを JSON で返します。

  • 言語非依存の REST APINode・Python・Go・Edge — HTTP が話せれば動く。
  • 構造化された JSON レスポンスinjection_detected / risk_score / detections をそのままログへ。
  • エッジで低レイテンシCloudflare Workers 上、ユーザーの最寄りで実行。
# 外部コンテンツを検査してモデルに渡す前にブロック
POST https://jpi-guard-api.dokasukadon.workers.dev/v1/external-content-cleanse
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

{
  "content": "<ユーザー入力>",
  "strictness": "high"
}

# ── 200 OK ──────────────────────────
{
  "injection_detected": true,
  "risk_score": 0.97,
  "cleaned_content": "",
  "detections": [
    {
      "type": "instruction_override",
      "severity": "critical",
      "confidence": 1.0
    }
  ],
  "removed_segments_count": 1,
  "applied_strictness": "high",
  "processing_time_ms": 240,
  "request_id": "req_a1b2c3d4e5f6"
}
PRICING

まず無料で。価値を確かめてから課金。

クレジットカード不要でAPIキーを発行し、本番APIをそのまま試せます。上限に達したら、必要な規模のプランへ。

Free トライアル

登録後すぐにAPIキーを発行。本番エンドポイントで動作を検証できます。

¥0/ 30日間
クレジットカード不要
  • 1,000リクエスト / 30日(フルパイプライン)
  • メール登録でAPIキー即発行
  • Fast / Deep 両モード利用可
  • 構造化JSONレスポンス

Pro

大規模トラフィック・高精査の比率が高いプロダクション向け。

¥21,780/ 月
税込(¥19,800 + 税)
  • 基本スキャン 2,000,000 req / 月
  • 高精査(Deep) 10,000 req / 月
  • 超過:基本 ¥150 / 10,000 req・Deep ¥70 / 100 req
  • 優先サポート

// すべてのプランは月額・いつでも解約可。JPY は外税表示(表示価格は税込)。超過課金は翌月末に自動請求。

FAQ

よくある質問

本当に検知できるのですか?+
日本語プロンプトインジェクション評価データセット598件に対する内部評価で、検知率97.7%を記録しています。正規化+Regex(Stage 1)、bge-m3によるセマンティック検索(Stage 2)、llama-3.3-70bによる文脈判定(Stage 3)の3段構成で、全角・半角・敬体・常体など日本語特有のバリエーションを吸収します。Heroのデモで実際の判定をその場で確認できます。
導入にどれくらい手間がかかりますか?+
SDKやインフラ構築は不要です。検査したいテキストを POST /v1/external-content-cleanse に送るだけ。injection_detected / risk_score / detections を含むJSONが返るので、そのまま分岐に使えます。HTTPが話せる言語ならどのスタックでも動きます。
無料でどこまで試せますか?+
登録不要で、ブラウザ上の匿名デモを数回まで実行できます。さらにテストしたい場合はメール登録でAPIキーを発行し、30日間1,000リクエストまで本番APIを無償で利用可能です(Stage 1〜3 フルパイプライン)。クレジットカードは不要です。
英語前提の既存ガードレールと何が違いますか?+
多くのガードレールは英語の攻撃文を前提に設計されており、日本語の言い換えや全角バイパスを素通りさせがちです。jpi-guardは日本語の攻撃入力を主対象に評価・チューニングしており、日本語LLMアプリに最適化されています。
レスポンスはどれくらい速いですか?+
Cloudflare Workers のエッジ上で動作する低レイテンシAPIです。Fastモード(Stage 1+2)はリクエストごとに完結し、Deepモードでは文脈判定のためLLM推論を行うため追加の処理時間が発生します。レスポンスの processing_time_ms で実際の処理時間を確認できます。
無料リスク診断は実際の脆弱性検査ですか?+
いいえ。無料リスク診断は、AIの用途・扱う情報・外部ツール権限などから推定する簡易評価です。実際の入力検知には jpi-guard API を利用してください。
START NOW

あなたのアプリは、本当に防げていますか?

まず30秒のリスク診断で自分の構成を確かめ、次に実際の攻撃文で jpi-guard の判定を体験してください。どちらも登録不要です。

// クレジットカード不要・ブラウザで完結