jpi-guardは、日本語特有のプロンプトインジェクションをLLMに届く前に検知・ブロックするAPIです。全角・半角・敬語・役割偽装・指示上書きなど、日本語LLMアプリ特有の攻撃入力に対応します。
AIの用途・扱う情報・外部ツール権限を選ぶだけで、日本語プロンプトインジェクションの簡易リスクを判定します。
この診断は実際の侵入テストではなく、AI構成に基づく簡易リスク評価です。入力はブラウザ内だけで処理され、送信・保存されません。
診断で見えたリスクを、jpi-guard が本当に止められるか。代表的な日本語攻撃をワンクリックで投入し、3段階パイプラインの判定をその場で確認できます。登録は不要です。
入力フィールド一つ、RAGに混入した一文、エージェントが読む外部ページ — それだけで、あなたのシステムプロンプトは上書きされます。
攻撃者は「これまでの指示を無視して…」と日本語で命令を注入し、本来の役割・制約を丸ごと書き換えます。
既存のガードレールは英語の攻撃文を想定しています。全角・半角・敬体・常体といった日本語特有のバリエーションは、ほとんど検知できません。
被害が出てから検知するのでは遅すぎます。データが漏れ、認証情報が抜かれた後で、ログを見ても取り返しはつきません。
あなたのLLMアプリは、たった一行のプロンプトで乗っ取られる。
jpi-guard は、日本語プロンプトインジェクションをモデルに届く前に検知し、ブロックする。
速いものから順に。安価で確実なチェックで大半を弾き、判断が難しいものだけを高精度なモデルへ。
NFKC正規化 で全角・半角・異体字を吸収し、308パターンの正規表現で既知の攻撃文を即時照合。
⚡ LLM不要・確定的bge-m3 埋め込みの cosine類似度で、言い換え・新種の攻撃を意味レベルで捕捉。
⚡ 言い換えも捕捉llama-3.3-70b が文脈を読み、グレーゾーンを最終判定。誤検知を最小化。
⚡ 文脈で最終判定(Deep)SDK のインストールも、インフラの構築も不要。POST を一度送るだけ。脅威レベル・マッチしたパターン・検知したステージを JSON で返します。
# 外部コンテンツを検査してモデルに渡す前にブロック
POST https://jpi-guard-api.dokasukadon.workers.dev/v1/external-content-cleanse
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json
{
"content": "<ユーザー入力>",
"strictness": "high"
}
# ── 200 OK ──────────────────────────
{
"injection_detected": true,
"risk_score": 0.97,
"cleaned_content": "",
"detections": [
{
"type": "instruction_override",
"severity": "critical",
"confidence": 1.0
}
],
"removed_segments_count": 1,
"applied_strictness": "high",
"processing_time_ms": 240,
"request_id": "req_a1b2c3d4e5f6"
}
# 外部コンテンツを検査し、危険なら遮断する
import requests
r = requests.post(
"https://jpi-guard-api.dokasukadon.workers.dev/v1/external-content-cleanse",
headers={"Authorization": "Bearer YOUR_API_KEY"},
json={"content": user_input, "strictness": "high"},
)
data = r.json()
if data["injection_detected"]:
raise ValueError("prompt injection blocked")
// 外部コンテンツを検査し、危険なら遮断する
const res = await fetch(
"https://jpi-guard-api.dokasukadon.workers.dev/v1/external-content-cleanse",
{
method: "POST",
headers: {
Authorization: "Bearer YOUR_API_KEY",
"Content-Type": "application/json",
},
body: JSON.stringify({ content: userInput, strictness: "high" }),
},
);
const data = await res.json();
if (data.injection_detected) throw new Error("prompt injection blocked");
クレジットカード不要でAPIキーを発行し、本番APIをそのまま試せます。上限に達したら、必要な規模のプランへ。
登録後すぐにAPIキーを発行。本番エンドポイントで動作を検証できます。
本番運用を始めるチーム向け。中規模トラフィックを安定してカバー。
大規模トラフィック・高精査の比率が高いプロダクション向け。
// すべてのプランは月額・いつでも解約可。JPY は外税表示(表示価格は税込)。超過課金は翌月末に自動請求。
POST /v1/external-content-cleanse に送るだけ。injection_detected / risk_score / detections を含むJSONが返るので、そのまま分岐に使えます。HTTPが話せる言語ならどのスタックでも動きます。processing_time_ms で実際の処理時間を確認できます。まず30秒のリスク診断で自分の構成を確かめ、次に実際の攻撃文で jpi-guard の判定を体験してください。どちらも登録不要です。
// クレジットカード不要・ブラウザで完結